第一关
Token 实验室
选择一个前缀案例,先让 Token 飞进 AI 大脑,再猜它最可能选哪个片段。
进入 AI 大脑
先猜一下
你觉得 AI 最可能选哪个?
你刚刚看见了什么?
AI 先把一句话拆成很多小片段(Token)。然后根据前面的片段,猜测下一个最可能出现的片段。它不是在理解世界,而是在进行概率预测。
第二关
Memory 实验室
把信息塞进 3 个记忆槽,看看新信息如何把旧信息顶出去。
3 个记忆槽
AI 只能看见槽里的内容
你刚刚看见了什么?
AI 不是把所有聊天永远记住,而是只能在有限窗口里看见最近的信息。窗口满了,旧内容就会被挤出去。
第三关
RAG 资料库实验室
问题可以变化,但资料库保持不变。AI 会重新搜索同一批资料,找到对应内容后再回答。
问题
资料库检索
资料库卡片
生成回答
你刚刚看见了什么?
问题变了,资料库不需要跟着变。AI 会在同一个资料库里重新搜索,命中对应资料后再生成答案。这就是 RAG 的基本感觉。
第四关
AI为什么会胡说八道?
AI有时不是“不知道”,而是会一本正经地给出错误答案。
第1轮
明显幻觉
中国的首都是哪里?
你刚刚发现了什么?
AI不会天然判断真假。它只是预测下一个最可能出现的词。
当 AI 没有可靠依据时,它可能会自信地生成错误答案。
这就是:AI幻觉(Hallucination)
AI最危险的时候,不是沉默,而是自信地胡说八道。
第五关
Agent 实验室
普通 AI 只能给建议。Agent 会先规划步骤,再调用工具,把结果组合成行动方案。
选择工具
任务过程
你刚刚看见了什么?
AI 会回答问题。AI Agent 会先规划,再选择天气、地图、搜索等工具,拿到结果后继续完成任务。
第六关
训练AI怎么好好回答
AI会根据你的反馈调整回答概率。好的反馈让它更会回答,错误反馈也可能把它训练坏。
训练阶段 1 / 3
阶段1:支持性回应训练
让AI学习:遇到低落或自责时,先支持,再一起找补救办法。
我今天做砸了一件很重要的事。
如果你奖励了不好的回答,AI会以为这种回答更应该出现。
候选AI回复
把最佳回复训练到 70% 以上。
本轮总结
训练前后有什么不同?
那你也太不小心了吧。
先别急着否定自己,我们可以看看哪里出了问题,再想补救办法。
反馈改变了AI的回答倾向。被奖励的回答更容易再次出现,被惩罚的回答出现概率会降低。
你刚刚训练了AI
AI训练不是让AI突然拥有理解力。而是通过一次次反馈,不断调整回答出现的概率。好的反馈让AI更会回答。错误反馈也可能让AI学坏。所以:AI训练 = 反馈 + 概率调整。
恭喜你完成 AI 大脑实验室!
你已经看见了 AI 的基本运行过程。
你的学习成果
- TokenAI如何预测下一个词
- MemoryAI为什么会记住,也会忘记
- RAGAI如何查资料再回答
- 幻觉AI为什么会自信地说错
- AgentAI如何调用工具完成任务
- 训练AI如何通过反馈变得更会回答
最终结论
AI不是魔法。
它更像是:
共同组成的智能系统。
AI不是一个神秘黑盒。理解它的组成,就能更清楚地使用和判断它。