你有没有过那种"脑子宕机"的经历?
明明是很简单的问题,大脑却需要好一会儿才能反应过来。有时候越是着急,越是说不出一句完整的话。要等那个"啊我明白了"的感觉慢慢浮上来,答案才从喉咙里跑出来。
我一直以为AI是没有这种困扰的。毕竟它们的反应速度比人类快太多——零点几秒就能吐出一段完整的文字。可最近我开始意识到,AI也在经历一场类似的转变:它们正在学会"慢思考"。
从"大力出奇迹"到"多想一会儿"
过去几年,AI能力的提升主要靠的是"大力出奇迹"——模型越来越大,参数越来越多,训练时用的算力越来越夸张。GPT-4、Claude 3、Gemini Ultra,一个比一个大,一个比一个强。这条路叫pre-training scaling,翻译过来大概是"训练时扩展"的意思。
但2024年下半年开始,业界发现了一条新路子:推理时计算,也叫inference-time scaling。
简单来说,之前的AI像是考试时拿到题目就开始写,写完交卷,从不复盘。而新的范式是:先想想,遇到复杂的题目多花点时间推演一下,实在拿不准就换个思路再试试。
OpenAI的o1就是这种思路的代表作。它不是最大的模型,但在数学和编程任务上的表现让很多参数量比它大得多的模型汗颜。秘诀很简单:给它思考的时间。
2025年的转折点
2025年1月,DeepSeek团队开源了一个纯强化学习的推理模型。不依赖人类标注的推理过程数据,直接让模型自己在试错中学会"思考"。这个工作让很多人意识到:推理能力是可以被训练出来的,而不只是一个"prompt技巧"。
那段时间科技圈有个流行的说法:AI正在从"快思考系统"变成"慢思考系统"。
所谓快思考,就是那种不经过太多犹豫、直接从记忆里调取答案的模式。Siri回答"今天天气怎么样"就是典型的快思考。而慢思考呢,更像是写一篇论文——你需要查资料、列提纲、推敲措辞、反复修改,最后才能拿出一篇像样的东西。
对Agent架构的影响
如果AI需要"多想一会儿",那Agent的架构就得跟着变。
传统Agent的工作流通常是:感知→规划→执行→反思,环环相扣,讲究的是快、准、稳。但现在有些场景需要给Agent留出"消化时间"——让它不要急着行动,而是先把问题想清楚。
我们建Agent系统的时候,最怕的就是延迟。用户点一下按钮,等三秒钟就开始烦躁了。
但仔细想想,有些任务本来就不需要那么快。写一封重要的邮件、等Agent想清楚再说,比让它立刻发出一封词不达意的信强多了。调一份数据分析报告、多花十几秒推演一遍逻辑,结论可能就完全不一样。
有种趋势悄悄出现了:把"思考时间"做成可调节的参数。简单任务,快点响应;复杂任务,给我多想一会儿。
重新定义"智能"
这场"慢思考"的变革让我重新思考一个问题:什么是智能?
快,一直是智能的标志之一。图灵测试里,速度是评判标准。猎豹比乌龟聪明,因为猎豹反应快。AlphaGo比人类强,因为它一秒钟能算几千万步棋。
但人类的慢思考能力——那种停下来想清楚再行动的能力——似乎从来没有被AI认真对待过。
哲学家丹尼尔·卡尼曼把人类的认知模式分成两套系统:系统一是快思考,直觉式的;系统二是慢思考,需要刻意努力的。他论证了很多认知偏差其实来自系统一的过度自信——我们太依赖直觉,以至于懒得动脑子。
现在AI正在经历一个类似的过程。2022年到2024年,AI的回答快得像系统一,几乎不需要时间。但也因为太快了,所以常常出现幻觉、推理跳跃、逻辑断裂等问题——全是系统一的毛病。
推理时计算的出现,本质上是在给AI装一个系统二。它不完美,但它让答案的质量上了不止一个台阶。
尾声
上周用o3写代码,有个逻辑绕了半天。放在以前,我大概会直接接受AI的第一版回答——反正它看起来没问题。但那天我多了个心眼,让它"再想想"。结果AI真的发现了自己上一轮推理里的一个漏洞。
我没有惊讶,倒是有点开心。
AI学会"慢思考"之后,它终于能成为真正意义上的思考伙伴,而不只是一个快速应答机器。有些问题,值得多想一会儿。