机器思考的本质 / Gemini 的核心缔造者揭秘大语言模型推理的魔法与真相

- -

2025 年初的一个下午，斯坦福大学 CS25 课程迎来了一位特殊的演讲者 —— Google DeepMind 推理团队创始人 Denny Zhou（周登勇）. 面对座无虚席的教室，他抛出了一个看似简单却又深刻的问题：“大型语言模型（LLM）真的会推理吗. 台下的学生们大多举手表示相信，但 Denny 的回答却出人意料：“说实话，我不知道.

没有思考能力的机器

- knighter - Solidot

人工智能和认知科学领域的奠基者和重要人物纷纷表示，AI在过去几十年停滞不前，AI研究需要一次重启. Marvin Minsky说，为什么没有机器人能去修复日本的核反应堆. 原因是AI在60和70年代取得了很大的进步，但随后走上了错误道路. 今天的学生津津乐道于打篮球踢足球跳舞或搞笑的机器人，但是这些机器人并没有变聪明.

机器将如何帮助我们思考：IBM预测未来5年5大发明

- - PingWest

IBM首席创新官Bernard Meyerson日前发表一篇文章，介绍了IBM的“Next 5 in 5”项目对未来5年创新发明如何改变世界的预测，从5种感官维度分析新技术将如何越来越像人类的右脑. Bernard说，从上个世纪40年代的第一批电子计算机，到后来的大型机，个人电脑，互联网和社交网络，60多年间的计算革命是惊人的.

终极思考

- wei - 牛博国际

我的海淀剧院演讲门票放出后，八小时卖了四百多张，同事们说，日. 我淡淡地说，别这样，也许正是因为便宜才这么好卖嘛. 一转身我马上就打电话给老婆，操. 早知道就他妈把票价定高一点啦，真倒霉......干. 很大程度上，这可以解释两件事：1.为什么已婚事业男性的健康状况会相对好一些. 2.为什么在社会上受到尊重和认可的事业男性在老婆的眼里都是傻逼.

动车追尾的思考

- David Ruan - 扬韬

1、两列运行的动车追尾，绝对属于重特大责任事故. 雷电导致前车失灵，已经是责任事故了. 前车失灵，信号没有外发，又是责任事故. 调度体系没有发觉列车失灵，也是责任事故. 后车没有察知前车失灵，还是责任事故. 最后，后车发现问题，紧急制动系统有没有用也值得怀疑，因为后车司机据说是人工制动并殉职于岗位的.

重新思考电子书

- Alex - 爱范儿 · Beats of Bits

Hart，“古登堡计划”发起人，2011 年 9 月 6 日去世，享年 64 岁. 从 1971 年 Hart 制作第一本电子书，启动“古登堡计划”开始到 2011 年，Kindle、Nook 流行，正好经过 40 年. 如今电子书阅读器、电子书变得越来越流行，在北京的地铁上，你会经常看见低头拿着 Kindle、Nook、iPad、汉王的人们.

《系统思考》读后感

- 章明 - 所有文章 - UCD大社区

经别人推荐（都忘了是谁推荐的了~），买了这本《系统思考》，看完前几章，发现这是一本非常好的书. 全书的精华也都在前面几章，后面都是一些具体的案例分析. 为什么必须从整体研究系统. 将系统分块通畅破坏了你所试图研究的系统. 如果你破坏了系统内的连接，你就破坏了系统本身. 更奇妙的是，很多系统表现出他们的任何组成部分都不具备的特征.

Memcache架构新思考

- - ITeye博客

2011年初Marc Kwiatkowski通过Memecache@Facebook介绍了Facebook的Memcache架构，现在重新审视这个架构，仍有很多方面在业界保持先进性. 作为weibo内部数据处理量最大，对数据延迟最敏感的部门，基于本厂2年多来对mc的使用心得，我在本文总结对MC架构的一些新思考.

Google Reade关闭的思考

- - 猫星石 ~CafeNeko

关于google reader所引起的口诛笔伐已经看的足够多了，所以这里我并不想再去谈Google的这个决定正确与否. 我想说的是关于”后GR时代”的一些思考. 关于GR的好我已经听的太多，曾几何时我也是重度的GR脑残粉. 但是早在GR宣布准备关闭时，我一边看着GR里面永远也不会清空的条目，我就在想，我真的还是GR的脑残粉吗.

表单设计的思考

- - 腾讯ISUX - 社交用户体验设计 - Better Experience Through Design

我们几乎每天都会接触形形色色的表单，登录账号、填写信息以获取服务、发布内容等. 然而填写表单的过程往往不是特别愉悦的，我们需要消耗时间输入信息，点击提交，可能还需要等待审核；尤其是碰到较为复杂、流程长的表单，如果用户体验较差，很容易让人产生挫败感，在中途选择放弃. 那么，如何提高用户填写表单的效率，防止他们出错或中途流失，提升愉悦度及转化率呢.

机器思考的本质 / Gemini 的核心缔造者揭秘大语言模型推理的魔法与真相

01

重新定义推理 —— 从哲学回归工程

什么是 LLM 的“推理”？

末字母串联：一个看似简单的测试

02

理论的力量 —— 为什么中间步骤如此重要

从理论看推理的必要性

03

惊人的发现 —— 推理能力早已存在，只需"唤醒"

贪婪解码的局限

隐藏在概率空间中的推理路径

思维链解码：让推理浮出水面

04

从解码到提示 —— 重塑输出空间

思维链提示的本质

“让我们一步步思考”的魔力

05

监督微调的困境 —— 为什么人类数据不是最优解

SFT 的基本思路

现实的残酷

问题的根源："from human"

06

自我进化之路 —— RL 微调的革命性突破

从人类数据到模型数据

形成自我进化的闭环

回归机器学习第一性原理

验证器：进化的关键

07

推理之美 —— 超越搜索的智能

与传统 AI 的本质区别

震撼案例：Gemini 挑战数学难题

学习战胜硬编码

08

进阶技术 —— 聚合与检索的力量

聚合的数学原理：自洽性

自洽性的实践

检索的价值：当推理遇见知识

09

核心洞察与未来展望

未来的突破口在哪里？

最后的哲学

参考

引用链接

相关 [机器 思考 本质] 推荐：

相关文章

订阅

相关 [机器思考本质] 推荐：