【学习的范式转变:AI时代的顶层学习法】
你接受的传统教育模式,本质上是为教师的便利而设计的,而非为学习者优化。这套体系可能让你浪费了数年时间。
AI已经彻底打破了学习的门槛。你不再需要“许可”去学习新领域,你需要的是“动机”和正确的方法。
+ 传统模式的根本问题
传统的自下而上学习法强迫你花费数月钻研那些你并不确定是否需要的基础知识。想学机器学习?先学数学。想学深度学习?先学Python。你必须在每一层“交够学费”才能进入下一层。
在学校里情况更糟。老师几乎不会解释为什么你要花整整一学期学某门课。很多时候这也怪不得他们,因为确实没有充分的理由。
这种模式存在的原因很简单:过去的学习资源默认你具备某种程度的前置知识。十年前你拿起一本深度学习的书,它假设你已经掌握了必要的数学和编程能力。作者不愿意从零开始讲起,所以学A之前必须先学B、C、D。
这是为教师的便利优化的,不是为学习者。
问题在于,自下而上的学习效率极低。你花了几个月甚至几年积累知识,却看不到明确的应用场景。等你终于接触到真正的问题时,你已经忘了一半。
+ 顶层学习法:从问题出发
与之相反的是自上而下的学习。你从一个真正感兴趣的实际问题开始,边做边学,撞墙了再去补相应的基础知识。
这种方法过去几乎不可能大规模实现。你需要一个专家随时在旁边指导你缺少哪些基础,告诉你该往哪个方向学习。学术界对此一直不太认可。
但现在,这个约束不存在了。
那个原本不存在的专家,现在每个人只需花20美元订阅ChatGPT或Claude就能获得。它虽然不完美,但已经足够好,足以从根本上改变谁能学什么、能学多快。
Gabriel Petersson就是一个活生生的例子。他是瑞典小镇的高中辍学生,想弄懂视频AI模型的工作原理。他让ChatGPT解释基础概念并写出扩散模型的代码,一开始完全看不懂,就不断追问:“这部分是做什么的?”“用12岁小孩能懂的话解释一下”“画个图给我看”。
他每天这样问上百次,递归式地填补知识空白。几年后,他被OpenAI录用参与Sora项目,做着传统上需要博士学位的工作。
+ 一项没人教你的元技能
顶层学习有一个前提:你必须能够识别自己什么时候不理解某个东西。
这听起来简单,其实不然。
面对陌生概念时,大多数人要么假装理解继续往下走,要么沮丧放弃。很少有人能坦然面对自己的困惑,搞清楚究竟是哪里不懂,然后提出精准的问题。
这就是“知道自己不知道什么”的元技能。困惑其实是一个信号,意味着你即将学到新东西。真正的顿悟只会在你直面不理解的不适感时发生。
+ 保持控制权
整个过程的核心是你必须保持主动权。你不需要另一个传统老师来决定你该学什么、怎么学、学到什么程度算够。
关键在于能够从AI那里提取你想要的东西。大多数人在这方面做得很糟糕。
AI天生倾向于迎合普通用户。如果你只是简单地问“用简单的话解释强化学习”,你得到的只是一段通用的教科书式回答。
你应该这样问:我想学强化学习。告诉我它为什么存在,解决什么问题,之前的替代方案是什么。我知道智能体通过行动获得奖励,但我不理解它具体是怎么学会哪些行动是好的。在连续的10个动作中,它怎么知道是哪个导致了奖励?用直觉化的方式讲解背后的数学,像对12岁孩子说话那样,并给我一个具体的例子。
精确、具体地表达你想要什么,不要把主动权交给别人。这是一项你会逐渐精进的技能。
+ 两种使用AI的模式
第一种是把AI当作劳动力替代品。“帮我写一篇文章”、“帮我做作业”、“帮我写代码”。短期看这或许有好处,但长期会削弱你的思考能力。把思考、困惑和脑力劳动都外包给AI,最终会让你的认知能力退化。
第二种是把AI当作学习导师。这才是产生超常结果的方式。这种模式的意义在于压缩从困惑到清晰的时间。
+ 递归下降学习法
具体框架如下:
第零步:理解为什么。在任何解释和定义之前,你必须真正理解所学内容的起源。它为什么存在?解决什么问题?实际用在哪里?之前的替代方案是什么?
第一步:从问题而非课程开始。不要问AI“学强化学习该学什么”,而是问“我可以用强化学习做什么项目?然后帮我写代码。”
第二步:让它运行起来。运行代码,观察结果,看可视化效果。如果是一个使用RL智能体的Python游戏,去玩它。
第三步:回讲(费曼技巧)。当你开始阅读代码并理解各个部分时,把你的理解解释给AI听,问它你的理解是否正确。这一步至关重要。
第四步:递归下降。在反复对话中完善理解后,问AI“这个概念依赖哪些基础知识?”然后对那些基础重复整个过程。
第五步:泛化。当你深入理解了某个东西,问“它还能解决哪些问题?有什么局限性?在情况X下我会怎么做?”这一步帮你填补空白。
+ 这个方法不能解决的问题
AI无法给你行动力。如果你需要有人拿着鞭子逼你学习,你需要解决的是比“如何学习”更根本的问题。
AI无法教你品味。知道如何构建一个RL智能体,和知道哪些问题值得解决、哪些方法是优雅的、哪些代码是可维护的,这是不同的事情。这些属于人类特有的判断力。
AI可能自信地犯错。所以你需要结合YouTube视频、论文、书籍、博客等人类创作的资源来验证和补充。
你仍然需要付出努力。跳过不必要的基础知识,不是为了少干活,而是为了把精力用在正确的地方。AI消除的是摩擦,不是工作本身。
+ 分化正在发生
我认为接下来五年会出现这样的分化:训练自己用递归下降方式学习的人,将成为唯一能够高效学习、跟上科技飞速发展步伐的群体。而坚持传统方法、拒绝与AI协作学习的人,会逐渐变得无关紧要。不是因为那些方法不管用,而是因为他们的速度无法与前者竞争。
x.com/Hesamation/status/2013044418228498468