- 数学家,是在发明数学还是发现数学规律?
- 数学规律为何存在?
- 数学规律是什么时候开始存在的?是宇宙大爆炸? 那又是谁创造了数学规律?
- 如果数学规律不存在,宇宙会怎么样?
- 人类所谓的物理学,是否会存在?
- 甚至,宇宙是否会存在?
- 数学的能力边界是什么?
- 数学能否包含人类所谓的智能? 是智能的范围更大还是数学更大?
- 如果是智能大,如何证明? -如果是数学大,那人活在数学范围内,那是不是可以由高级计算机(等价的数学计算器),可以模拟出一个完整的人类发展历史?在这个模拟中可以发现创造它的数学规律?
If your ego-to-ability ratio gets too high, then you’ve broken the feedback loop to reality. In AI terms, you’ll break your reinforcement learning loop.
— The Book of Elon by Eric Jorgenson
号称在多少天内实现某种编译器、并让测试用例全部通过;用这种方式做出来的程序也可能存在作弊。凡是试图用某种固定规则去评判多维度的事物,似乎都不可能完美,总会留下作弊空间。这道天花板真的无法突破吗?看来单元测试也未必靠谱,它也只是提升开发效率的小技巧之一。最终的“测试程序”仍然是人本身。
时隔十三年再次到访北京,空气依旧干燥,雾霾依旧,马路依旧宽阔。 我还是更喜欢南方。
大模型能够按指令实现某个功能,但它并不一定会以软件工程的最佳实践来设计与实现。这更多取决于使用者的认知水平,而这部分能力是大模型难以替代的。
在不同的认知水平下,当模型给出的方案与使用者的预期产生冲突或差异时,使用者就容易感到困惑:
- 如果使用者的软件功底不足,看到一大堆代码改动会感到恐慌,认为这是过度设计。
- 对于有经验、做过端到端软件交付的人来说,模型在某些地方又显得过于直白:在容错性、兼容性以及可观测性等方面的设计几乎为零。
总的来说,大模型是很好的加速器,但它并不能完全替代端到端的高质量功能交付。最终效果仍然取决于使用者,尤其取决于使用者的认知水平。
A simple and bold prediction: Every programmer will build their own IDE.
26 年版学习方法:
第一步:先建立对整体全貌及难易分布的感知。 第二步:根据需要,深入某个细节,对其进行深化与打磨。 第三步:再结合整体的知识结构,完成整合。
人脑能够基于既有知识进行灵活的动态调整,而模型在训练过程中,本质上只是一组固定参数的不断优化。
以目前的训练方式来看,模型尚不具备将已有知识真正融会贯通的能力,它更像是一种单向推进的过程。一旦参数被修改,后续便很难准确预测这种变化会对先前问题的表现造成怎样的影响。因此,模型只能小心翼翼地朝着稳定、可预期的方向调整参数。
当我们试图用规则对齐一个智能体时,就会遇到一个不可回避的问题,那就是 reward hacking。
现实世界中,有很多依靠规则来限制或规范人的场景。人作为智能体,天然倾向于利用规则;在这种情况下,reward hacking 的出现几乎是必然的。
对于大模型也是如此。当我们使用 RL(强化学习)时,很多情况下也是以规则的方式来约束它们。显然,这时就会像人类社会一样,出现 reward hacking,而这是一种自然结果。
这属于方法论层面的问题,而非技术实现层面的问题。