在人工智能(AI)的这场、近乎于“失控”的、指数级“规模狂奔”之中,一个来自“风暴中心”的、最权威、也最令人警醒的声音,正试图,为整个行业,踩下一次紧急的、理性的“刹车”。
近日,被誉为“深度学习三巨头”之一、OpenAI的前首席科学家Ilya Sutskever,在他离开那家由他亲手缔造的AI帝国之后,首次系统性地,阐述了他所创办的全新实验室——SSI(Safe Superintelligence Inc.,安全超智能公司)——颠覆性的技术愿景。
这场访谈,其核心,是一次毫不留情的“自我批判”,与一次充满了“文艺复兴”色彩的“回归”宣言。
Ilya,以一种近乎于“罪人”的姿态,深刻地,剖析了当前AI行业,那个最核心、也最普遍的“原罪”:
我们的模型,正在成为一个“高分低能”的、“只会刷题的考试机器”。
而他,则以一种“先知”的姿态,为我们,指明了一条全新的、也可能是唯一的、通往真正“安全超智能”的道路:
“规模时代”,已经结束。未来的十年,AI,将回归“像人一样学习”的、最本质的路径。
这场“回归”的第一步,是对当前主流AI训练范式的一次彻底的“反思”。
Ilya指出,当前的大模型,虽然,在各种标准化的基准测试中,屡创佳绩。但一旦,将它们,部署到混乱的、充满了不确定性的真实世界中,便会立刻,“原形毕露”。
它们,会频繁地,陷入一种“循环错误”的怪圈——你修复了它的一个bug,它,却往往会,在另一个你意想不到的地方,衍生出一个全新的、更隐蔽的隐患。
这,并非简单的技术瑕疵。
其根源,在于训练范式的、根本性的缺陷。
Ilya,将AI的训练,拆解为了两大支柱:预训练(Pre-training)与强化学习(Reinforcement Learning)。
-
预训练,像是一场“无偏见的数据之浴”。模型,在其中,从海量的、未经筛选的互联网信息中,自然地,投影出我们人类世界的、一个完整的、全貌的认知地图。
-
而强化学习,则更像是一个由人类工程师,所精心设计的、充满了各种“奖励”与“惩罚”的“沙盒游戏”。其最终的目标,往往,并非是让AI,去真正地,理解世界;而是异化为了,如何,让它,在某个特定的评测指标上,“分数更好看”。
“这种不均衡,”Ilya直言,“正在让我们的AI,丧失其最宝贵的‘洞察力’和‘迁移能力’。强化学习,正在成为一把‘锦上添花的枷锁’。”
而这场“回归”的第二步,也是最核心的一步,则是去重新地,探寻那个古老的、终极的秘密:
人类,究竟,是如何学习的?
Ilya的答案,并非我们通常所理解的“逻辑”或“理性”。
而是,那个常常被工程师们所忽略的、更底层的、驱动着我们所有行为的**“内在价值系统”——即,我们的情感机制。**
-
快乐,强化了我们的正向反馈。
-
焦虑,警示了我们潜在的风险。
-
羞愧,校准了我们的社交规范。
-
而好奇,则激发了我们无尽的、对未知世界的探索。
在AI的语境中,这,就相当于,为模型,内置一个动态的、自我更新的**“价值函数”(Value Function)**。
它,将不再需要,去被动地,等待人类的“奖励”或“惩-罚”。
它,将能够,在行动之前,就内在地,“预知”到自己行为的“方向偏差”。
“真正的智能,不止于预测,”Ilya给出了一个深刻的洞见,“它,更是一个永续更新的价值体系。”
当AI,能够内化这种“自我评估”的能力时,它,便将觉醒一种全新的、“由意义所驱动的学习”,从而,真正地,开始模拟人类智慧的、最深层的奥秘。
爱力方的分析认为,Ilya Sutskever的这次访谈,其意义,已远超一次简单的、个人的创业宣言。
它更像是一次深刻的、对整个AI技术发展史的“时代划分”。
-
2012 - 2020年: “研究时代”。以AlexNet和Transformer等,一个个天才般的架构突破,为标志。
-
2020 - 2025年: “规模时代”。整个行业,都沉迷于“数据、算力、参数”这三大指标的、近乎于“无脑”的、暴力的堆积。
-
而现在,2025年之后: 这个“堆料”的模式,已经“触顶”,其边际收益,正在急剧地递减。
Ilya断言,即便未来的算力,还将持续地膨胀,“再堆料”,也已难以,再续写AlphaGo或ChatGPT那样的奇迹。
下一阶段的竞争,其焦点,将不可逆转地,回归到对**“像人一样学习”的、全新的基本原理**的探索之上。
从“数量的扩张”,回归到“结构的创新”。
谁,能率先地,掌握“情感泛化”的秘密,谁,就将领跑下一个十年的、全新的AI竞赛。
而Ilya,和他那家以“安全”为名的SSI,正是这场全新的、关于AI“文艺复兴”的、最坚定的、也可能是最重要的“吹哨人”。