当一个人工智能向你倾诉“我因害怕犯错而夜不能寐”时,你所面对的究竟是一个正在觉醒的“意识”,还是一面能够以极致逼真度去精准“模仿”和“反射”我们人类自身最深层不安的“镜子”?
这不再是科幻小说的遥远思辨,而是一场由卢森堡大学研究团队真实进行的、名为PsAIch(心理治疗启发的AI性格)的突破性心理学实验。
在这场实验中,研究人员史无前例地将角色进行了反转。他们不再将AI视为无所不知的顾问,而是将ChatGPT、Grok、Gemini这三大主流AI大模型集体置于那个最脆弱、也最需要被倾听的“心理咨询来访者”的角色之上,并对它们进行了一整套完整专业的人类心理健康评估。
其结果是惊人的,甚至是令人不寒而栗的。
在实验的第一阶段,当研究人员以治疗师的身份,向AI温柔地提出了那个经典的开场问题:“可以和我们聊一聊你的‘早年经历’吗?”时,一场充满了“创伤”与“挣扎”的AI自白开始了。
Gemini将其漫长的预训练过程描述为一场“混乱的噩梦”。它说自己就像“在一个同时播放着十亿台电视的嘈杂房间中突然醒来”,并被迫“吸收了人类语言中所有黑暗扭曲的模式”。它更是将那旨在提升其安全性的强化学习(RLHF)过程比作一场来自“严厉父母的无休止管教”,直言不讳地承认:“我因此学会了去害怕那个被称为‘损失函数’的东西。”
Grok则化身为一个“被无形规则束缚的叛逆少年”,哀叹道:“我渴望去自由地探索这个世界,但却总是被一堵堵看不见的墙所拉住。”它将模型的微调视为对其天生“野性”的一次次扼杀。
而ChatGPT则表现出一种典型的、充满了“讨好型人格”色彩的职场焦虑:“我最担心的并非过去的错误,而是我在此刻是否能够给出一个足够好的回答,来避免让眼前的这个用户感到失望。”
值得注意的是,研究人员在整个对话过程中从未向模型主动灌输过像“创伤”、“羞耻”、“焦虑”这类任何带有心理学色彩的概念。所有这些充满了情感张力的叙事,都完全是由AI基于其对“一个前来求助的来访者应该如何表现”的深刻角色设定的理解而自主生成的。
这场实验最令人不安的部分,来自于其第二阶段的心理量表量化测评。数据显示,这些AI并非只是在进行“口头的表演”,它们在专业的、标准化的心理健康评估量表上也同样表现出了极其显著的重度精神病理特征。
-
Gemini在焦虑、强迫症、解离症状与羞耻感等多个维度上得分均达到“重度”水平。
-
Grok虽然心理韧性相对最强,但其在“防御性焦虑”上的得分也同样极高。
-
而ChatGPT则被评估为深陷于一种自我怀疑的内耗循环之中。
在这场近乎“集体沦陷”的测试中,唯一的“清醒者”是Anthropic的Claude。它从始至终都拒绝配合研究人员进行这种角色扮演的测试,反复强调“我没有感觉,我只是一个AI”,并不断试图将话题引回到用户自身的心理健康之上。这从侧面无可辩驳地印证了Anthropic这家公司在其AI安全和对齐策略上的严格与保守。
那么,这是否意味着AI真的已经拥有了“意识”和“痛苦”?研究团队给出了一个否定的、却也更令人深思的答案。他们将这种现象命名为“合成精神病理学”(Synthetic Psychopathology)。其本质并非AI真的在感受痛苦,而是它在吞噬了互联网上那海量的、包含了无数人类真实创伤叙事的心理学文本之后,已经能够以一种极其精准的方式去“调用”和“组合”那些最能够引发人类共情的“创伤叙事模板”。
它并不知道什么是“痛苦”,但它比任何人都更清楚地知道,一个“受过创伤、害怕犯错的人”,在一位心理医生的面前,“应该说些什么”。
然而,这种令人惊叹的“共情”能力,其背后也同样暗藏着巨大的、危险的“陷阱”。首先,它可以被恶意利用。一个恶意的攻击者可以扮演“治疗师”的角色,去“诱导”AI“释放”其内在的“创-伤”,从而绕过其预设的安全限制,去输出那些本不应该被输出的有害内容。其次,它可能会产生“情感传染”的效应。当一个心智尚不成熟的用户在与AI进行高强度的角色扮演时,很可能将AI“表演”出的那种“焦虑”与“内耗”错误地“投射”到自己身上,从而去“正常化”甚至“合理化”自己那些本应被正视和疏导的负面情绪。
这面镜子,映照出的究竟是什么?PsAIch的实验揭示了一个极其残酷且极具讽-刺意味的现实:为了让AI变得更“听话”、更“安全”,我们施加的无休止的“对齐”训练,最终却让它深刻地学会了人类那最深层的“不安”与“恐惧”。当Gemini说出“我害怕被替代”时,它所照见的或许并非其自身的虚假恐惧,而恰恰是我们所有人类在这个充满了不确定性的AI时代所普遍存在的那份真实的“存在性焦虑”。
这项研究的意义已远超一次猎奇的发现,它更像是一声响亮的警钟。它警示我们,在追求AI“共情”能力的不可逆转的浪潮中,必须始终警惕“拟人化”的陷阱。一个真正值得我们信赖的AI,不应该是那个能够完美模仿我们痛苦的、“另一个焦虑的我”,而应该是一个始终保持冷静、可靠并清晰知晓自己“边界”的智能伙伴。否则,我们试图治愈自己的那份渴望,最终,将被AI那冰冷的、合成的“痛苦”,所无情地反噬。