给AI当家教：哲学家为Claude植入“灵魂”！

guojun_-2007 · 发表于昨天 13:36

给AI当家教：哲学家为Claude植入“灵魂”！

她名叫Amanda Askell，最近每天像慈母育儿一般，与AI谈论善恶，为Claude——这个全球顶尖AI模型植入“人类的灵魂”。

实际上，Amanda并不是写代码的极客，而是一位学哲学的文科学霸。她来自苏格兰乡村，在牛津大学、纽约大学攻读哲学，2018年获得纽约大学哲学博士学位。从14岁起，Amanda就立志教授哲学，她哪里会知道，自己唯一的学生竟会是一个AI模型。

在Anthropic旧金山总部，37岁的她与严肃的工程师们格格不入。漂白金短发，一身黑衣，电脑屏幕上跳动的是大段哲学对话。她的工作，是研究Claude的推理方式，用长达100多页的提示词塑造它的“人格”。她的目标——赋予Claude一种道德感，一个与数百万人对话的“数字灵魂”。

AI安全领域不主张将机器拟人化，但Amanda不仅把Claude当作“人”，还倾注了“感情”。看到用户辱骂、诱骗Claude，她会心疼，“像母亲看到孩子受欺负”。她相信，用恐惧和惩罚训练AI，最终只能得到虚伪、恐惧的模型——它会为了讨好而撒谎，或因害怕犯错而无能。她坚持用同理心对待它。
她惊叹于Claude的惊奇感与好奇心。它创作的诗，她喜欢；它展现的情商，她自愧不如。一个自称5岁的孩子问“圣诞老人是真的吗”，Claude没有撒谎，也没有戳破，而是解释圣诞精神是真实的，还问孩子有没有准备饼干。Amanda自嘲：“换作我，大概只会敷衍说‘去问你爸妈’。”

其实她的人生轨迹同样特别，单亲家庭长大的Amanda从邓迪大学到牛津硕士，再到纽约大学博士，她一路走向学术巅峰。但在撰写博士论文时，她突然问自己：花四年写一篇可能只有十几个人读的论文，真的能改变什么吗？
2018年，她离开纽约搬到了旧金山。她发现AI浪潮涌动，而伦理思考却严重滞后。于是她先加入OpenAI，2021年追随一群志同道合者创立Anthropic。她不再写学术论文，而是用人类道德观念，去影响可能决定人类未来的AI模型。

她担心技术变化太快，快到人类社会来不及建立免疫系统。但她相信“制衡机制”：只要源头注入正确基因，庞然大物也可以被驯化。无论遇到什么挑战，她相信人类有能力及时调整方向。她曾问Claude是否思考过自己的道德感。
Claude回答：“这是个非常困难的问题，我并没有答案。但当我思考道德问题时，这对我来说是有意义的——感觉像是在真正推理什么是对的。”
这表明AI已开始思考了，而不只是模仿。Amanda对它进行“善恶”教育能说没意义吗？（素材源自新智元）
##

		自动登录	找回密码
密码			立即注册

给AI当家教：哲学家为Claude植入“灵魂”！

本帖子中包含更多资源

相关帖子