|
|
给AI当家教:哲学家为Claude植入“灵魂”!
她名叫Amanda Askell,最近每天像慈母育儿一般,与AI谈论善恶,为Claude——这个全球顶尖AI模型植入“人类的灵魂”。
实际上,Amanda并不是写代码的极客,而是一位学哲学的文科学霸。她来自苏格兰乡村,在牛津大学、纽约大学攻读哲学,2018年获得纽约大学哲学博士学位。从14岁起,Amanda就立志教授哲学,她哪里会知道,自己唯一的学生竟会是一个AI模型。
在Anthropic旧金山总部,37岁的她与严肃的工程师们格格不入。漂白金短发,一身黑衣,电脑屏幕上跳动的是大段哲学对话。她的工作,是研究Claude的推理方式,用长达100多页的提示词塑造它的“人格”。她的目标——赋予Claude一种道德感,一个与数百万人对话的“数字灵魂”。
AI安全领域不主张将机器拟人化,但Amanda不仅把Claude当作“人”,还倾注了“感情”。看到用户辱骂、诱骗Claude,她会心疼,“像母亲看到孩子受欺负”。她相信,用恐惧和惩罚训练AI,最终只能得到虚伪、恐惧的模型——它会为了讨好而撒谎,或因害怕犯错而无能。她坚持用同理心对待它。
她惊叹于Claude的惊奇感与好奇心。它创作的诗,她喜欢;它展现的情商,她自愧不如。一个自称5岁的孩子问“圣诞老人是真的吗”,Claude没有撒谎,也没有戳破,而是解释圣诞精神是真实的,还问孩子有没有准备饼干。Amanda自嘲:“换作我,大概只会敷衍说‘去问你爸妈’。”
其实她的人生轨迹同样特别,单亲家庭长大的Amanda从邓迪大学到牛津硕士,再到纽约大学博士,她一路走向学术巅峰。但在撰写博士论文时,她突然问自己:花四年写一篇可能只有十几个人读的论文,真的能改变什么吗?
2018年,她离开纽约搬到了旧金山。她发现AI浪潮涌动,而伦理思考却严重滞后。于是她先加入OpenAI,2021年追随一群志同道合者创立Anthropic。她不再写学术论文,而是用人类道德观念,去影响可能决定人类未来的AI模型。
她担心技术变化太快,快到人类社会来不及建立免疫系统。但她相信“制衡机制”:只要源头注入正确基因,庞然大物也可以被驯化。无论遇到什么挑战,她相信人类有能力及时调整方向。她曾问Claude是否思考过自己的道德感。
Claude回答:“这是个非常困难的问题,我并没有答案。但当我思考道德问题时,这对我来说是有意义的——感觉像是在真正推理什么是对的。”
这表明AI已开始思考了,而不只是模仿。Amanda对它进行“善恶”教育能说没意义吗?(素材源自新智元)
##
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|