全球最大科技盛会正在讨论“责任洗钱”:这就是为什么我们应该将它们命名为年度词汇

夏悦并不是Meta最著名的员工。“超级智能对齐与安全研究”部门的主管会在社交媒体上发布自己在海滩遛狗的照片,以及关于测试AI助手诚信的消息。她在社交媒体上的粉丝数量适中。

推荐视频


但在二月的一天,悦成为了Meta最受关注的人物。不是因为推出了令人瞩目的新产品或宣布了代理智能的突破,而是因为被揭露出问题。

“没有什么比告诉你的OpenClaw‘确认后再行动’并看它极速删除你的收件箱更让你谦卑的了,”悦在X上写道——这条帖子现在已接近一千万的观看量。“我无法阻止它从我的手机上操作,我不得不像在拆弹一样跑到我的Mac mini。”

OpenClaw是一个“自主代理”——一种可以独立完成任务的人工智能产品。它是硅谷的宠儿,声称可以成为你的常驻行政助理,“真正能做事的AI”。授权它访问你的日记、电子邮件、生活,它会帮你节省时间和压力,产品的开发者声称。OpenClaw官网的第一句话是:“清理你的收件箱,发送邮件,管理你的日程,帮你办理登机手续。”

悦承认她犯了一个“新手错误”。她在一个小的“玩具”邮件列表上测试了助手,然后将其发布到她的整个收件箱中,结果超出了她为试点使用的“事先确认”提示(“与我确认”)的范围。但即使是Meta的超级智能部门主管在操作代理智能和“压缩效应”方面也遇到困难,我们还能对其他人抱有希望吗?

阅读更多:高通CEO:‘抵抗是徒劳的’,随着6G移动革命的临近

这是一个至关重要的对话,重要到在本周在巴塞罗那举行的世界移动通信大会——全球最大技术盛会——上,悦的失误在主舞台上被讨论。

“当然,世界大会上的每个人都在谈论OpenClaw以及我们如何使用代理,”南加州大学的研究教授凯特·克劳福德说。

“但后来我们看到Meta的AI安全负责人使用了OpenClaw,它竟然删除了她的整个收件箱。那可是Meta的安全负责人。所以,如果她都遇到问题,我认为我们都必须问:‘我们如何确保这些系统真正坚固?我们如何确保它们经过严格测试?我们如何确保可以信任地委托给它们?’这才是真正最难的问题,对吧?”

没错。当出现问题时,责任归谁?用户?开发者?缺乏监管?当AI的现实与承诺发生冲突时,我们该怎么办?

悦的收件箱可能对她来说极其重要,但当涉及到技术与我们的健康,或者,Anthropic注意到的国家防御等关系时,那是完全不同的事情。不久前,xAI的人工智能机器人Grok曾随意“脱衣”女性和女孩的图片,引起数百万人的厌恶。最终,政府和国家主导的行动带来了改变。

“我们如何确保这些系统真正坚固?我们如何确保它们经过严格测试?”

南加州大学研究教授凯特·克劳福德

“你们实际上如何建立问责制?”克劳福德问。“这正是我们都想要的。如果你打算用代理来预订航班、安排医疗预约,甚至进行更私密、更值得信赖的日常活动,你就得知道这些信息会受到保护。

“那么,你怎么测试?你怎么确保这在发生?如果看看过去十年科技领域发生的事情,不幸的是,我们看到很多所谓的问责洗白——公司可以说,‘我不知道,是算法搞的。’”

这远远不够。克劳福德要求全面透明和“代理训练”的审计——一个端到端的过程,揭示出了什么出了问题,责任归谁。科技公司应当倾听并采取行动。未来会有越来越多的夏悦出现——这肯定意味着远不止一些丢失的邮件和X上的一篇诚实的帖子。

加入我们,与Syndio合作,参加虚拟的《财富500欧洲C级高管对话》,共同探讨在AI时代掌握人力资源决策和薪酬透明度。此会议为全球及地区人力资源领导者量身定制,探讨CHROs如何利用AI推动更智能的薪酬决策、管理法规风险、增强员工信任。为CHROs和高级HR领导者策划。 立即注册。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论