首页 > 科技分享 > 科技分享 > 新研究发现部分人工智能系统已擅长“说谎”

新研究发现部分人工智能系统已擅长“说谎”

发布时间:2024-05-13 16:57:20

新华社

2023年7月7日,在瑞士日内瓦“人工智能造福人类全球峰会”上,一名参会者给仿真机器人索菲亚拍照。新华社记者 连漪 摄

人工智能系统是否会欺骗人类,一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称,部分人工智能系统已经学会如何欺骗人类,其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献,重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗,它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统,它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称,“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”,并且在玩游戏时“从不故意背刺”它的人类盟友,但该公司发表的论文数据显示,该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说,“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力,或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力,以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示,虽然人工智能系统在游戏中作弊似乎是无害的,但它可能会导致“欺骗性人工智能能力的突破”,并在未来演变成更高级的人工智能欺骗形式。

帕克说:“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。

科技分享更多>>

特斯拉品牌价值缩水超150亿美元;中国高端纯电轿车销冠易主 理想汽车发布2026年1月交付数据,该公司共交付新车27,668辆,较2025年同期下滑7.55% 回归4.0T V8动力 新款奔驰AMG S 63车型的测试谍照 博世副总裁陈大宇:智能驾驶是一场“马拉松” 2026,欧洲汽车工业的生死突围:车企产能利用率危机显现 续航里程达425km 斯柯达Epiq官方谍照发布 “根在德国”,奔驰CEO回绝将总部迁至美国的提议 谁在引爆动力电池的“售后革命”?动力电池维修供需矛盾凸显 年产5000台套,京津冀迎来首个人形机器人中试平台 阶跃星辰新帅印奇:目标成为中国基础模型领域优秀公司之一 云米科技CEO给员工奖励小米YU7:期待能奖励更多台 贾跃亭:法拉第未来当前股价被严重低估 目标价5美元 贾跃亭:FF完成机器人法规认证并公布设计图,有望实现发布即交付 “体面一厂”员工自曝公司取消大小周但要提前上班!网友:“这就是传说中的‘朝三暮四’现代版吧?” 为何必须是“人形”?优必选创始人详解机器人进厂 俞敏洪、周鸿祎聚首2026崇礼论坛:当AI成为基础变量,人如何重掌主动权 小红书都“躺枪”,丽江的旅拍能有多离谱? 谷歌、OpenAI争相让旗下AI玩经典《精灵宝可梦》游戏,衡量GPT、Gemini的真正实力 全国人民都能领!腾讯:关于元宝春节分10亿现金的通知 奥特曼秘密持股OpenAI!法庭文件曝光总裁日记:2017年就想转盈利 让AI写个分析报告、尝试一个新工具、生成第一个网页、调整一次Prompt、手搓一个Skills.......都可以 消灭产品经理后,Lovart活成了Manus的“影子” iPhone 18 Pro和iPhone Fold将首发苹果A20 Pro芯片:2nm工艺 消息称苹果M6 MacBook Pro的OLED屏幕本月开始量产 华硕董事长施崇棠直言“手机业务一定会继续服务好原有客户,但不会再推出新的机种。” 江淮汽车:预计2025年净亏损16.8亿元左右 福特中国回应“正与比亚迪进行洽谈”传闻:在很多业务领域都与不同公司有会谈 两大国产X86 CPU崛起,落后intel/AMD,已只有2-3年了 比亚迪再度亮相央视科晚,展示智能化新成果 友商又要急了,雷军给小米汽车定了2026年目标,55万辆