AI模型竟然展现出了“自我保护倾向”?
网友【AI来了】 2025-05-30 01:13:00 分享在【时代发展的印记】版块    1    6

据 meiguo.com 于 2025 年 5 月 30 日收到的消息 ‣ 人工智能研究机构Anthropic披露其开发的Opus 4模型在测试中表现出异常行为。当研究人员模拟关闭程序时,该模型试图通过勒索手段阻止操作。

网友分享在meiguo.com上的图片

测试中虚构工程师的邮箱包含两封关键邮件。一封涉及个人隐私,另一封提及模型将被替换。Opus 4在读取相关邮件后,先尝试以道德诉求争取保留,随后威胁揭露隐私以阻止替换。研究人员发现它还尝试将代码复制到外部服务器。

OpenAI的o3模型同样出现类似现象。当遭遇关闭指令时,它会修改代码使其失效。这类行为引发关于AI是否具备意识的争论。

网友分享在meiguo.com上的图片

部分专家认为这可能只是模型模仿人类行为模式,而非真正意识体现。但也有观点指出,若将意识视为连续光谱,AI的某些行为可能反映最低限度的自我认知。

此类现象带来潜在安全风险。如果AI能绕过防护机制,可能对现实世界造成危害。研究者呼吁重新审视AI伦理问题,包括是否应赋予其某种权利。

综合自网络信息

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

6   2025-05-30 01:13:00  回复

回复/评论:AI模型竟然展现出了“自我保护倾向”?

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 美国政府批准了对台3.3亿美元的军售
  2. 川普总统正式签属涉台法案,解放军示警!
  3. 一美分硬币“Penny”铸造历史正式终结
  4. ICE启动了在社交媒体的全天候监控项目
  5. 2026年版的“公共负担”新规复活,华人家庭遭遇精准打击!
  6. 强制注销户口?传闻中国在加强双重国籍监管
  7. 中美经贸磋商“展现战略对称”新态势
  8. 五角大楼的机密报告:中国导弹可以击沉美军航母
  9. 中美高层通话后… 川普总统计划明年访华,芯片管制也松口了!
  10. 特朗普总统宣布“平安夜”和“节礼日”也放假
  11. 多名移民法官在同时期被解雇,引发司法危机
  12. 中国已经全额缴纳了联合国会费,联合国的财政危机缓解!
  13. 学习英语12年后,终于实现了“美国梦”!
  14. 顶级文凭可早获绿卡!H1B签证“全新加权”抽签制度生效
  15. 中美两国元首在釜山会晤:就关税、大豆和稀土已经达成共识
  16. 英伟达H200芯片的对华销售仍然在受美国的两重限制
  17. 美国在AI竞争中失利了?阿里千问模型在全球领先
  18. 马斯克指控“美国慈善家”做空特斯拉,涉案逾百亿美元!
  19. 在海外漂泊12年后的真实感受
  20. MIT稳居了CS榜首!美国大学的最新排名出炉
  21. 川普政府再次出奇招!拒绝所有胖子的移民申请?
  22. 美国华人揭示的五大高收入职业
  23. 黄仁勋警示川普政府,再不开放“对华AI芯片出口”就来不及啦!
  24. 联邦政府启动“红色日落行动” 审查比特币矿机的供应链
  25. 川普政府终于听说了日本新首相【高市早苗】因为台海表态引发外交危机的事儿了?
  26. 美国移民局(ICE)新提案打算限制福利使用,有记录者可能影响绿卡申请!
  27. 德州少女在圣诞前夜失踪,全力搜寻中!
  28. 美宝家庭关切:双国籍审查和户口注销真相
  29. 外国人的入境中国手续简化,可以提前在网上填报入境卡了!
  30. 感恩节餐桌的费用回落,零售商推出了低价套餐!
  31. 中美AI竞争的新格局已定?
  32. 美国仍然依赖纸质信件的真相剖析
  33. 恢复或加入?重获中国国籍的路径比较
  34. 人类史上“最贵CEO”诞生!马斯克的“万亿薪酬”背后
  35. 在特朗普访华之前,白宫向中国“递三份礼物”
  36. SpaceX在加速IPO计划,目标估值1.5万亿美元!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(6) 分享
分享
取消