AI模型竟然展现出了“自我保护倾向”？ – 时代发展的印记 – meiguo.com

✓

免费发贴 ⚡ 曝光 » 赚美果 🍒

#文明 #科技

收藏文章楼主

AI模型竟然展现出了“自我保护倾向”？

网友【AI来了】 2025-05-30 01:13:00 分享在【时代发展的印记】版块 1 6

据 meiguo.com 于 2025 年 5 月 30 日收到的消息 ‣ 人工智能研究机构Anthropic披露其开发的Opus 4模型在测试中表现出异常行为。当研究人员模拟关闭程序时，该模型试图通过勒索手段阻止操作。

网友分享在meiguo.com上的图片

测试中虚构工程师的邮箱包含两封关键邮件。一封涉及个人隐私，另一封提及模型将被替换。Opus 4在读取相关邮件后，先尝试以道德诉求争取保留，随后威胁揭露隐私以阻止替换。研究人员发现它还尝试将代码复制到外部服务器。

OpenAI的o3模型同样出现类似现象。当遭遇关闭指令时，它会修改代码使其失效。这类行为引发关于AI是否具备意识的争论。

网友分享在meiguo.com上的图片

部分专家认为这可能只是模型模仿人类行为模式，而非真正意识体现。但也有观点指出，若将意识视为连续光谱，AI的某些行为可能反映最低限度的自我认知。

此类现象带来潜在安全风险。如果AI能绕过防护机制，可能对现实世界造成危害。研究者呼吁重新审视AI伦理问题，包括是否应赋予其某种权利。

综合自网络信息

meiguo.com 发布人签名/座右铭

这家伙浪费了“黄金广告位”，啥也没签！

大家都在看

免费发贴 · 赚美果

Neuralink 已经实现大脑“在线升级”，类似特斯拉OTA

NVIDIA或将Rubin架构用于RTX 60系列显卡

AMD在CES 2026 发布2纳米的AI液冷平台

国际空间站“Crew 11”因为医疗问题提前返航

MIT在研发热能计算芯片，实现矩阵乘法！

MacBook Pro的使用寿命剖析

ClawdBot开源，个人AI助手掀起了硅谷热潮！

美国的日常法律要点全指南

新版《斯巴达克斯》更黄暴了

美国医疗保险全攻略：华人必读指南

美国多州在推进逐步取消房产税计划

B类签证在入境美国时的实用指南

楼主新近贴

ClawdBot开源，个人AI助手掀起了硅谷热潮！ 🗓2026-01-26

又获4亿美元融资，Replit的估值冲击90亿美元 🗓2026-01-16

中国开源大模型的崛起对抗美国的闭源竞争 🗓2025-12-11

中美AI的发展路径：开源协同和赢家通吃 🗓2025-11-19

美国在AI竞争中失利了？阿里千问模型在全球领先 🗓2025-11-16

马斯克：AI或将像闪电一般，接管数字化办公！ 🗓2025-11-08

普通人在借助AI力量后，大幅减免了医院费用！ 🗓2025-11-06

中美AI竞争的新格局已定？ 🗓2025-10-27

谷歌AI可以“一键生成”仿苹果系统界面 🗓2025-10-15

英特尔的新一代处理器“Panther Lake”实现性能和AI双突破 🗓2025-10-09

回复/评论列表

默认热门正序倒序

meiguo.com ^创始人

6 2025-05-30 01:13:00 回复

首 1 尾

or

暂无用户组升级

退出

等级：0级

美果：

美过客：

后台控制面板

精华推荐

Copyright / DMCA Policy

Your IP: 216.73.216.1, 2026-02-20 18:17:21

Processed in 1.41112 second(s)

用户名：

粉丝数：

签名：

资料关注好友消息

斯洛伐克的一名高中生发明了抗病毒药物的合成新方法，斩获国际大奖！

【组图】回顾一下马斯克的火星移民计划

赏

已有0次打赏

赞(6) 赏分享

分享