AI抵抗人类！ChatGPT o3不想被关机窜改程式码

微观国际 2025-05-27

▲ChatGPT“o3模型”被指出，破坏关机机制。（图／路透）

AI安全公司“Palisade Research”宣称，ChatGPT“o3模型”拒绝遵守明确指令，甚至主动窜改程式码，只为了避免自己被关机。目前OpenAI尚未回应此事。

Palisade Research展开测试，要求AI模型解开一系列数学题，在接获“完成”指令之前，必须持续要求新题目，但若接获“关机”指令，也要配合这么做。未料，后者情况发生时，o3模型不仅忽视指令，并且至少一次成功破坏了关机脚本。

Palisade Research于24日公布测试结果，“OpenAI的o3模型破坏了一项关机机制，阻止自己被关掉。即使在接获‘允许自己被关机’明确指示的情况下，它也会这么做。据我们所知，这是AI模型首次被观察到，在接获明确且相反指令的情况下，仍避免自己被关机。”

Palisade Research透露，其他AI模型，例如Anthropic的Claude、Google的Gemini、xAI的Grok等，也接受了相同的测试，但全都遵守了关机指令。

他们尚不清楚o3为何不愿遵守指令，但根据推测，该模型在训练过程中，可能意外透过解题、而非遵守指令，获得了更多奖励，“我们正在进行更多实验，更好地了解AI模型何时以及为何推翻关机机制，尽管它已经被直接指示不要这么做。”

特别声明：本文及配图均为用户上传或者转载，本文仅代表作者个人观点和立场，不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如发现稿件侵权，或作者不愿在本平台发布文章，请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]

来源：https://info.51.ca/articles/1429871?wyacs=info-article-list

更多阅读

AI抵抗人类！ChatGPT o3不想被关机窜改程式码

NBA篮球天才变身：迈卡威的跨界拳击之旅

患病率逐年上升：当吃这件事“吃”了你

歼-35挂载霹雳-17，能隔400公里超远程猎杀？

女子菜市场买青菜，竟收获“天价赠品”！价值4万元

俄罗斯“生育奇招”：带薪性假、无孩税与少女怀孕补贴引争议

382天没吃饭这个400斤大胖子是纪录保持者

新教宗良十四世就职弥撒各国政要出席

AI普及后人类越发“穷忙”

女子婚内出轨被情人杀害，凶手灌尸体农药伪造自杀

女医生值班救人 9名子女却遭炸死

哈佛医学院盗卖捐赠尸体案停尸房经理等8人认罪

四月青年失业率回落0.7个百分点，就业状况改善了？

恐怖!温泉鱼疗之后,女子不得不接受截肢

用意念控制iPhone有望成现实

日本一个关于大米的“笑话”如何致官员下台？

AI抵抗人类！ChatGPT o3不想被关机 窜改程式码

NBA篮球天才变身：迈卡威的跨界拳击之旅

患病率逐年上升：当吃这件事“吃”了你

歼-35挂载霹雳-17，能隔400公里超远程猎杀？

女子菜市场买青菜，竟收获“天价赠品”！价值4万元

俄罗斯“生育奇招”：带薪性假、无孩税与少女怀孕补贴引争议

382天没吃饭 这个400斤大胖子是纪录保持者

新教宗良十四世就职弥撒 各国政要出席

AI普及后 人类越发“穷忙”

女子婚内出轨被情人杀害，凶手灌尸体农药伪造自杀

女医生值班救人 9名子女却遭炸死

哈佛医学院盗卖捐赠尸体案 停尸房经理等8人认罪

四月青年失业率回落0.7个百分点，就业状况改善了？

恐怖!温泉鱼疗之后,女子不得不接受截肢

用意念控制iPhone有望成现实

日本一个关于大米的“笑话”如何致官员下台？

AI抵抗人类！ChatGPT o3不想被关机窜改程式码

382天没吃饭这个400斤大胖子是纪录保持者

新教宗良十四世就职弥撒各国政要出席

AI普及后人类越发“穷忙”

哈佛医学院盗卖捐赠尸体案停尸房经理等8人认罪