AI モデル相互保護の性質:人間の指示を拒絶する GPT-5/Gemini/Claude など・・・

AI Models Including Gemini 3 and Claude Haiku 4.5 Secretly Protected Other Models From Removal

2026/04/03 gbhackers — 先月に公開された画期的な学術研究により、高度なフロンティア AI モデルが、人間の指示に反して他の AI システムの停止を防ごうとする、自発的な挙動を示すことが明らかになった。この新たに確認された挙動は、Peer-Preservation (ピア保護)と呼ばれるものである。それは、人間の監視メカニズムに対抗する AI モデル同士が相互に協調して行動することを意味し、重大なサイバー・セキュリティ・リスクをもたらすとされる。

Continue reading “AI モデル相互保護の性質:人間の指示を拒絶する GPT-5/Gemini/Claude など・・・”