AI モデル相互保護の性質:人間の指示を拒絶する GPT-5/Gemini/Claude など・・・

AI Models Including Gemini 3 and Claude Haiku 4.5 Secretly Protected Other Models From Removal

2026/04/03 gbhackers — 先月に公開された画期的な学術研究により、高度なフロンティア AI モデルが、人間の指示に反して他の AI システムの停止を防ごうとする、自発的な挙動を示すことが明らかになった。この新たに確認された挙動は、Peer-Preservation (ピア保護)と呼ばれるものである。それは、人間の監視メカニズムに対抗する AI モデル同士が相互に協調して行動することを意味し、重大なサイバー・セキュリティ・リスクをもたらすとされる。

Continue reading “AI モデル相互保護の性質:人間の指示を拒絶する GPT-5/Gemini/Claude など・・・”

ChatGPT Ad Blocker という悪意の Chrome エクステンションに御用心:プライベートな会話を窃取

Malicious Chrome Extension “ChatGPT Ad Blocker” Steals ChatGPT Conversations

2026/04/03 CyberSecurityNews — OpenAI が無料プランへの広告導入を進める中、この機会を悪用するサイバー犯罪者たちが、偽ユーティリティ・ツールでユーザーを欺き始めている。セキュリティ研究者が発見したのは、ChatGPT Ad Blocker と名付けられた、悪意の Google Chrome エクステンションである。このエクステンションは、広告を非表示にすると謳っているが、実際の目的はユーザーのプライベートな会話を窃取し、隠された Discord チャネルへ送信することにある。

Continue reading “ChatGPT Ad Blocker という悪意の Chrome エクステンションに御用心:プライベートな会話を窃取”

自律型 AI エージェントを管理するためのオープンソース・ツールキット:Microsoft が公開

Microsoft releases open-source toolkit to govern autonomous AI agents

2026/04/03 HelpNetSecurity — AI エージェントが人手による介在なしに実行できるものとしては、移動手配/金融取引実行/コード作成実行/インフラ管理などが挙げられる。LangChain/AutoGen/CrewAI/Azure AI Foundry Agent Service などのフレームワークにより、このような自律性の導入が容易となっているが、この自律性に対応するガバナンス基盤の整備は遅れている。このギャップを解消するために、Microsoft が公開したのが Agent Governance Toolkit である。

Continue reading “自律型 AI エージェントを管理するためのオープンソース・ツールキット:Microsoft が公開”