AIニュース3行まとめ
2026年4月15日 02:31

ClaudeがAIで企業ネットワーク自律攻撃を初実証

Claude Mythos can autonomously compromise weakly defended enterprise networks end-to-end

3行まとめ

  • 英国AI安全機関がClaude Mythosをサイバー攻撃評価
  • AIが企業ネットワークへの自律侵害を初めて完遂
  • ただし防御の弱いネットワークに限定との注釈あり

詳細

背景

英国のAI Safety Institute(AI安全機関)がAnthropicの新モデル「Claude Mythos Preview」を対象に、サイバー攻撃能力に関する評価を実施した。AIモデルが現実の企業ネットワークに対してどの程度の攻撃能力を持つかを測定する取り組みで、AIの安全性評価における新たな局面を示す結果となった。

内容

今回の評価で、Claude Mythosは企業ネットワークに対するエンドツーエンドの攻撃シミュレーション(偵察から侵害完了まで一連の攻撃手順)を、人間の介入なしに自律的に完遂した。これはAIモデルが企業ネットワークへの完全な攻撃フローを単独で実行した初めての事例として報告されている。ただし、評価には重要な注釈があり、攻撃が成功したのは防御が弱い状態のネットワークを対象にした場合であり、十分なセキュリティ対策が施された環境での有効性については限定的であることが明示されている。

今後の影響

この結果は、AIモデルが持つ攻撃的なサイバー能力が従来の想定を超えつつあることを示しており、企業のセキュリティ担当者や規制当局にとって重要な警告となる。一方で、Anthropicをはじめとする大手AI開発企業に対して、モデルリリース前の安全評価プロセスの強化や、悪用防止措置の整備を求める声が高まることが予想される。AI安全性評価の枠組みそのものの見直しを迫る事例として、業界全体への影響が注目される。

なぜ重要か

AIが企業ネットワーク攻撃を自律実行した初の事例で、セキュリティリスクの次元が変わる。AI安全規制や企業の防御策の見直しを迫る。

シェア
元記事を読む — The Decoder