14時間前METR、Claude Mythosの評価に苦戦•METRが新Claude評価に限界を露呈•228タスク中5つしか該当能力測定不可•AI攻撃は25分で情報窃取に到達セキュリティ・プライバシーAnthropicClaude続きを読む →