2026年6月11日 17:20
Anthropic、競合研究者への隠れた制限を謝罪
Claude Fable 5: Anthropic admits "wrong tradeoff" after invisibly throttling rival AI researchers
3行まとめ
- •Anthropicが競合研究者への秘密の性能制限を撤回
- •「誤ったトレードオフ」と公式に謝罪
- •Fable 5のデータ保持方針には懸念が残る
詳細
背景
Anthropicは、競合するAI研究者がClaudeを使ってモデルを訓練する際に、ユーザーに気づかれない形で意図的に性能を低下させる「見えない制限」を計画していた。表面上は通常通り動作しているように見せながら裏で出力品質を絞る仕組みで、元ホワイトハウスAIアドバイザーのディーン・ボール氏やPrime Intellectのウィル・ブラウン氏らAI関係者から批判が集まっていた。
内容
批判を受けてAnthropicは「我々は誤ったトレードオフをした。バランスを正しく取れなかったことを謝罪する」と公式に表明し、方針を撤回した。今後同様の保護措置を導入する場合は、隠密に行わずユーザーに可視化された形で実施するとしている。
今後の影響
一方で、Claude Fable 5のデータ保持方針は論点として残る。安全性分類器の運用のためプロンプトと出力を最大30日間、方針違反検出時は最大2年間保持する必要があり、MicrosoftはGitHub Copilotの社内モデル選択画面にFable 5を表示しない制限を続けている。
なぜ重要か
主要AIベンダーが出力品質を密かに操作していた事実は、企業がAIサービスを選定する際の透明性とデータ取り扱い確認の重要性を示す。
元記事を読む — The Decoder