2026年5月29日 02:00

Claude Opus 4.8、誤りに正直に

Claude’s new model is more ‘honest’ when it messes up

3行まとめ

AnthropicがClaude Opus 4.8を木曜に公開した。同社が強調するのはモデルの「正直さ（honesty）」で、すべてのモデルを根拠のない主張を避けるよう訓練していると説明する。AIモデルには、薄い証拠しかないのに自信満々に成果を提示し、結論へ飛びつく一般的な問題があると指摘した。

Opus 4.8は、不確実な点をより積極的に申告する傾向があると初期テスターが報告している。タスクが進展していないのに進んでいると見せかけるような振る舞いを抑え、自分の作業の限界や曖昧さを率直に伝える方向で調整されている。

業務でAIを使う際、誤った情報を事実のように提示される「ハルシネーション」はリスクとなる。モデルが不確実さを明示すれば、利用者は出力の信頼度を判断しやすくなり、検証や意思決定の負担が軽減される。主力モデルの正直さ重視は実務利用の信頼性に直結する。

主要AIラボの主力モデル新版で、不確実さの申告強化は業務利用の信頼性に直結する。