2026年6月13日 19:16
Fable 5、数学難問でGPT-5.5を13点差で上回る
Claude Fable 5 outpaces GPT-5.5 by 13 points on FrontierMath's toughest problems
3行まとめ
- •Fable 5が最難数学で88%の正答率達成
- •GPT-5.5は同ティアで75%、13点差でリード
- •Opus 4.5の10%未満から急激に改善
詳細
背景
FrontierMathはEpoch AIが設計した高難度の数学ベンチマークで、最上位ティアの問題はトップクラスの数学者でも解くのに数時間から数日を要する。2026年初頭、AnthropicのOpus 4.5はこのベンチマークの最難ティアで正答率10%未満にとどまっており、当時のAIシステムにとって実質的に手が届かない領域として知られていた。
計測結果
AnthropicのClaude Fable 5は、FrontierMathの最難ティアで88%の正答率を達成した。OpenAIのGPT-5.5が同ティアで記録した約75%を13ポイント上回る結果であり、現時点での最高難度数学問題における正答率で首位に立つ。Opus 4.5の10%未満からわずか数ヶ月で88%へ急上昇した事実は、AI数学推論能力の向上ペースが急速に加速していることを示している。
今後の影響
最難数学問題で88%の正答率を達成したことは、定理証明の自動化や科学研究における複雑な数理計算の処理が技術的に実現可能な段階に近づいていることを示す。Opus 4.5から数ヶ月でスコアが10%未満から88%へ急上昇した事実は、AI数学推論能力が短期間で劇的に変化していることを示す実例となる。
なぜ重要か
Fable 5がFrontierMath最難ティアで88%を達成しGPT-5.5を13点上回った。Opus 4.5の10%未満から数ヶ月での急上昇はAI数学推論の進化速度を示す。
元記事を読む — The Decoder