2026年4月19日 17:35
複雑なグラフでAIの性能が半減、新ベンチマークで判明
Even the best AI models lose about half their performance when charts get complicated, new benchmark finds
3行まとめ
- •複雑なグラフでAIの性能が約50%低下
- •RealChart2Codeが14モデルを実データで評価
- •上位商用モデルも複雑化で大幅に精度が落ちる
詳細
背景
AIモデルのグラフ理解・再現能力を評価する新ベンチマーク「RealChart2Code」が公開された。従来のベンチマークは単純なグラフを対象としていたが、実業務で扱うデータはより複雑な可視化を伴うことが多く、実態に即した評価基準が求められていた。
内容
RealChart2Codeは実世界のデータセットから構築した複雑な可視化を用いて、14の主要AIモデルを評価する。結果として、上位の商用モデルであっても、単純なグラフと比較して約50%の性能低下が確認された。これは、現在のAIモデルがグラフの複雑さに対して脆弱であることを示している。シンプルなチャートでは高い精度を発揮するモデルも、複数の変数や重なりのあるデータ、凡例が複雑な可視化になると大幅に精度が落ちた。
今後の影響
データ分析や資料作成にAIを活用しているビジネスパーソンにとって、グラフの複雑さがAIの出力精度に直結することが明確になった。複雑な可視化の自動解析や再現にAIを用いる場合は、現時点では人間によるレビューが不可欠であることをこのベンチマークは示している。今後のモデル改善において、複雑なグラフへの対応力が重要な指標になるとみられる。
なぜ重要か
AIのグラフ理解能力に明確な限界が示され、データ分析業務でのAI活用範囲を見直す判断材料になる。
元記事を読む — The Decoder