AIニュース3行まとめ
2026年6月1日 19:02

NTT、画像AIの信頼性高める新推論技術

3行まとめ

  • NTTが根拠強化デコーディング技術を確立
  • 画像と言語扱うAIの出力信頼性を向上
  • 誤った情報生成(幻覚)の抑制が狙い

詳細

背景

NTTは、画像と言語を同時に扱うマルチモーダルAI基盤モデル(LVLM)の出力信頼性を高める新たな推論の仕組みとして「根拠強化デコーディング」技術を確立した。LVLMは画像を説明したり画像に関する質問に答えたりできる一方で、画像に実際には存在しない情報を生成してしまう「幻覚(ハルシネーション)」が実用化の大きな課題となっていた。

内容

根拠強化デコーディングは、モデルが文章を生成するデコーディング段階で、入力画像を根拠とした出力を強める仕組み。画像の内容と矛盾する記述を抑え、出力の正確さと信頼性を高めることを狙う。学習済みモデルの推論時に働く技術として位置づけられ、画像認識を伴うAIの応答品質の改善につなげる。

今後の影響

画像を扱うAIの信頼性向上は、医療画像の解析や書類処理など、正確さが強く求められる業務での活用を後押しする。誤情報の抑制はマルチモーダルAIに共通する課題であり、こうした推論技術の研究は、安心して使えるAIの実現に向けた土台となる。

なぜ重要か

画像を扱うAIの誤情報生成は実用化の壁であり、それを推論段階で抑える技術は信頼性の高いAI活用につながる。

元記事を読む — AI Watch

人気記事