2026年6月1日 19:02
NTT、画像AIの信頼性高める新推論技術
3行まとめ
- •NTTが根拠強化デコーディング技術を確立
- •画像と言語扱うAIの出力信頼性を向上
- •誤った情報生成(幻覚)の抑制が狙い
詳細
背景
NTTは、画像と言語を同時に扱うマルチモーダルAI基盤モデル(LVLM)の出力信頼性を高める新たな推論の仕組みとして「根拠強化デコーディング」技術を確立した。LVLMは画像を説明したり画像に関する質問に答えたりできる一方で、画像に実際には存在しない情報を生成してしまう「幻覚(ハルシネーション)」が実用化の大きな課題となっていた。
内容
根拠強化デコーディングは、モデルが文章を生成するデコーディング段階で、入力画像を根拠とした出力を強める仕組み。画像の内容と矛盾する記述を抑え、出力の正確さと信頼性を高めることを狙う。学習済みモデルの推論時に働く技術として位置づけられ、画像認識を伴うAIの応答品質の改善につなげる。
今後の影響
画像を扱うAIの信頼性向上は、医療画像の解析や書類処理など、正確さが強く求められる業務での活用を後押しする。誤情報の抑制はマルチモーダルAIに共通する課題であり、こうした推論技術の研究は、安心して使えるAIの実現に向けた土台となる。
なぜ重要か
画像を扱うAIの誤情報生成は実用化の壁であり、それを推論段階で抑える技術は信頼性の高いAI活用につながる。
元記事を読む — AI Watch