2026年6月1日 19:02

NTT、画像AIの信頼性高める新推論技術

3行まとめ

•NTTが根拠強化デコーディング技術を確立
•画像と言語扱うAIの出力信頼性を向上
•誤った情報生成（幻覚）の抑制が狙い

詳細

背景

NTTは、画像と言語を同時に扱うマルチモーダルAI基盤モデル（LVLM）の出力信頼性を高める新たな推論の仕組みとして「根拠強化デコーディング」技術を確立した。LVLMは画像を説明したり画像に関する質問に答えたりできる一方で、画像に実際には存在しない情報を生成してしまう「幻覚（ハルシネーション）」が実用化の大きな課題となっていた。

内容

根拠強化デコーディングは、モデルが文章を生成するデコーディング段階で、入力画像を根拠とした出力を強める仕組み。画像の内容と矛盾する記述を抑え、出力の正確さと信頼性を高めることを狙う。学習済みモデルの推論時に働く技術として位置づけられ、画像認識を伴うAIの応答品質の改善につなげる。

今後の影響

画像を扱うAIの信頼性向上は、医療画像の解析や書類処理など、正確さが強く求められる業務での活用を後押しする。誤情報の抑制はマルチモーダルAIに共通する課題であり、こうした推論技術の研究は、安心して使えるAIの実現に向けた土台となる。

なぜ重要か

画像を扱うAIの誤情報生成は実用化の壁であり、それを推論段階で抑える技術は信頼性の高いAI活用につながる。

研究・論文 NTT 画像認識誤情報対策信頼性向上

元記事を読む — AI Watch

NTT、画像AIの信頼性高める新推論技術

3行まとめ

詳細

背景

内容

今後の影響

なぜ重要か

人気記事