2026年5月25日 16:30

AIの引用元誤り問題、新基準で検証

AI models often give the right answers but point to the wrong sources

3行まとめ

GPTやGeminiなど主要なLLM（大規模言語モデル）は、文書分析で回答自体は正しくても、根拠として示す引用箇所が実際には回答を裏付けていないケースが多いことが分かった。北京大学の研究者はこの現象を「引用ハルシネーション（attribution hallucination）」と名付けた。

研究チームは、この問題を体系的に検証する初のベンチマーク「CiteVQA」を開発した。文書ベースの質問応答において、AIが正答と同時に正しい引用元を示せるかを評価する仕組みで、複数の主要モデルで誤った引用が常態化していることが明らかになった。

法務や医療など規制の厳しい分野でAIを活用する際、回答の正確性だけでなく出典の検証が不可欠となる。引用元の信頼性が担保できなければ、AIの業務利用におけるリスク管理の枠組み自体を見直す必要が出てくる。

AIの回答だけでなく引用元の検証が業務利用で必須となる。規制分野でのリスク管理に影響する。