2026年5月15日 13:00
リコー、図表も扱えるマルチモーダルLLM公開
3行まとめ
- •リコーがLMMの開発を完了
- •図表を含む文書解析に対応
- •軽量版をHugging Faceで公開
詳細
背景
リコーは、経済産業省とNEDOが推進する国産生成AI開発支援プロジェクト「GENIAC」第3期において、リーズニング性能を備えたマルチモーダル大規模言語モデル(LMM)の開発を完了した。テキスト検索だけでは業務文書の活用に限界があるという課題に対応するもの。
内容
開発されたLMMは、テキストに加えて図表や画像を含む文書を扱える点が特徴で、大型の商用モデルに匹敵する性能を持つとされる。軽量版モデルはHugging Faceで無償公開されており、誰でも利用・検証が可能となっている。
今後の影響
業務文書には図表や画像が多く含まれるため、テキストのみを対象とするRAGや検索システムでは情報を取りこぼす課題があった。図表を理解できる国産LMMの登場は、日本企業における社内文書活用や業務効率化の選択肢を広げる動きとなる。
なぜ重要か
図表を扱える国産LMMが無償公開され、業務文書活用の選択肢が広がる。
元記事を読む — ITmedia AI+