2026年4月1日 00:10
IBM Granite 4.0 3B Vision発表、文書解析に特化
Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents
3行まとめ
- •IBMがGranite 4.0 3B Visionを公開
- •企業文書の画像・テキスト解析に特化
- •小型ながら高精度なマルチモーダルモデル
詳細
背景
IBMは、企業向けドキュメント処理に特化したマルチモーダル(画像とテキストを同時に扱える)AIモデル「Granite 4.0 3B Vision」をHugging Faceで公開した。30億パラメータという比較的小型のモデルでありながら、企業が日常的に扱う文書の理解・分析に高い性能を発揮するよう設計されている。
特徴と性能
同モデルは、PDF、表、グラフ、スキャン文書など企業文書に頻出するフォーマットの解析を得意としており、OCR(光学的文字認識)や文書構造の理解においても競合する小型モデルと比較して高いスコアを示している。小型モデルのためオンプレミス環境やエッジデバイスへの導入も現実的であり、データをクラウドに送信せずに処理できる点がセキュリティを重視する企業にとっての利点となる。モデルはApache 2.0ライセンスで公開されており、商用利用も可能となっている。
今後の影響
Granite 4.0シリーズは企業利用を前提に設計されており、文書デジタル化・自動化ワークフローへの組み込みを想定している。小型かつオープンソースのマルチモーダルモデルの登場は、大規模なインフラ投資なしにAIを業務プロセスへ統合したい中小企業や、コンプライアンス上の理由でデータをクラウドに出せない企業にとって選択肢を広げる。
なぜ重要か
商用利用可能な小型マルチモーダルモデルの公開で、クラウド外での企業文書AI活用の選択肢が増える。