2026年6月24日 10:13
Mistral OCR 4公開、170言語・位置情報出力対応
3行まとめ
- •Mistral AIがOCR最新版を公開
- •170言語対応・信頼度スコア出力追加
- •単一コンテナで自己ホスティング可能
詳細
背景
Mistral AIは文書解析に特化したOCRモデルの開発を続けており、今回その最新版「Mistral OCR 4」を公開した。OCR(光学文字認識)技術はPDF・スキャン文書からテキストを抽出する際に不可欠で、企業の文書デジタル化需要の高まりとともに注目を集めている分野だ。
機能
Mistral OCR 4は日本語を含む170言語に対応する。従来から要望の多かったバウンディングボックス(文字の位置情報)と信頼度スコアの出力機能を新たに搭載し、文書レイアウト解析の精度向上や品質チェックの自動化に活用できる。また単一コンテナで自己ホスティングが可能な構成となっており、外部クラウドへのデータ送信が制限される金融・医療・法務分野などでも導入しやすい設計となっている。
活用範囲
バウンディングボックスと信頼度スコアの出力により、ドキュメントAIパイプラインの後段処理との連携が容易になる。自己ホスティング対応により、厳格なデータ主権やコンプライアンス規制がある組織がクラウドにデータを送信せずに高精度OCRを利用できる。170言語対応で、グローバルな多言語文書を含む幅広い用途に利用できる。
なぜ重要か
Mistral AIが170言語対応の新OCRモデルを公開した。バウンディングボックス出力と自己ホスティング対応で、規制業界を含む幅広い組織が導入しやすくなった。
元記事を読む — ITmedia AI+