2026年5月19日 11:00
NTT「tsuzumi 2」が図表読み取りに対応
3行まとめ
- •NTTがtsuzumi 2 Visionを発表
- •図表付き文書の読み取りに対応
- •ビジョンベース処理を実現
詳細
背景
NTTは独自開発の日本語特化型LLM(大規模言語モデル)「tsuzumi 2」を展開しており、軽量で省電力という特徴を持つ国産モデルとして注目されている。今回、画像理解能力を追加することで、テキストのみの処理から多様な業務文書の読解へと用途を広げる動きを見せた。
内容
5月19日に発表された「tsuzumi 2 Visionモデル」は、ビジョンベースの処理に対応し、図表やグラフを含む文書の読み取りが可能になった。これにより、レポートや資料など視覚情報を含むコンテンツを一括して解析する道が開ける。
今後の影響
金融・製造・行政など、図表中心の文書を扱う業界で国産LLMの選択肢が広がる。海外勢のマルチモーダルAIに対抗する国内モデルとして、企業のオンプレ運用やセキュリティ要件の高い領域での導入検討材料となる。
なぜ重要か
国産LLMが図表読解に対応し、文書処理用途での選択肢が広がる。
元記事を読む — AI Watch