2026年5月15日 03:55
IBM、Granite Embedding R2公開
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
3行まとめ
- •IBMが多言語埋め込みモデル公開
- •32Kコンテキストに対応
- •Apache 2.0で商用利用可能
詳細
背景
IBMが多言語テキスト埋め込みモデル「Granite Embedding Multilingual R2」をHugging Face上でApache 2.0ライセンスにて公開した。埋め込みモデルは検索やRAG(検索拡張生成)の精度を左右する基盤技術で、商用利用可能な高性能モデルへの需要が高まっている。
内容
R2は100Mパラメータ未満のサブ100Mクラスで、同サイズ帯における検索品質で最高水準を達成した。最大32Kトークンの長文コンテキストに対応し、多言語での検索・分類・クラスタリングといった用途に利用できる。Apache 2.0ライセンスにより、企業が自社サービスへ自由に組み込める。
今後の影響
軽量かつ多言語対応の埋め込みモデルがオープンに提供されることで、社内文書検索やRAG基盤の構築コストが下がる。OpenAIやCohereの商用埋め込みAPIに依存しない選択肢として、エンタープライズでの採用が進む。
なぜ重要か
商用利用可能な多言語埋め込みモデルが拡充し、企業の社内検索やRAG基盤構築の選択肢が広がる。
元記事を読む — Hugging Face Blog