2026年6月8日 14:18
Google、Gemma 4のQAT版を公開
3行まとめ
- •GoogleがGemma 4のQAT版を公開
- •メモリ要件を大幅に削減した設計
- •手元のデバイスで高性能に動作
詳細
背景
Googleはオープンに利用できる小型高性能モデル「Gemma 4」を展開しており、今回は量子化認識トレーニング(QAT)を適用したモデルを新たに公開した。QATは学習の段階から量子化(数値を低ビットで表現してデータ量を圧縮する処理)を織り込むことで、モデルを圧縮しても精度の低下を抑えられる学習手法である。従来は学習後に圧縮するため精度が落ちやすかったが、QATはその課題を改善する。
内容
公開されたQATモデルはメモリ要件を大幅に削減しており、潤沢なメモリを持たない一般的なデバイス上でも動作するよう設計されている。これにより、高価な専用ハードウェアを用意しなくても、手元のPCなどでモデルの性能を最大限に引き出せるようになる。
今後の影響
メモリ消費を抑えたモデルが整備されることで、クラウドに依存せずローカル環境でAIを動かす選択肢が広がる。プライバシー保護やコスト削減を重視する開発者・企業にとって、オンデバイスでの生成AI活用が一段と現実的な手段になる。
なぜ重要か
メモリを抑えたモデルで専用ハードなしに手元のPCでもAIを動かせる。ローカル活用の選択肢が広がる。
元記事を読む — AI Watch