2026年5月19日 01:00
NVIDIA、ロボット動画生成AIにLoRA微調整機能を追加
Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation
3行まとめ
- •Cosmos Predict 2.5に微調整機能
- •LoRA/DoRAで効率的に学習可能
- •ロボット用動画生成を高精度化
詳細
背景
NVIDIAは、ロボット工学やフィジカルAI向けの基盤動画生成モデル「Cosmos Predict 2.5」のファインチューニング手法を公開した。汎用モデルを特定タスク向けに調整する際、全パラメータを更新するフルファインチューニングは計算コストが高いため、低ランク適応技術が必要とされていた。
内容
今回サポートされたのはLoRA(Low-Rank Adaptation)とDoRA(Weight-Decomposed Low-Rank Adaptation)の2手法。少ないパラメータ更新で効率的に学習でき、限られたGPUリソースでもロボット動作の動画生成精度を向上できる。Hugging Face上でブログとサンプル実装が提供されている。
今後の影響
ロボット開発者は自社データで動画生成モデルを調整しやすくなり、シミュレーション環境の構築や合成データ作成のコスト削減が見込まれる。フィジカルAI領域における基盤モデル活用の裾野が広がる。
なぜ重要か
ロボット動画生成モデルの微調整が容易になり、フィジカルAI開発の効率化が進む。
元記事を読む — Hugging Face Blog