2026年5月20日 02:45

Google、動画生成AI Gemini Omni発表

Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start

3行まとめ

Googleは新しいマルチモーダルAIモデル「Gemini Omni」を発表した。テキスト・画像・音声・動画を横断的に推論し、対話形式で動画の生成・編集ができる。提供開始は軽量版の「Omni Flash」からとなる。

従来は別々のモデルで処理していた動画生成と編集を、単一の会話インターフェースで実現する。ユーザーは画像や音声、テキスト指示を組み合わせて動画を作成でき、複雑なツール操作を必要としない。マルチモーダル理解と生成を統合した点が特徴である。

OpenAIのSoraやRunwayなど動画生成分野で先行する競合に対し、Googleが本格的に追撃する構図となる。クリエイティブ業務や映像制作のワークフローに変化をもたらし、生成AI市場の競争を一段と激化させる位置付けの発表となる。

Googleが動画生成AI市場に本格参入し、SoraやRunwayとの競争が激化する。映像制作の生産性に直結する重要発表。