2026年5月20日 02:45
Google、動画生成AI Gemini Omni発表
Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start
3行まとめ
- •Gemini Omniを新発表
- •画像・音声・文章から動画生成
- •Omni Flashから提供開始
詳細
概要
Googleは新しいマルチモーダルAIモデル「Gemini Omni」を発表した。テキスト・画像・音声・動画を横断的に推論し、対話形式で動画の生成・編集ができる。提供開始は軽量版の「Omni Flash」からとなる。
内容
従来は別々のモデルで処理していた動画生成と編集を、単一の会話インターフェースで実現する。ユーザーは画像や音声、テキスト指示を組み合わせて動画を作成でき、複雑なツール操作を必要としない。マルチモーダル理解と生成を統合した点が特徴である。
今後の影響
OpenAIのSoraやRunwayなど動画生成分野で先行する競合に対し、Googleが本格的に追撃する構図となる。クリエイティブ業務や映像制作のワークフローに変化をもたらし、生成AI市場の競争を一段と激化させる位置付けの発表となる。
なぜ重要か
Googleが動画生成AI市場に本格参入し、SoraやRunwayとの競争が激化する。映像制作の生産性に直結する重要発表。
元記事を読む — TechCrunch AI