AIニュース3行まとめ
2026年5月20日 02:45

Google、動画生成AI Gemini Omni発表

Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start

3行まとめ

  • Gemini Omniを新発表
  • 画像・音声・文章から動画生成
  • Omni Flashから提供開始

詳細

概要

Googleは新しいマルチモーダルAIモデル「Gemini Omni」を発表した。テキスト・画像・音声・動画を横断的に推論し、対話形式で動画の生成・編集ができる。提供開始は軽量版の「Omni Flash」からとなる。

内容

従来は別々のモデルで処理していた動画生成と編集を、単一の会話インターフェースで実現する。ユーザーは画像や音声、テキスト指示を組み合わせて動画を作成でき、複雑なツール操作を必要としない。マルチモーダル理解と生成を統合した点が特徴である。

今後の影響

OpenAIのSoraやRunwayなど動画生成分野で先行する競合に対し、Googleが本格的に追撃する構図となる。クリエイティブ業務や映像制作のワークフローに変化をもたらし、生成AI市場の競争を一段と激化させる位置付けの発表となる。

なぜ重要か

Googleが動画生成AI市場に本格参入し、SoraやRunwayとの競争が激化する。映像制作の生産性に直結する重要発表。

元記事を読む — TechCrunch AI

人気記事