2026年4月14日 02:31

1枚の写真から45分のリップシンク動画を生成するAIモデル

New AI model generates 45-minute lip-synced video from one photo and runs in real time

3行まとめ

•LPM 1.0が1枚の写真からリアルタイムで動画生成
•最大45分のリップシンク・表情・感情表現に対応
•現時点では研究プロジェクトの段階

詳細

概要

新たなAIモデル「LPM 1.0」が発表された。このモデルは1枚の静止画像から、リップシンク（口の動きと音声の同期）、表情変化、感情反応を備えたリアルタイム動画を生成する能力を持つ。最大45分という長尺の動画生成に対応している点が従来技術との大きな差別化ポイントとなっている。

技術的特徴

LPM 1.0は単一の人物写真を入力とし、リアルタイムで動作することが特徴だ。従来の類似技術では短時間のクリップ生成にとどまるケースが多かったが、本モデルは長時間にわたる連続した自然な顔アニメーションを実現している。リップシンクの精度に加え、感情的なリアクションや細かな表情の変化も再現できるとされており、アバターや仮想キャラクターの生成用途への応用が想定される。

現状と今後

現時点ではこのモデルは研究プロジェクトの段階にあり、一般への公開や商用提供は行われていない。ただし、こうした技術が実用化されれば、バーチャルアシスタント、教育コンテンツ、エンターテインメント分野に幅広く活用される一方、ディープフェイクによる悪用リスクも高まるため、安全性や倫理面での議論が今後求められる。

なぜ重要か

1枚の写真から長尺動画を生成する技術は、コンテンツ制作を大きく変える。ディープフェイク悪用リスクも同時に高まる。

動画生成研究・論文クリエイティブセキュリティ・プライバシー新サービス

元記事を読む — The Decoder

← ニュース一覧