2026年6月10日 03:57

GoogleがGemini音声同時翻訳を発表

Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation

3行まとめ

•Gemini 3.5に音声同時翻訳機能を追加
•話者の声色・速度・音程を保持
•SynthID電子透かしで真偽を識別

詳細

発表内容

GoogleはGemini 3.5を基盤とする音声同時翻訳機能「Live Translate」を発表した。話した内容をリアルタイムで別の言語の音声へ変換し、会話のやり取りをそのまま翻訳できる。従来のテキスト翻訳と異なり、音声入力から音声出力までを一貫して処理する点が特徴で、異なる言語を話す相手とのコミュニケーションを想定している。

技術的特徴

Live Translateは翻訳後の音声でも、話者本来の声色・話す速度・音程といった声の特徴を保持する。機械的な合成音声ではなく、元の話者の話し方に近い形で相手に伝わるため、対面に近い自然な会話体験を目指している。声のニュアンスが保たれることで、感情や意図が伝わりやすくなる。

セキュリティ対策

生成される音声にはGoogleの電子透かし技術「SynthID」が埋め込まれる。これにより、AIが生成・変換した音声であることを後から識別でき、なりすましや偽情報への悪用を抑止する狙いがある。音声生成AIの悪用が懸念される中での対応となる。

なぜ重要か

声の特徴を保ったまま音声同士をリアルタイム翻訳でき、言語の壁を越えた対面コミュニケーションの実用性が高まる。

翻訳音声・音楽 Google Gemini アップデート

元記事を読む — Ars Technica AI