2026年6月10日 03:57
GoogleがGemini音声同時翻訳を発表
Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation
3行まとめ
- •Gemini 3.5に音声同時翻訳機能を追加
- •話者の声色・速度・音程を保持
- •SynthID電子透かしで真偽を識別
詳細
発表内容
GoogleはGemini 3.5を基盤とする音声同時翻訳機能「Live Translate」を発表した。話した内容をリアルタイムで別の言語の音声へ変換し、会話のやり取りをそのまま翻訳できる。従来のテキスト翻訳と異なり、音声入力から音声出力までを一貫して処理する点が特徴で、異なる言語を話す相手とのコミュニケーションを想定している。
技術的特徴
Live Translateは翻訳後の音声でも、話者本来の声色・話す速度・音程といった声の特徴を保持する。機械的な合成音声ではなく、元の話者の話し方に近い形で相手に伝わるため、対面に近い自然な会話体験を目指している。声のニュアンスが保たれることで、感情や意図が伝わりやすくなる。
セキュリティ対策
生成される音声にはGoogleの電子透かし技術「SynthID」が埋め込まれる。これにより、AIが生成・変換した音声であることを後から識別でき、なりすましや偽情報への悪用を抑止する狙いがある。音声生成AIの悪用が懸念される中での対応となる。
なぜ重要か
声の特徴を保ったまま音声同士をリアルタイム翻訳でき、言語の壁を越えた対面コミュニケーションの実用性が高まる。
元記事を読む — Ars Technica AI