2026年5月2日 21:14
xAIが1分音声クローン機能をAPIで公開
xAI's new Custom Voices feature turns a minute of speech into a usable voice clone
3行まとめ
- •xAIが1分の音声でクローンを生成する機能を公開
- •開発者がGrok TTS APIで独自音声を利用可能に
- •Grok STT/TTS APIに続く音声技術の拡充
詳細
背景
xAI(イーロン・マスクが設立したAI企業)は、音声技術分野への展開を進めており、Grok Speech-to-Text(音声認識)APIおよびGrok Text-to-Speech(音声合成)APIを開発者向けにリリースした。これらのAPIは、開発者がAIアプリケーションに音声機能を組み込む基盤として提供されており、今回の「Custom Voices」機能はその一環として追加された。
内容
「Custom Voices」では、わずか1分間の音声サンプルを提供するだけで、AIアプリケーションに組み込める音声クローンを生成できる。開発者はこの機能を使って自分自身の声をGrok TTS APIに統合し、音声アプリケーションにパーソナライズされた音声を搭載できる。同機能はGrok STT/TTS APIのリリースを基盤として開発されており、xAIの音声技術プラットフォームを構成している。
活用範囲
この機能により、音声アシスタント、ポッドキャスト生成、カスタマーサポートシステムなど、多様なAIアプリケーションに個別の声を容易に組み込めるようになった。xAIはSTT・TTS・音声クローンAPIを組み合わせた開発者向けの音声技術スイートの提供を進めている。
なぜ重要か
xAIが1分の音声でクローンを作成できるAPIを公開し、音声AI開発の参入障壁が下がった。
元記事を読む — The Decoder