AIニュース3行まとめ
2026年5月2日 21:14

xAIが1分音声クローン機能をAPIで公開

xAI's new Custom Voices feature turns a minute of speech into a usable voice clone

3行まとめ

  • xAIが1分の音声でクローンを生成する機能を公開
  • 開発者がGrok TTS APIで独自音声を利用可能に
  • Grok STT/TTS APIに続く音声技術の拡充

詳細

背景

xAI(イーロン・マスクが設立したAI企業)は、音声技術分野への展開を進めており、Grok Speech-to-Text(音声認識)APIおよびGrok Text-to-Speech(音声合成)APIを開発者向けにリリースした。これらのAPIは、開発者がAIアプリケーションに音声機能を組み込む基盤として提供されており、今回の「Custom Voices」機能はその一環として追加された。

内容

「Custom Voices」では、わずか1分間の音声サンプルを提供するだけで、AIアプリケーションに組み込める音声クローンを生成できる。開発者はこの機能を使って自分自身の声をGrok TTS APIに統合し、音声アプリケーションにパーソナライズされた音声を搭載できる。同機能はGrok STT/TTS APIのリリースを基盤として開発されており、xAIの音声技術プラットフォームを構成している。

活用範囲

この機能により、音声アシスタント、ポッドキャスト生成、カスタマーサポートシステムなど、多様なAIアプリケーションに個別の声を容易に組み込めるようになった。xAIはSTT・TTS・音声クローンAPIを組み合わせた開発者向けの音声技術スイートの提供を進めている。

なぜ重要か

xAIが1分の音声でクローンを作成できるAPIを公開し、音声AI開発の参入障壁が下がった。

元記事を読む — The Decoder

人気記事