#音声・音楽
29 件の記事
注目5月7日
OpenAIがリアルタイム音声モデル3種を新たにAPI公開
- •OpenAIが音声AI新モデル3種をAPI提供開始
- •推論・翻訳・文字起こしをリアルタイム処理
- •GPT-5級の推論力を持つ音声対話が可能に
5月7日
Parloaが OpenAI活用の音声AIカスタマーサービスを展開
- •ParloaがOpenAIモデルで音声AI接客を構築
- •企業向けに設計・シミュレーション・展開を提供
- •リアルタイム対話の信頼性向上が特徴
5月6日
Open ASR Leaderboard、ベンチマーク対策に非公開データ導入
- •Hugging Faceが音声認識評価を刷新
- •非公開データセットで過学習を防止
- •モデルの真の汎化性能を測定可能に
続きを読む →
5月2日
xAIが1分音声クローン機能をAPIで公開
- •xAIが1分の音声でクローンを生成する機能を公開
- •開発者がGrok TTS APIで独自音声を利用可能に
- •Grok STT/TTS APIに続く音声技術の拡充
4月29日
Amazonが商品ページにAI音声Q&A機能を追加
- •Amazon商品ページにAI音声Q&A機能を導入
- •「Join the chat」で音声回答を受け取れる
- •EC体験に音声AIを組み込んだ新機能
4月22日
TCL、AI電子ノート「Note A1 NXTPAPER」発売
- •TCLが5月15日にAI搭載電子ノートを発売
- •手書きテキスト化・会議議事録生成機能を搭載
- •11.5インチ・Android 15・8GB RAM・256GB
4月21日
Google Vidsに会話音声30種類を追加
- •Google VidsのAI音声に30種類の会話音声を追加
- •Google Workspace向け動画作成ツールの機能強化
- •ナレーション表現の幅が広がり動画制作が柔軟に
4月21日
Deezer新着楽曲の44%がAI生成、大半が不正ストリーム
- •Deezerの新着楽曲44%がAI生成と判明
- •AI楽曲の大半は不正ストリームで収益停止
- •音楽業界で不正対策の整備が急務に
続きを読む →
4月16日
DeepLがリアルタイム音声翻訳「Voice-to-Voice」を発表
- •DeepLが音声→音声リアルタイム翻訳を発表
- •発表会でライブデモを実施し注目を集める
- •多言語会議や商談の言語障壁を解消へ
4月16日
Gemini 3.1 Flash TTS、Google製品全体に展開
- •Gemini 3.1 Flash TTSが正式リリース
- •Google製品全体で音声合成機能を提供
- •次世代の表現力豊かなAI音声技術