Perplexity
テキスト読み上げ
人間のように表現豊かで自然なテキスト読み上げ
フルオーディオAIプラットフォームを体験
Eleven v3に出会う — 最も表現力豊かなテキスト読み上げモデル
これまでにないダイナミックな会話、感情のニュアンス、豊かな表現を体験してください。Eleven v3では以下が可能です: - インラインオーディオタグでトーンとタイミングを指示 - 複数の話者による自然な対話を生成 - 70以上の言語で人間らしい音声で大規模にローカライズ スタジアムの歓声からコメディのタイミング、表現豊かなストーリーテリングから混沌としたグループのやり取りまで、v3は音声作成を完全にコントロール可能で、深く人間的で、間違いなくリアルにします。
感情とコンテキストを考慮したAIボイス
音声AIは、テキストの感情的な手がかりに反応します。広範な文脈を踏まえて、各コンテンツを適切なかたちで提供します。AIボイスは、コンテンツを読み上げるときに、豊かな感情を表現し、かつ論理的な誤りを避けることができます。
スタジオ品質のビデオボイスオーバー
声を選び、スクリプトをアップロードして、ソーシャルメディア、コマーシャル、映画などの高品質なボイスオーバーを生成。タイミングを調整し、複数の話者を割り当て、ボイスオーバースタジオでサウンドエフェクトを追加できます。
多言語スピーチ合成
すべてのAI音声は70以上の言語を話せます。多言語対応のテキスト読み上げモデルを使って、国際的なオーディエンスとつながり、言語の壁を越え、新しい市場での機会を開拓しましょう
モデル概要
v3 (ALPHA)
最も高度で表現力豊かなモデル。音声タグで感情を精密にコントロール可能。70以上の言語でストーリーテリング、ゲーム、メディア制作に最適。
多言語 v2 (TTS)
最もリアルで感情豊かなテキスト読み上げモデル。29言語に対応し、ボイスオーバー、オーディオブック、ポストプロダクション、コンテンツ制作に最適。
Flash v2 (TTS)
英語専用の低遅延TTSモデル。スピードが重要なデベロッパーや単一言語のユースケースに最適。Turbo v2.5と同等のパフォーマンス。
Flash v2.5 (TTS)
70以上の言語に対応した高品質で低遅延のTTSモデル。スピードが重要で非英語の言語が必要なデベロッパーのユースケースに最適。
ユースケース
ビデオボイスオーバー
AIテキスト読み上げを使用して、ビデオ、テレビ番組、アニメーションの高品質なボイスオーバーを制作。人間のボイスアクターが不要で、制作を迅速化。
ポッドキャスト
AIテキスト読み上げを使用して、プロフェッショナルなナレーションのポッドキャストを作成し、手動録音の時間を短縮。
アクセシビリティ
ウェブサイトやアプリにテキスト読み上げを統合し、視覚障害者や読書困難なユーザーが情報にアクセスしやすくするための音声版コンテンツを提供。