カスタム音声の基本

概要

Cloud Text-to-Speech API にカスタム音声が追加されました。この機能により、独自のスタジオ品質の音声録音を使用してカスタム音声モデルをトレーニングし、独自の音声を作成できます。カスタム音声を使用して、Cloud Text-to-Speech API で音声を合成できます。

ユーザー提供のトレーニング音声データ

カスタム音声は、提供された音声データとできるだけ似て聴こえる Text-to-Speech(TTS)モデルを提供します。ユースケースが承認された後、Google は音声の録音のスクリプトを送ります。意図しているカスタム音声を表現する声優を選択して雇うことをおすすめします。トレーニング データとして使用するには、声優とスタジオ品質の音声を録音する必要があります(詳細については、トレーニング データの要件のページをご覧ください)。トレーニング データが Google 内部の品質チェックに合格しなかった場合は、特定された問題を修正した後に、データの再録または再提出が必要になります。

モデルのトレーニング

カスタム音声モデルのトレーニングには数週間かかります。

デプロイ

トレーニング後、Google はお客様が選択したプロジェクトにカスタム音声モデルをデプロイします。

次のステップ