このページは Cloud Translation API によって翻訳されました。

Custom Voice の基本

概要

Cloud Text-to-Speech API にカスタム音声が追加されました。この機能により、独自のスタジオ品質の音声録音を使用してカスタム音声モデルをトレーニングし、独自の音声を作成できます。カスタム音声を使用して、Cloud Text-to-Speech API で音声を合成できます。

ユーザー提供のトレーニング音声データ

カスタム音声は、提供された音声データとできるだけ似て聴こえるテキスト読み上げデータ（TTS）を提供します。ユースケースが承認された後、Google は音声の録音のスクリプトを送ります。意図しているカスタム音声を表現する声優を選択して雇うことをおすすめします。トレーニングデータとして使用するには、声優とスタジオ品質の音声を録音する必要があります（詳細については、トレーニングデータの要件のページをご覧ください）。トレーニングデータが Google 内部の品質チェックに合格しなかった場合は、特定された問題を修正した後に、データの再録または再提出が必要になります。

モデルのトレーニング

カスタム音声モデルのトレーニングには数週間かかります。

デプロイ

トレーニング後、Google はお客様が選択したプロジェクトにカスタム音声モデルをデプロイします。

次のステップ

クイックスタートを使用して、カスタム音声機能を実装します。