音声アプリケーション用のカスタム音声モデルを作成する
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Text-to-Speech UI 内で独自のカスタム音声モデルを作成できます。
前提条件
- Text-to-Speech API を有効にします。
- トレーニング データの要件に沿って音声を録音します。
- Cloud Storage バケットを作成します。
- 音声ファイルを、トレーニング データの要件で指定されている形式(0001.wav、0002.wav、0200.wav など)で新しいバケットにアップロードします。
新しいカスタム音声モデルのトレーニング
- Text-to-Speech UI で [カスタム音声] タブを開きます。
- 画面上部の [作成] をクリックします。
- 音声モデルに名前を付けます。
- サポートされている言語のプルダウンから言語を指定します。
- 前提条件のステップ 4 のバケット構成から適切な CSV ファイルを選択します。
- ナレーターの同意書をアップロードします。例: 「私(名前)は、合成カスタム音声の作成に自分の声が使用されることに同意します。」
- [作成] をクリックして、モデルの作成を開始します。モデルの作成には最長で 3 日かかります。
- トレーニング ジョブのステータスを確認するには、右上のナビゲーション ヘッダーでコンソール通知を確認します。
次のステップ
モデルのトレーニングが完了すると、コンソールに出力音声ファイルのサンプルが表示されます。これらのファイルを使用して、モデルの品質の初期評価を行うことができます。要件を満たしている場合は、モデルのデプロイのサポートについてセールスチームにお問い合わせください。デプロイには 2~3 週間かかるため、迅速に評価して早めに連絡することをおすすめします。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-04-25 UTC。
[{
"type": "thumb-down",
"id": "hardToUnderstand",
"label":"Hard to understand"
},{
"type": "thumb-down",
"id": "incorrectInformationOrSampleCode",
"label":"Incorrect information or sample code"
},{
"type": "thumb-down",
"id": "missingTheInformationSamplesINeed",
"label":"Missing the information/samples I need"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻訳に関する問題"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"その他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"わかりやすい"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"問題の解決に役立った"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"その他"
}]