Modellbereitstellung

Synthesize-Konsole verwenden

Sie können ein geklontes Sprachmodell in Ihre Anwendung für die TTS-Audiosynthese einbinden. Geben Sie in Speech Studio den entsprechenden VoiceCloningKey an, um Text mit Ihrer benutzerdefinierten geklonten Stimme zu generieren.

Befehlszeile und REST API verwenden

HTTP-Methode und URL:

POST https://texttospeech.googleapis.com/v1beta1/text:synthesize

JSON-Text anfordern:

Ersetzen Sie voice_cloning_key durch den VoiceCloningKey, der beim Erstellen eines geklonten Modells generiert wurde.

{
  "input":{
    "text":"Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice":{
   "language_code":"en-US",
   "voice_clone":{
    "voice_cloning_key":"{voice_cloning_key}",
    }
  },
  "audioConfig":{
   "audioEncoding":"LINEAR16",
   "sample_rate_hertz":24000
  }
}

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus. Ersetzen Sie dabei PROJECT_ID durch Ihre Projekt-ID:

curl -X POST \
-H "Authorization: Bearer "$(gcloud auth print-access-token) \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
https://texttospeech.googleapis.com/v1beta1/text:synthesize