Implementación del modelo

Usa la consola de Synthesize

Puedes integrar un modelo de voz clonado en tu aplicación para la síntesis de audio de TTS. Proporciona la VoiceCloningKey adecuada en Speech Studio para generar texto con tu voz clonada personalizada.

Usa la línea de comandos y la API de REST

Método HTTP y URL:

POST https://texttospeech.googleapis.com/v1beta1/text:synthesize

Cuerpo JSON de la solicitud:

Reemplaza voice_cloning_key por la VoiceCloningKey que se genera cuando se crea un modelo clonado.

{
  "input":{
    "text":"Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice":{
   "language_code":"en-US",
   "voice_clone":{
    "voice_cloning_key":"{voice_cloning_key}",
    }
  },
  "audioConfig":{
   "audioEncoding":"LINEAR16",
   "sample_rate_hertz":24000
  }
}

Guarda el cuerpo de la solicitud en un archivo llamado request.json, ejecuta el siguiente comando y reemplaza PROJECT_ID por el ID del proyecto:

curl -X POST \
-H "Authorization: Bearer "$(gcloud auth print-access-token) \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
https://texttospeech.googleapis.com/v1beta1/text:synthesize