Chirp 3: Voces en HD

Text-to-Speech Chirp 3: Las voces HD se basan en nuestra nueva generación de modelos de LLM que ofrecen una voz realista y emocionalmente resonante.

Opciones de voz

Nombre Género Demostración
Aoede Mujer
Puck Hombre
Caronte Hombre
Kore Mujer
Fenrir Hombre
Leda Mujer
Orus Hombre
Zephyr Mujer

Formatos de salida compatibles

El formato de respuesta predeterminado es LINEAR16, pero también se admiten los siguientes:

  • Transmisión: OGG_OPUS y PCM
  • No transmisión: ALAW, MULAW, MP3, OGG_OPUS, PCM

Regiones admitidas

La versión preliminar actual admite las siguientes regiones: asia-southeast1, global, eu y us.

Idiomas compatibles

Todos los idiomas y voces compatibles se catalogan en la página Idiomas y voces compatibles.

Preguntas frecuentes

Preguntas frecuentes y sus respuestas:

¿Cómo controlo el ritmo y el flujo para mejorar el resultado de la voz?

Puedes usar nuestras sugerencias para solucionar problemas para mejorar la instrucción de texto y, así, mejorar la salida de voz.

¿Cómo accedo a las voces en los idiomas admitidos?

Los nombres de las voces siguen un formato específico, lo que permite el uso en todos los idiomas admitidos especificando la voz de forma única. El formato sigue \<locale\>-\<model\>-\<voice\>. Por ejemplo, para usar la voz de Kore para inglés (Estados Unidos) con el modelo de voces de Chirp 3: HD, debes especificarla como en-US-Chirp3-HD-Kore.