Preguntas frecuentes

¿Admite Voz personalizada SSML?

  • La función de voz personalizada admite todas las funciones de SSML, excepto el énfasis (en la hoja de ruta) y la prosodia del tono (próximamente).

¿Qué tan larga puede ser una oración de SSML?

  • Te sugerimos evitar las etiquetas de oraciones SSML y permitirnos inferir la estructura de la oración. Si debes usar oraciones de SSML, generaremos hasta 30 segundos de audio por oración de SSML.

  • Cada oración puede contener como máximo 480 fonemas. Divide las oraciones más largas con puntuación (p. ej., puntos) según sea necesario.

¿Habrá diferencias de voz entre dos versiones de un modelo Voz personalizada?

  • Se pueden esperar algunos cambios entre dos versiones de un modelo de Voz personalizada a medida que nuestra tecnología evoluciona, a pesar de que los modelos se entrenan con los mismos datos de audio. Si te encuentras con este problema, envíanos algunas muestras para que podamos investigar.

¿Dónde puedo informar problemas a Google?