La mejora de la adaptación de voz es una función opcional de la adaptación de voz. La mejora te permite agregar pesos numéricos a las palabras o frases según la frecuencia con la que se deben reconocer en tus datos de audio.
Te recomendamos que implementes la mejora si, 1) ya implementaste la adaptación de voz y, 2) deseas ajustar la intensidad de los efectos de la adaptación de voz en los resultados de la transcripción.
Consulta la página de conceptos de adaptación de voz para obtener información sobre las prácticas recomendadas de la adaptación de voz y la mejora de la adaptación de voz.
En la siguiente muestra de código, se indica cómo enviar una solicitud con la mejora de la adaptación de voz.
LÍNEA DE REST Y CMD
Para obtener detalles sobre el extremo de la API, consulta speech:recognize
.
Antes de usar cualquiera de los datos de solicitud siguientes, realiza los siguientes reemplazos:
- language-code: Es el código BCP-47 del idioma que se habla en el clip de audio.
- phrases-to-boost: Es la frase o las frases que deseas que Speech-to-Text priorice, como un arreglo de strings.
- storage-bucket: Es un depósito de Cloud Storage.
- input-audio: Son los datos de audio que deseas transcribir.
Método HTTP y URL:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
Cuerpo JSON de la solicitud:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python
¿Qué sigue?
- En Usa la adaptación de voz, obtén más información sobre cómo hacerlo en una solicitud a Speech-to-Text.
- Revisa la lista en Tokens de clase admitidos.