L'aumento dell'adattamento vocale è una funzionalità facoltativa dell'adattamento vocale. La funzione turbo consente di aggiungere ponderazioni numeriche a parole e/o frasi in base alla frequenza con cui devono essere riconosciute nei dati audio.
Consigliamo di implementare il booster se 1) hai già implementato l'adattamento vocale e 2) dovresti adattare l'intensità dell'adattamento vocale ai risultati della trascrizione.
Consulta la pagina dei concetti relativi all'adattamento vocale per informazioni sulle best practice.
Il seguente esempio di codice mostra come inviare una richiesta utilizzando il booster di adattamento vocale.
RISPOSTA & RIGA CMD
Per maggiori dettagli sull'endpoint API, vedi speech:recognize
.
Prima di utilizzare qualsiasi dato della richiesta, apporta le seguenti sostituzioni:
- language-code: codice BCP-47 della lingua parlata nel clip audio.
- phrases-to-boost: frasi o frasi che vuoi che aumentino Speech-to-Text, sotto forma di un array di stringhe.
- storage-bucket: un bucket di Cloud Storage.
- input-audio: i dati audio che vuoi trascrivere.
URL e metodo HTTP:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
Corpo JSON della richiesta:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python
Passaggi successivi
- Scopri come utilizzare l'adattamento vocale in una richiesta di Speech-to-Text.
- Consulta l'elenco dei token della classe supportati.