Puoi migliorare l'accuratezza dei risultati della trascrizione ottenuti da Speech-to-Text utilizzando l'adattamento del modello. La funzionalità di adattamento del modello consente di specificare le parole e/o le frasi che Speech-to-Text deve riconoscere più spesso nei dati audio rispetto ad altre alternative che altrimenti potrebbero essere suggerite. L'adattamento del modello è particolarmente utile per migliorare l'accuratezza della trascrizione nei seguenti casi d'uso:
- L'audio contiene parole o frasi che potrebbero verificarsi di frequente.
- È probabile che l'audio contenga parole rare (come i nomi propri) o parole che non esistono nell'uso comune.
- L'audio contiene rumore o non è molto chiaro.
Per ulteriori informazioni sull'utilizzo di questa funzionalità, consulta Migliorare i risultati della trascrizione con l'adattamento del modello. Per informazioni sui limiti di frasi e caratteri per richiesta di adattamento del modello, consulta Quote e limiti. Non tutti i modelli supportano l'adattamento del parlato. Consulta la pagina Lingua supportata per scoprire quali modelli supportano l'adattamento.
Esempio di codice
L'adattamento vocale è una configurazione facoltativa di Speech-to-Text che puoi utilizzare per personalizzare i risultati della trascrizione in base alle tue esigenze. Per ulteriori informazioni sulla configurazione del corpo della richiesta di riconoscimento, consulta la documentazione di RecognitionConfig
.
Il seguente esempio di codice mostra come migliorare l'accuratezza della trascrizione utilizzando una risorsa SpeechAdaptation:
PhraseSet
,
CustomClass
,
e l'aumento dell'adattamento del modello.
Per utilizzare un PhraseSet
o un CustomClass
nelle richieste future, prendi nota della sua risorsa name
, restituita nella risposta quando crei la risorsa.
Per un elenco dei tipi predefiniti disponibili per la tua lingua, consulta Token di tipo supportati.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.