Puoi migliorare l'accuratezza dei risultati della trascrizione ottenuti da Speech-to-Text utilizzando l'adattamento del modello. La funzionalità di adattamento del modello consente di specificare le parole e/o le frasi che Speech-to-Text deve riconoscere più spesso nei dati audio rispetto ad altre alternative che altrimenti potrebbero essere suggerite. L'adattamento del modello è particolarmente utile per migliorare l'accuratezza della trascrizione nei seguenti casi d'uso:
- L'audio contiene parole o frasi che potrebbero verificarsi di frequente.
- È probabile che l'audio contenga parole rare (come i nomi propri) o parole che non esistono nell'uso comune.
- L'audio contiene rumore o non è molto chiaro.
Per ulteriori informazioni sull'utilizzo di questa funzionalità, consulta Migliorare i risultati della trascrizione con l'adattamento del modello. Per informazioni sui limiti di frasi e caratteri per richiesta di adattamento del modello, consulta Quote e limiti. Non tutti i modelli supportano l'adattamento del parlato. Consulta la pagina Lingue supportate per scoprire quali modelli supportano l'adattamento.
Esempio di codice
L'adattamento vocale è una configurazione facoltativa di Speech-to-Text che puoi utilizzare per personalizzare i risultati della trascrizione in base alle tue esigenze. Consulta la documentazione di RecognitionConfig
per ulteriori informazioni sulla configurazione del corpo della richiesta di riconoscimento.
Il seguente esempio di codice mostra come migliorare l'accuratezza della trascrizione utilizzando una risorsa SpeechAdaptation:
PhraseSet
,
CustomClass
,
e l'aumento dell'adattamento del modello.
Per utilizzare un PhraseSet
o un CustomClass
nelle richieste future, prendi nota della sua risorsa name
, restituita nella risposta quando crei la risorsa.
Per un elenco dei tipi predefiniti disponibili per la tua lingua, consulta Token di tipo supportati.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.