Questa pagina descrive come ottenere la punteggiatura automatica nei risultati della trascrizione da Speech-to-Text. Quando attivi questa funzionalità, Speech-to-Text deduce automaticamente la presenza di punti, virgole e punti interrogativi nei dati audio e li aggiunge alla trascrizione.
Per impostazione predefinita, Speech-to-Text non include segni di punteggiatura nei risultati del riconoscimento vocale. Tuttavia, puoi richiedere che Speech-to-Text rilevi e inserisca automaticamente la punteggiatura nei risultati della trascrizione. Quando attivi la punteggiatura automatica, Speech-to-Text utilizzerà automaticamente la maiuscola per la prima lettera dopo ogni punto e punto interrogativo.
Per attivare la punteggiatura automatica, imposta il campo enableAutomaticPunctuation
su true
nei parametri RecognitionConfig
della richiesta. L'API Speech-to-Text supporta la punteggiatura automatica per tutti i metodi di riconoscimento vocale: speech:recognize
, speech:longrunningrecognize
e Streaming.
I seguenti esempi di codice mostrano come ottenere i dettagli automatici della punteggiatura in una richiesta di trascrizione.
Protocollo
Consulta l'endpoint APIspeech:recognize
per i dettagli completi.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST
e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST
mediante curl
. L'esempio utilizza il token di accesso per un account di servizio configurato per il progetto utilizzando Google Cloud CLI di Google Cloud. Per istruzioni sull'installazione dell'interfaccia alla gcloud CLI, sulla configurazione di un progetto con un account di servizio e sull'ottenimento di un token di accesso, consulta la guida rapida.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth print-access-token) \ https://speech.googleapis.com/v1/speech:recognize \ --data '{ "config": { "encoding":"FLAC", "sampleRateHertz": 16000, "languageCode": "en-US", "enableAutomaticPunctuation": true }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }'
Consulta la documentazione di riferimento RecognitionConfig
per ulteriori informazioni sulla configurazione del corpo della richiesta.
Se la richiesta ha esito positivo, il server restituisce un codice di stato HTTP 200 OK
e la risposta in formato JSON:
{ "results": [ { "alternatives": [ { "transcript": "How old is the Brooklyn Bridge?", "confidence": 0.98360395 } ] } ] }
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Go.
Per l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta la pagina Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione di C# nella pagina delle librerie client e consulta la documentazione di riferimento di Speech-to-Text per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e consulta la documentazione di riferimento di Speech-to-Text per Ruby.
Passaggi successivi
Scopri come effettuare richieste di trascrizione sincrone.