Sintetizza il parlato con lo streaming bidirezionale
Questo documento illustra la procedura di sintesi dell'audio tramite streaming bidirezionale.
Lo streaming bidirezionale ti consente di inviare input di testo e ricevere dati audio contemporaneamente. Ciò significa che puoi iniziare a sintetizzare il parlato prima che il testo di input completo venga inviato, il che riduce la latenza e consente interazioni in tempo reale. Gli assistenti vocali e i giochi interattivi usano lo streaming bidirezionale per creare applicazioni più dinamiche e reattive.
Per saperne di più sui concetti fondamentali di Text-to-Speech, leggi Nozioni di base su Text-to-Speech.
Prima di iniziare
Prima di poter inviare una richiesta all'API Text-to-Speech, devi aver completato le seguenti azioni. Consulta le prima di iniziare per maggiori dettagli.
- Attivare Text-to-Speech in un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Text-to-Speech.
-
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Sintetizza il parlato con lo streaming bidirezionale
installa la libreria client
Python
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Python.
pip install --upgrade google-cloud-texttospeech
Invia uno stream di testo e ricevi uno stream di audio
L'API accetta un flusso di richieste di tipo StreamingSynthesizeRequest
,
che contengono StreamingSynthesisInput
o StreamingSynthesizeConfig
.
Prima di inviare uno stream StreamingSynthesizeRequest
con
StreamingSynthesisInput
, che fornisce l'input di testo, invia esattamente uno
StreamingSynthesizeRequest
con StreamingSynthesizeConfig
.
Lo streaming di Text-to-Speech è compatibile solo con le voci del percorso.
Python
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Python.
Esegui la pulizia
Per evitare addebiti inutili per Google Cloud Platform, utilizza il metodo Console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Scopri di più su Cloud Text-to-Speech leggendo il di base.
- Esamina l'elenco di voci disponibili che puoi utilizzare per la sintesi vocale.