Crea audio dal testo utilizzando la riga di comando

Questo documento ti guida nella procedura per presentare una richiesta a Text-to-Speech utilizzando la riga di comando. Per saperne di più sulle basi di Cloud Text-to-Speech, leggi Nozioni di base su Text-to-Speech.

Prima di iniziare

Prima di poter inviare una richiesta all'API Text-to-Speech, devi aver completato le azioni seguenti. Consulta le prima di iniziare per maggiori dettagli.

  • Abilita Text-to-Speech in un progetto Google Cloud.
  • Assicurati che la fatturazione sia abilitata per Text-to-Speech.
  • Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

    gcloud init

Sintetizza audio dal testo

Puoi convertire il testo in audio effettuando una richiesta POST HTTP all' Endpoint https://texttospeech.googleapis.com/v1/text:synthesize. Nel il corpo del comando POST, specifica il tipo di voce da sintetizzare sezione di configurazione voice, specifica il testo da sintetizzare nel campo text della sezione input e specifica il tipo di audio da creare nella sezione audioConfig.

  1. Esegui la richiesta REST riportata di seguito alla riga di comando per sintetizzare l'audio da testo utilizzando Text-to-Speech. Il comando utilizza gcloud auth application-default print-access-token per recuperare un'autorizzazione token per la richiesta.

    Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

    • PROJECT_ID: l'ID alfanumerico del tuo progetto Google Cloud.

    Metodo HTTP e URL:

    POST https://texttospeech.googleapis.com/v1/text:synthesize

    Corpo JSON della richiesta:

    {
      "input": {
        "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
      },
      "voice": {
        "languageCode": "en-gb",
        "name": "en-GB-Standard-A",
        "ssmlGender": "FEMALE"
      },
      "audioConfig": {
        "audioEncoding": "MP3"
      }
    }
    

    Per inviare la richiesta, espandi una delle seguenti opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
    }
    

  2. L'output JSON per il comando REST contiene l'audio sintetizzato in con codifica Base64. Copia i contenuti del campo audioContent in un nuovo file denominato synthesize-output-base64.txt. Il nuovo file avrà un aspetto simile ad esempio:

    //NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
    ...
    VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
    
  3. Decodifica i contenuti del file synthesize-output-base64.txt in un nuovo file denominato synthesized-audio.mp3. Per informazioni sulla decodifica in base64, consulta Decodifica dei contenuti audio con codifica Base64.

    Linux

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 utilizzando il flag -d:

        $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
    

    Mac OSX

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:

        $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
    

    Windows

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando il metodo Comando certutil.

       certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
    
  4. Riproduci i contenuti di synthesized-audio.mp3 in un'applicazione audio o su un dispositivo audio. Puoi anche aprire synthesized-audio.mp3 in Chrome browser per riprodurre l'audio andando alla cartella che contiene il file, ad esempio file://my_file_path/synthesized-audio.mp3

Esegui la pulizia

Per evitare addebiti inutili per Google Cloud Platform, utilizza il metodo Console Google Cloud per eliminare il progetto se non ti serve.

Passaggi successivi

  • Scopri di più su Cloud Text-to-Speech leggendo il di base.
  • Esamina l'elenco di voci disponibili che puoi utilizzare per la sintesi vocale.