Crea audio dal testo utilizzando la riga di comando

Questo documento ti guida nella procedura per presentare una richiesta a Text-to-Speech utilizzando la riga di comando. Per saperne di più sulle basi di Cloud Text-to-Speech, leggi Nozioni di base su Text-to-Speech.

Prima di iniziare

Prima di poter inviare una richiesta all'API Text-to-Speech, devi aver completato le azioni seguenti. Consulta le prima di iniziare per maggiori dettagli.

Sintetizza audio dal testo

Puoi convertire il testo in audio effettuando una richiesta POST HTTP all' Endpoint https://texttospeech.googleapis.com/v1/text:synthesize. Nella il corpo del comando POST, specifica il tipo di voce da sintetizzare sezione di configurazione voice, specifica il testo da sintetizzare nel campo text della sezione input e specifica il tipo di audio da creare nella sezione audioConfig.

  1. Esegui la richiesta REST riportata di seguito alla riga di comando per sintetizzare l'audio da testo utilizzando Text-to-Speech. Il comando utilizza gcloud auth application-default print-access-token per recuperare un'autorizzazione token per la richiesta.

    Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

    • PROJECT_ID: l'ID alfanumerico del tuo progetto Google Cloud.

    Metodo HTTP e URL:

    POST https://texttospeech.googleapis.com/v1/text:synthesize

    Corpo JSON della richiesta:

    {
      "input": {
        "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
      },
      "voice": {
        "languageCode": "en-gb",
        "name": "en-GB-Standard-A",
        "ssmlGender": "FEMALE"
      },
      "audioConfig": {
        "audioEncoding": "MP3"
      }
    }
    

    Per inviare la richiesta, espandi una delle seguenti opzioni:

    Dovresti ricevere una risposta JSON simile alla seguente:

    {
      "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
    }
    

  2. L'output JSON per il comando REST contiene l'audio sintetizzato in con codifica Base64. Copia i contenuti del campo audioContent in un nuovo file denominato synthesize-output-base64.txt. Il nuovo file avrà un aspetto simile ad esempio:

    //NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
    ...
    VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
    
  3. Decodifica i contenuti del file synthesize-output-base64.txt in un nuovo file denominato synthesized-audio.mp3. Per informazioni sulla decodifica in base64, consulta Decodifica dei contenuti audio con codifica Base64.

    Linux

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 utilizzando il flag -d:

        $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
    

    Mac OSX

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:

        $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
    

    Windows

    1. Copia solo i contenuti con codifica Base64 in un file di testo.

    2. Decodifica il file di testo di origine utilizzando il metodo Comando certutil.

       certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
    
  4. Riproduci i contenuti di synthesized-audio.mp3 in un'applicazione audio o su un dispositivo audio. Puoi anche aprire synthesized-audio.mp3 in Chrome browser per riprodurre l'audio andando alla cartella che contiene il file, ad esempio file://my_file_path/synthesized-audio.mp3

Esegui la pulizia

Per evitare addebiti inutili per Google Cloud Platform, utilizza il metodo Console Google Cloud per eliminare il progetto se non ti serve.

Passaggi successivi

  • Scopri di più su Cloud Text-to-Speech leggendo il di base.
  • Esamina l'elenco di voci disponibili che puoi utilizzare per la sintesi vocale.