Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Trascrivi voce in testo utilizzando le librerie client

Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text nel tuo linguaggio di programmazione preferito utilizzando le librerie client di Google Cloud.

Speech-to-Text consente l'integrazione semplice delle tecnologie di riconoscimento vocale di Google nelle applicazioni per sviluppatori. Puoi inviare i dati audio all'API Speech-to-Text, che a sua volta restituisce una trascrizione del testo di quel file audio. Per ulteriori informazioni sul servizio, consulta le nozioni di base su Speech-to-Text.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  4. Abilita le API Speech-to-Text.

    Abilita le API

  5. Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Individua la riga contenente il tuo indirizzo email nella colonna Entità.

      Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.

    4. Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Inserisci il tuo indirizzo email nel campo Nuove entità.
    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
    7. Fai clic su Salva.
  6. Installa Google Cloud CLI.
  7. Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:

    gcloud init
  8. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  9. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  10. Abilita le API Speech-to-Text.

    Abilita le API

  11. Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Individua la riga contenente il tuo indirizzo email nella colonna Entità.

      Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.

    4. Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Inserisci il tuo indirizzo email nel campo Nuove entità.
    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
    7. Fai clic su Salva.
  12. Installa Google Cloud CLI.
  13. Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:

    gcloud init

Configura l'autenticazione

Le librerie client possono utilizzare le credenziali predefinite dell'applicazione per eseguire facilmente l'autenticazione con le API di Google e inviare richieste a tali API. Con Credenziali predefinite dell'applicazione, puoi testare la tua applicazione in locale ed eseguirne il deployment senza modificare il codice sottostante. Per ulteriori informazioni, tra cui esempi di codice, consulta la guida all'autenticazione in Google Cloud .

Crea le credenziali di autenticazione per il tuo Account Google:

gcloud auth application-default login

Installa la libreria client

Python

Prima di installare la libreria, assicurati di aver preparato il tuo ambiente per lo sviluppo Python.

pip install --upgrade google-cloud-speech

Esecuzione di una richiesta di trascrizione audio

Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il codice seguente per inviare una richiesta recognize all'API Speech-to-Text.

Python

Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Python.

import io

from google.cloud.speech_v2 import SpeechClient
from google.cloud.speech_v2.types import cloud_speech

def quickstart_v2(project_id, recognizer_id, audio_file):
    # Instantiates a client
    client = SpeechClient()

    request = cloud_speech.CreateRecognizerRequest(
        parent=f"projects/{project_id}/locations/global",
        recognizer_id=recognizer_id,
        recognizer=cloud_speech.Recognizer(
            language_codes=["en-US"], model="latest_long"
        ),
    )

    # Creates a Recognizer
    operation = client.create_recognizer(request=request)
    recognizer = operation.result()

    # Reads a file as bytes
    with io.open(audio_file, "rb") as f:
        content = f.read()

    config = cloud_speech.RecognitionConfig(auto_decoding_config={})

    request = cloud_speech.RecognizeRequest(
        recognizer=recognizer.name, config=config, content=content
    )

    # Transcribes the audio into text
    response = client.recognize(request=request)

    for result in response.results:
        print("Transcript: {}".format(result.alternatives[0].transcript))

    return response

Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.

Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata ai passaggi per la risoluzione dei problemi e la attenuazione degli errori.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:

  1. (Facoltativo) Revoca le credenziali di autenticazione che hai creato ed elimina il file delle credenziali locale.

    gcloud auth application-default revoke
  2. Facoltativo: revoca le credenziali dall'interfaccia a riga di comando gcloud.

    gcloud auth revoke

Console

  • In Google Cloud Console, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  • Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  • Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
  • gcloud

    Elimina un progetto Cloud:

    gcloud projects delete PROJECT_ID

    Passaggi successivi