Tutorial sulle funzioni remote e sull'API Translation

Questo tutorial descrive come creare una funzione remota BigQuery, richiamare l'API Cloud Translation e eseguire la traduzione dei contenuti da qualsiasi lingua allo spagnolo utilizzando SQL e Python.

Ecco alcuni casi d'uso per questa funzione:

  • Tradurre i commenti degli utenti su un sito web in una lingua locale
  • Tradurre le richieste di assistenza da molte lingue in un'unica lingua comune per gli addetti all'assistenza

Obiettivi

  • Assegna i ruoli necessari al tuo account.
  • Crea una funzione Cloud Run.
  • Creare un set di dati BigQuery.
  • Crea una connessione e un account di servizio BigQuery.
  • Concedi le autorizzazioni all'account di servizio BigQuery.
  • Crea una funzione remota BigQuery.
  • Chiama la funzione remota BigQuery.

Costi

In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:

Per generare una stima dei costi basata sull'utilizzo previsto, utilizza il Calcolatore prezzi. I nuovi utenti di Google Cloud potrebbero essere idonei per una prova gratuita.

Prima di iniziare

Ti consigliamo di creare un progetto Google Cloud per questo tutorial. Inoltre, assicurati di disporre dei ruoli necessari per completare questo tutorial.

Configura un progetto Google Cloud

Per configurare un progetto Google Cloud per questo tutorial, segui questi passaggi:

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery, BigQuery Connection, Cloud Translation, Cloud Run functions, Cloud Build, Cloud Logging, Cloud Pub/Sub, Artifact Registry, and Cloud Run Admin APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery, BigQuery Connection, Cloud Translation, Cloud Run functions, Cloud Build, Cloud Logging, Cloud Pub/Sub, Artifact Registry, and Cloud Run Admin APIs.

    Enable the APIs

Ruoli obbligatori per il tuo account

Per ottenere le autorizzazioni necessarie per eseguire le attività in questo tutorial, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per eseguire le attività in questo tutorial. Per visualizzare le autorizzazioni esatte richieste, espandi la sezione Autorizzazioni richieste:

Autorizzazioni obbligatorie

Per eseguire le attività di questo tutorial sono necessarie le seguenti autorizzazioni:

  • bigquery.datasets.create
  • bigquery.connections.create
  • bigquery.connections.get
  • cloudfunctions.functions.create

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Ruoli richiesti per l'account di servizio predefinito di Compute Engine

Quando hai attivato l'API per le funzioni Cloud Run, è stato creato un account di servizio predefinito di Compute Engine. Per completare questo tutorial, devi assegnare a questo account di servizio predefinito il ruolo Utente API Cloud Translation.

  1. Ottieni l'ID assegnato al progetto.

  2. Copia l'account di servizio predefinito Compute Engine. Il tuo account di servizio predefinito ha il seguente aspetto:

    PROJECT_NUMBER-compute@developer.gserviceaccount.com
    

    Sostituisci PROJECT_NUMBER con l'ID progetto.

  3. Nella console Google Cloud, vai alla pagina IAM.

    Vai a IAM

  4. Seleziona il progetto.

  5. Fai clic su Concedi accesso e poi incolla l'account di servizio predefinito di Compute Engine che hai copiato in precedenza nel campo Nuove entità.

  6. Nell'elenco Assegna ruoli, cerca e seleziona Utente API Cloud Translation.

  7. Fai clic su Salva.

Creare una funzione Cloud Run

Utilizzando le funzioni Cloud Run, crea una funzione che traduca il testo inserito in spagnolo.

  1. Crea una funzione Cloud Functions con le seguenti specifiche:

    • Per Ambiente, seleziona 2ª gen..
    • In Nome funzione, inserisci translation-handler.
    • In Regione, seleziona us-central1.
    • In Numero massimo di istanze, inserisci 10.

      Questa impostazione si trova nella sezione Impostazioni di runtime, build, connessioni e sicurezza.

      In questo tutorial utilizziamo un valore inferiore a quello predefinito per controllare la tasso di richieste inviata a Traduzione.

    • Per Runtime, seleziona Python 3.10.

    • In Punto di ingresso, inserisci handle_translation.

  2. Nell'elenco dei file, seleziona main.py e incolla il seguente codice.

    Prima di provare questo esempio, segui le istruzioni di configurazione Python riportate nella guida rapida all'utilizzo di BigQuery con le librerie client. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API BigQuery Python.

    Per autenticarti in BigQuery, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per le librerie client.

    from __future__ import annotations
    
    
    import flask
    import functions_framework
    from google.api_core.retry import Retry
    from google.cloud import translate
    
    # Construct a Translation Client object
    translate_client = translate.TranslationServiceClient()
    
    
    # Register an HTTP function with the Functions Framework
    @functions_framework.http
    def handle_translation(request: flask.Request) -> flask.Response:
        """BigQuery remote function to translate input text.
    
        Args:
            request: HTTP request from BigQuery
            https://cloud.google.com/bigquery/docs/reference/standard-sql/remote-functions#input_format
    
        Returns:
            HTTP response to BigQuery
            https://cloud.google.com/bigquery/docs/reference/standard-sql/remote-functions#output_format
        """
        try:
            # Parse request data as JSON
            request_json = request.get_json()
            # Get the project of the query
            caller = request_json["caller"]
            project = extract_project_from_caller(caller)
            if project is None:
                return flask.make_response(
                    flask.jsonify(
                        {
                            "errorMessage": (
                                'project can\'t be extracted from "caller":' f" {caller}."
                            )
                        }
                    ),
                    400,
                )
            # Get the target language code, default is Spanish ("es")
            context = request_json.get("userDefinedContext", {})
            target = context.get("target_language", "es")
    
            calls = request_json["calls"]
            translated = translate_text([call[0] for call in calls], project, target)
    
            return flask.jsonify({"replies": translated})
        except Exception as err:
            return flask.make_response(
                flask.jsonify({"errorMessage": f"Unexpected error {type(err)}:{err}"}),
                400,
            )
    
    
    def extract_project_from_caller(job: str) -> str:
        """Extract project id from full resource name of a BigQuery job.
    
        Args:
            job: full resource name of a BigQuery job, like
              "//bigquery.googleapi.com/projects/<project>/jobs/<job_id>"
    
        Returns:
            project id which is contained in the full resource name of the job.
        """
        path = job.split("/")
        return path[4] if len(path) > 4 else None
    
    
    def translate_text(
        calls: list[str], project: str, target_language_code: str
    ) -> list[str]:
        """Translates the input text to specified language using Translation API.
    
        Args:
            calls: a list of input text to translate.
            project: the project where the translate service will be used.
            target_language_code: The ISO-639 language code to use for translation
              of the input text. See
              https://cloud.google.com/translate/docs/advanced/discovering-supported-languages-v3#supported-target
                for the supported language list.
    
        Returns:
            a list of translated text.
        """
        location = "<your location>"
        parent = f"projects/{project}/locations/{location}"
        # Call the Translation API, passing a list of values and the target language
        response = translate_client.translate_text(
            request={
                "parent": parent,
                "contents": calls,
                "target_language_code": target_language_code,
                "mime_type": "text/plain",
            },
            retry=Retry(),
        )
        # Convert the translated value to a list and return it
        return [translation.translated_text for translation in response.translations]
    
    

    Aggiorna <your location> con us-central1.

  3. Nell'elenco dei file, seleziona requirements.txt e incolla il seguente testo:

    Flask==2.2.2
    functions-framework==3.5.0
    google-cloud-translate==3.16.0
    Werkzeug==2.3.7
    

  4. Fai clic su Esegui il deployment e attendi il deployment della funzione.

  5. Fai clic sulla scheda Trigger.

  6. Copia il valore URL attivatore e salvalo per riferimento futuro. Devi utilizzare questo URL quando crei una funzione remota BigQuery.

Crea un set di dati BigQuery

Crea un set di dati BigQuery che conterrà la funzione remota. Quando crei il set di dati, includi queste specifiche:

  • In ID set di dati, inserisci remote_function_test.
  • Per Tipo di località, seleziona Più regioni.
  • Per Più regioni, seleziona Stati Uniti (più regioni negli Stati Uniti).

Crea una connessione e un account di servizio BigQuery

Crea una connessione BigQuery per poter implementare una funzione remota con qualsiasi lingua supportata nelle funzioni Cloud Run e in Cloud Run. Quando crei una connessione, viene creato un account di servizio per quella connessione.

  1. Crea una connessione alla risorsa Google Cloud con le seguenti specifiche:

    • In Tipo di connessione, seleziona BigLake e funzioni remote (risorsa Cloud).
    • In ID connessione, inserisci remote-function-connection.
    • Per Tipo di località, seleziona Più regioni.
    • Per Più regioni, seleziona Stati Uniti (più regioni negli Stati Uniti).
  2. Apri l'elenco Connessioni esterne e seleziona us.remote-function-connection.

  3. Copia l'ID account di servizio e salvalo per dopo. Devi concedere le autorizzazioni a questo ID nel passaggio successivo.

Concedi le autorizzazioni all'account di servizio BigQuery

L'account di servizio che hai creato nel passaggio precedente deve disporre dell'autorizzazione per utilizzare Cloud Run in modo che la funzione remota BigQuery possa utilizzare la funzione delle funzioni Cloud Run. Per concedere le autorizzazioni all'account di servizio, completa i seguenti passaggi:

  1. Vai alla pagina Cloud Run.

    Vai a Cloud Run

  2. Seleziona il progetto.

  3. Seleziona la casella di controllo accanto a translation-handler.

  4. Nel riquadro Autorizzazioni, fai clic su Aggiungi entità.

  5. Nel campo Nuove entità, inserisci l'ID account di servizio che hai copiato in precedenza.

  6. Nell'elenco Assegna ruoli, cerca e seleziona Richiedente Cloud Run.

  7. Fai clic su Salva.

Creare una funzione remota BigQuery

Per utilizzare la funzione Cloud Run che traduce il testo in spagnolo con una funzione remota BigQuery, completa i seguenti passaggi.

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, inserisci la seguente query:

    CREATE OR REPLACE FUNCTION `remote_function_test.translate_text`(x STRING)
    RETURNS
    STRING
        REMOTE WITH CONNECTION `us.remote-function-connection`
    OPTIONS (
        endpoint = 'TRIGGER_URL',
        max_batching_rows = 10);
    

    Sostituisci TRIGGER_URL con l'URL dell'attivatore che hai salvato in precedenza quando hai creato una funzione Cloud Run.

  3. Fai clic su Esegui. Viene visualizzato un messaggio simile al seguente:

    This statement created a new function named
    your_project.remote_function_test.translate_text.
    

Chiama la funzione remota BigQuery

Dopo aver creato la funzione remota, testala per assicurarti che sia collegata alle funzioni Cloud Run e produca i risultati previsti in spagnolo.

  1. Nell'editor di query di BigQuery, inserisci la query seguente e poi fai clic su Esegui.

    SELECT
      remote_function_test.translate_text('This new feature is fantastic!')
        AS translated_text;
    

    I risultati sono simili ai seguenti:

    +-------------------------------------------+
    | translated_text                           |
    +-------------------------------------------+
    | ¡Esta nueva característica es fantástica! |
    +-------------------------------------------+
    
  2. (Facoltativo) Per testare la funzione remota su un set di dati pubblico, inserisci la seguente query e fai clic su Esegui. Per limitare i risultati restituiti, utilizza la clausola LIMIT.

    SELECT
        text,
        remote_function_test.translate_text(text) AS translated_text
    FROM
        (SELECT text FROM `bigquery-public-data.hacker_news.full` LIMIT 3);
    

    I risultati sono simili ai seguenti:

    +---------------------------------------------------------------------------+
    | text                            | translated_text                         |
    +---------------------------------------------------------------------------+
    | These benchmarks look good.     | Estos puntos de referencia se ven bien. |
    | Who is using Java?              | ¿Quién está usando Java?                |
    | You need more database storage. | Necesitas más almacenamiento.           |
    +---------------------------------------------------------------------------+
    

Elimina le risorse

Se non prevedi di utilizzare queste funzioni in questo progetto, puoi evitare costi aggiuntivi eliminando il progetto. Tutte le risorse associate al progetto verranno eliminate definitivamente.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Passaggi successivi