Autenticazione in Dataform

Questo documento descrive come eseguire l'autenticazione in Dataform in modo programmatico.

Interfaccia a riga di comando Dataform

L'interfaccia a riga di comando (CLI) Dataform supporta le Credenziali predefinite dell'applicazione (ADC). Con ADC, puoi rendere disponibili le credenziali per la tua applicazione in una varietà di ambienti, come lo sviluppo locale o la produzione, senza dover modificare il codice dell'applicazione.

Per utilizzare ADC, devi prima fornire le tue credenziali ad ADC.

Repository remoti

Puoi collegare un repository Dataform a un repository remoto Bitbucket, GitHub o GitLab. Devi autenticare il repository remoto prima di collegarlo. Puoi autenticare un repository remoto in Dataform tramite HTTPS o SSH.

Per i repository remoti GitHub e GitLab, puoi utilizzare HTTPS o SSH per l'autenticazione. Per i repository remoti Bitbucket, devi utilizzare SSH.

Per le istruzioni, vedi Connettersi a un repository Git di terze parti.

Per ulteriori informazioni sull'autenticazione Google Cloud, consulta la panoramica dell'autenticazione.

Accesso API

Dataform supporta l'accesso programmatico. La modalità di autenticazione a Dataform dipende dal modo in cui accedi all'API. Puoi accedere all'API nei seguenti modi:

Librerie client

Le librerie client Dataform forniscono supporto linguistico di alto livello per l'autenticazione programmatica in Dataform. Le librerie client supportano le credenziali predefinite dell'applicazione (ADC); le librerie cercano le credenziali in un insieme di località definite e le utilizzano per autenticare le richieste all'API. Con ADC, puoi rendere disponibili le credenziali per la tua applicazione in una varietà di ambienti, come lo sviluppo locale o la produzione, senza dover modificare il codice dell'applicazione.

REST

Puoi eseguire l'autenticazione nell'API Dataform utilizzando le credenziali dell'interfaccia a riga della gcloud CLI o le credenziali predefinite dell'applicazione. Per saperne di più sull'autenticazione per le richieste REST, consulta la pagina relativa all'autenticazione per le richieste REST. Per informazioni sui tipi di credenziali, consulta Credenziali dell'interfaccia a riga di comando gcloud e credenziali ADC.

Configura l'autenticazione per Dataform

La modalità di configurazione dell'autenticazione dipende dall'ambiente in cui viene eseguito il codice.

Le seguenti opzioni per la configurazione dell'autenticazione sono quelle più utilizzate. Per ulteriori opzioni e informazioni sull'autenticazione, consulta la sezione Autenticazione su Google.

Per un ambiente di sviluppo locale

Puoi configurare le credenziali per un ambiente di sviluppo locale nei seguenti modi:

Librerie client o strumenti di terze parti

Configura le credenziali predefinite dell'applicazione (ADC) nel tuo ambiente locale:

  1. Installa Google Cloud CLI, quindi inizializzalo eseguendo il comando seguente:

    gcloud init
  2. Crea credenziali di autenticazione locali per il tuo Account Google:

    gcloud auth application-default login

    Viene visualizzata una schermata di accesso. Una volta effettuato l'accesso, le tue credenziali vengono archiviate nel file delle credenziali locale utilizzato da ADC.

Per ulteriori informazioni sull'utilizzo di ADC in un ambiente locale, consulta Ambiente di sviluppo locale.

Richieste REST dalla riga di comando

Quando effettui una richiesta REST dalla riga di comando, puoi utilizzare le credenziali gcloud CLI includendo gcloud auth print-access-token nel comando che invia la richiesta.

Nell'esempio seguente sono elencati gli account di servizio per il progetto specificato. Puoi utilizzare lo stesso pattern per qualsiasi richiesta REST.

Prima di utilizzare qualsiasi dato della richiesta, effettua le seguenti sostituzioni:

  • PROJECT_ID: l'ID del tuo progetto Google Cloud.

Per inviare la richiesta, espandi una di queste opzioni:

 

Per maggiori informazioni sull'autenticazione tramite REST e gRPC, consulta Autenticazione mediante REST. Per informazioni sulla differenza tra le credenziali dell'ADC locali e le credenziali dell'interfaccia a riga della gcloud CLI, consulta Credenziali dell'interfaccia a riga di comando gcloud e credenziali ADC.

Su Google Cloud

Per autenticare un carico di lavoro in esecuzione su Google Cloud, utilizza le credenziali dell'account di servizio collegato alla risorsa di computing su cui è in esecuzione il codice. Ad esempio, puoi collegare un account di servizio a un'istanza di macchina virtuale (VM) Compute Engine, a un servizio Cloud Run o a un job Dataflow. Questo approccio è il metodo di autenticazione preferito per il codice in esecuzione su una risorsa di computing di Google Cloud.

Per la maggior parte dei servizi, devi collegare l'account di servizio quando crei la risorsa che eseguirà il codice. Non puoi aggiungere o sostituire l'account di servizio in un secondo momento. Compute Engine è un'eccezione: ti consente di collegare un account di servizio a un'istanza VM in qualsiasi momento.

Utilizza l'interfaccia a riga di comando gcloud per creare un account di servizio e collegarlo alla tua risorsa:

  1. Installa Google Cloud CLI, quindi inizializzalo eseguendo il comando seguente:

    gcloud init
  2. Configura l'autenticazione:

    1. Crea l'account di servizio:

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME

      Sostituisci SERVICE_ACCOUNT_NAME con un nome per l'account di servizio.

    2. Per fornire l'accesso al tuo progetto e alle tue risorse, concedi un ruolo all'account di servizio:

      gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=ROLE

      Sostituisci quanto segue:

      • SERVICE_ACCOUNT_NAME: il nome dell'account di servizio.
      • PROJECT_ID: l'ID progetto in cui hai creato l'account di servizio
      • ROLE: il ruolo da concedere
    3. Per concedere un altro ruolo all'account di servizio, esegui il comando come nel passaggio precedente.
    4. Concedi al tuo Account Google un ruolo che ti consenta di utilizzare i ruoli dell'account di servizio e collegarlo ad altre risorse:

      gcloud iam service-accounts add-iam-policy-binding SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com --member="user:USER_EMAIL" --role=roles/iam.serviceAccountUser

      Sostituisci quanto segue:

      • SERVICE_ACCOUNT_NAME: il nome dell'account di servizio.
      • PROJECT_ID: l'ID progetto in cui hai creato l'account di servizio
      • USER_EMAIL: l'indirizzo email del tuo Account Google
  3. Crea la risorsa che eseguirà il tuo codice e collega l'account di servizio a quella risorsa. Ad esempio, se utilizzi Compute Engine:

    Crea un'istanza di Compute Engine. Configura l'istanza come segue:
    • Sostituisci INSTANCE_NAME con il nome dell'istanza che preferisci.
    • Imposta il flag --zone sulla zona in cui vuoi creare la tua istanza.
    • Imposta il flag --service-account sull'indirizzo email dell'account di servizio creato.
    gcloud compute instances create INSTANCE_NAME --zone=ZONE --service-account=SERVICE_ACCOUNT_EMAIL

Per ulteriori informazioni sull'autenticazione nelle API di Google, consulta la pagina Autenticazione Google.

On-premise o su un cloud provider diverso

Il metodo preferito per configurare l'autenticazione dall'esterno di Google Cloud è utilizzare la federazione delle identità per i carichi di lavoro. Per saperne di più, consulta On-premise o un altro cloud provider nella documentazione relativa all'autenticazione.

Controllo dell'accesso in Dataform

Dopo l'autenticazione in Dataform, devi disporre dell'autorizzazione ad accedere alle risorse Google Cloud. Dataform utilizza Identity and Access Management (IAM) per l'autorizzazione.

Per ulteriori informazioni sui ruoli per Dataform, consulta Controllare l'accesso con IAM. Per ulteriori informazioni su IAM e autorizzazione, consulta la panoramica IAM.

Passaggi successivi