Account di servizio in Cloud Data Fusion

Questa pagina descrive come vengono utilizzati gli account di servizio in Cloud Data Fusion. Per ulteriori informazioni, consulta Utilizzare gli account di servizio.

Progetti di tenant e clienti

Cloud Data Fusion configura account di servizio per accedere alle risorse nei seguenti progetti:

Progetto tenant

Cloud Data Fusion crea un progetto tenant per contenere le risorse e i servizi necessari per gestire le pipeline per tuo conto. Ad esempio, l'esecuzione di pipeline sui cluster Dataproc che risiedono nel progetto del cliente. Non puoi vedere un progetto tenant, ma quando crei un'istanza privata, potresti dover utilizzare il nome del progetto tenant per configurare il peering VPC.

Per ulteriori informazioni, consulta la documentazione di Service Infrastructure sui progetti tenant.

Progetto cliente

Crea e possiedi questo progetto. Per impostazione predefinita, Cloud Data Fusion crea un cluster Dataproc temporaneo in questo progetto per eseguire le pipeline.

Il seguente diagramma mostra un'istanza di Cloud Data Fusion in esecuzione in un progetto tenant e una pipeline in esecuzione su un cluster Dataproc in un progetto del cliente.

Eseguire il deployment della pipeline.

Account di servizio in Cloud Data Fusion

Un account di servizio fornisce un'identità per Cloud Data Fusion, che consente a Cloud Data Fusion di accedere alle tue risorse.

Quando abiliti l'API Cloud Data Fusion, Cloud Data Fusion crea un account di servizio gestito da Google per accedere a risorse quali Service Networking, Dataproc, Cloud Storage, BigQuery, Spanner e Bigtable. Questo account di servizio è denominato agente di servizio API Cloud Data Fusion. I ruoli vengono concessi automaticamente a questo agente di servizio.

Un account di servizio è identificato dal relativo indirizzo email, univoco dell'account.

I seguenti tipi di account di servizio utilizzati in Cloud Data Fusion. Per saperne di più, consulta Tipi di account di servizio.

Account di servizio Descrizione
service-CUSTOMER_PROJECT_NUMBER@gcp-sa- datafusion.iam.gserviceaccount.com L'account di servizio gestito da Google, chiamato agente di servizio API Cloud Data Fusion, che Cloud Data Fusion crea per accedere alle risorse del cliente in modo che possa agire per conto del cliente. Viene utilizzato nel progetto tenant per accedere alle risorse del progetto del cliente. Ad esempio, l'anteprima viene eseguita in memoria anziché in un cluster Dataproc.
CUSTOMER_PROJECT_NUMBER- compute@developer.gserviceaccount.com L'account di servizio Compute Engine predefinito che Cloud Data Fusion crea per il deployment di job che accedono ad altre risorse Google Cloud. Per impostazione predefinita, si collega alla VM di un cluster Dataproc per consentire a Cloud Data Fusion di accedere alle risorse Dataproc durante l'esecuzione di una pipeline. Nella versione Enterprise di Cloud Data Fusion, puoi eseguire le pipeline da un account di servizio gestito dall'utente creando un profilo dalla console di Cloud Data Fusion → Amministratore di sistema→scheda Configurazione e aggiungendo l'account di servizio personalizzato. Nella versione 6.2.3 e successive, puoi scegliere un account di servizio personalizzato da collegare al cluster Dataproc durante la creazione di un'istanza di Cloud Data Fusion. Per maggiori informazioni, consulta Account di servizio in Dataproc.

Passaggi successivi