Account di servizio in Cloud Data Fusion

In questa pagina viene descritto come vengono utilizzati gli account di servizio in Cloud Data Fusion. Per Per ulteriori informazioni, consulta Utilizzare gli account di servizio.

Progetti tenant e clienti

Cloud Data Fusion configura account di servizio per accedere alle risorse seguenti progetti:

Progetto tenant

Cloud Data Fusion crea un progetto tenant per contenere le risorse di cui ha bisogno per gestire le pipeline per tuo conto. Ad esempio: corsa pipeline sui tuoi cluster Dataproc che risiedono nel tuo cliente progetto. Un progetto tenant non è esposto a te, ma quando crei un un'istanza privata, potresti dover utilizzare il nome del progetto tenant per configurare un VPC e il peering.

Per ulteriori informazioni, consulta la documentazione dell'Service Infrastructure progetti tenant.

Progetto cliente

Sei tu a creare il progetto ed esserne il proprietario. Per impostazione predefinita, Cloud Data Fusion crea di cluster Dataproc temporaneo in questo progetto per eseguire pipeline di dati.

Il seguente diagramma mostra un'istanza Cloud Data Fusion in esecuzione in un su un progetto tenant e su una pipeline in esecuzione su un cluster Dataproc in per il progetto del cliente.

Eseguire il deployment della pipeline.

Account di servizio in Cloud Data Fusion

Un account di servizio fornisce un'identità per Cloud Data Fusion, Accesso di Cloud Data Fusion alle tue risorse.

Quando abiliti l'API Cloud Data Fusion, Cloud Data Fusion crea una un account di servizio per avere accesso a risorse come Service Networking, Dataproc, Cloud Storage, BigQuery, Spanner e Bigtable. Questo account di servizio è chiamato Agente di servizio API Cloud Data Fusion. I ruoli vengono concessi automaticamente a questo agente di servizio.

Un account di servizio è identificato dal suo indirizzo email, che è univoco per .

Di seguito sono riportati i tipi di account di servizio utilizzati in Cloud Data Fusion. Per ulteriori informazioni consulta la pagina Tipi di account di servizio.

Account di servizio Descrizione
service-CUSTOMER_PROJECT_NUMBER@gcp-sa- datafusion.iam.gserviceaccount.com L'agente di servizio, chiamato l'agente di servizio API Cloud Data Fusion, Cloud Data Fusion crea per ottenere l'accesso alle risorse del cliente di poter agire per conto del cliente. Viene utilizzato nel tenant progetto per accedere alle risorse del progetto del cliente. Ad esempio: L'anteprima viene eseguita in memoria anziché in un cluster Dataproc.
CUSTOMER_PROJECT_NUMBER- compute@developer.gserviceaccount.com L'account di servizio Compute Engine predefinito che Cloud Data Fusion crea per eseguire il deployment di job che accedono ad altre dell'accesso a specifiche risorse Google Cloud. Per impostazione predefinita, si collega a una VM del cluster Dataproc per abilitare Cloud Data Fusion alle risorse Dataproc durante l'esecuzione di una pipeline. Nella Cloud Data Fusion Versione Enterprise, puoi eseguire pipeline da un account di servizio gestito dall'utente creando un profilo da Cloud Data Fusion console→Amministratore di sistema→scheda Configurazione e aggiunta del servizio personalizzato . Nelle versioni 6.2.3 e successive, puoi scegliere un servizio personalizzato da collegare al cluster Dataproc durante la creazione dell'istanza di Cloud Data Fusion. Per ulteriori informazioni, vedi Account di servizio in Dataproc.

Passaggi successivi