Account di servizio in Cloud Data Fusion

Questa pagina descrive come vengono utilizzati gli account di servizio in Cloud Data Fusion. Per maggiori informazioni, consulta Utilizzare gli account di servizio.

Progetti di tenant e clienti

Cloud Data Fusion configura account di servizio per accedere alle risorse seguenti progetti:

Progetto tenant

Cloud Data Fusion crea un progetto tenant per contenere le risorse e i servizi di cui ha bisogno per gestire le pipeline per tuo conto. Ad esempio, l'esecuzione di pipeline sui cluster Dataproc che si trovano nel progetto del cliente. Non puoi vedere un progetto tenant, ma quando crei un'istanza privata, potresti dover utilizzare il nome del progetto tenant per configurare il peering VPC.

Per ulteriori informazioni, consulta la documentazione dell'Service Infrastructure progetti tenant.

Progetto del cliente

Sei tu a creare il progetto ed esserne il proprietario. Per impostazione predefinita, Cloud Data Fusion crea di cluster Dataproc temporaneo in questo progetto per eseguire pipeline di dati.

Il seguente diagramma mostra un'istanza Cloud Data Fusion in esecuzione in un su un progetto tenant e su una pipeline in esecuzione su un cluster Dataproc in per il progetto del cliente.

Eseguire il deployment della pipeline.

Account di servizio in Cloud Data Fusion

Un account di servizio fornisce un'identità per Cloud Data Fusion, Accesso di Cloud Data Fusion alle tue risorse.

Quando abiliti l'API Cloud Data Fusion, Cloud Data Fusion crea una un account di servizio per avere accesso a risorse come Service Networking, Dataproc, Cloud Storage, BigQuery, Spanner e Bigtable. Questo account di servizio si chiama agente di servizio dell'API Cloud Data Fusion. I ruoli vengono concessi automaticamente a questo agente di servizio.

Un account di servizio è identificato dal rispettivo indirizzo email, che è univoco per l'account.

Di seguito sono riportati i tipi di account di servizio utilizzati in Cloud Data Fusion. Per maggiori informazioni consulta la pagina Tipi di account di servizio.

Service account Descrizione
service-CUSTOMER_PROJECT_NUMBER@gcp-sa- datafusion.iam.gserviceaccount.com L'agente di servizio, chiamato agente di servizio dell'API Cloud Data Fusion, che Cloud Data Fusion crea per ottenere l'accesso alle risorse del cliente in modo da poteragirre per conto del cliente. Viene utilizzato nel tenant progetto per accedere alle risorse del progetto del cliente. Ad esempio, l'anteprima viene eseguita in memoria anziché in un cluster Dataproc.
CUSTOMER_PROJECT_NUMBER- compute@developer.gserviceaccount.com L'account di servizio Compute Engine predefinito creato da Cloud Data Fusion per eseguire il deployment di job che accedono ad altre risorse Google Cloud. Per impostazione predefinita, si collega a una VM del cluster Dataproc per abilitare Cloud Data Fusion alle risorse Dataproc durante l'esecuzione di una pipeline. In Cloud Data Fusion Enterprise Edition, puoi eseguire pipeline da un account di servizio gestito dall'utente creando un profilo dalla console Cloud Data Fusion → Amministrazione di sistema → Configurazione e aggiungendo l'account di servizio personalizzato. Nelle versioni 6.2.3 e successive, puoi scegliere un servizio personalizzato da collegare al cluster Dataproc durante la creazione dell'istanza di Cloud Data Fusion. Per saperne di più, consulta Service account in Dataproc.

Passaggi successivi