Questa pagina spiega come creare un'istanza di Cloud Data Fusion.
Prima di iniziare
- Abilita l'API Cloud Data Fusion.
- Per creare istanze di Cloud Data Fusion, è necessaria la seguente autorizzazione:
instances.create
. Per ulteriori informazioni, vedi Controllo dell'accesso. - Le istanze Cloud Data Fusion vengono eseguite come account di servizio predefinito di Compute Engine. Per informazioni sui tipi e sui ruoli disponibili, consulta Account di servizio.
- Per impostazione predefinita, Cloud Data Fusion esegue le pipeline utilizzando un cluster Dataproc nel tuo progetto. Assicurati che il progetto soddisfi i requisiti di networking di Dataproc.
- I nuovi progetti iniziano con una rete predefinita. La rete predefinita è precompilata con una regola firewall default-allow-ssh, che consente le connessioni in entrata sulla porta TCP 22 da qualsiasi origine a qualsiasi istanza nella rete. Nelle versioni precedenti alla 6.2.0, se questa regola per consentire il traffico in entrata sulla porta TCP 22 non esiste nella rete utilizzata dall'istanza Cloud Data Fusion, devi creare questa regola.
Creazione di un'istanza
Console
Se l'API è abilitata, la sezione Cloud Data Fusion della console Google Cloud mostra una pagina Istanze, in cui puoi creare e gestire le istanze di Cloud Data Fusion.
- Nella console, vai alla pagina di Cloud Data Fusion.
- Fai clic su Istanze, quindi su Crea un'istanza.
- Inserisci un Nome istanza.
- Inserisci una descrizione per l'istanza.
- Specifica la regione in cui creare l'istanza.
- Specifica la versione di Cloud Data Fusion.
- Seleziona un'edizione. L'impostazione predefinita è Di base.
- (Facoltativo) Fai clic su Aggiungi acceleratori per selezionare gli acceleratori da utilizzare nell'istanza.
- Specifica l'account di servizio Dataproc da utilizzare per eseguire la pipeline Cloud Data Fusion in Dataproc. Il valore predefinito è l'account Compute Engine. Indipendentemente dalla versione, assicurati che l'account di servizio disponga dei ruoli Identity and Access Management appropriati per le tue esigenze. Per ulteriori informazioni, consulta Concessione dell'autorizzazione utente dell'account di servizio.
(Facoltativo) Specifica eventuali opzioni avanzate. Se non specifichi nulla, vengono utilizzati i seguenti valori predefiniti:
Categoria Impostazione Descrizione Valore predefinito IP privato Abilita gli indirizzi IP interni Crea l'istanza di Cloud Data Fusion con un indirizzo IP interno. Disabilitato Logging e monitoraggio Abilita Cloud Logging Visualizza i log della pipeline in Cloud Logging. Disabilitato Integrazione della derivazione dei dati Dataplex Abilita o disabilita l'integrazione con la derivazione dei dati Dataplex Visualizza la derivazione in Dataplex. Disabilitato Crittografia Usa chiave di crittografia gestita dal cliente (CMEK) Utilizza il controllo degli accessi basato sui ruoli nella versione 6.5 e successive. Disabilitato Etichette Una coppia chiave-valore Le etichette delle risorse che l'istanza deve utilizzare per annotare le eventuali risorse sottostanti correlate, come le VM di Compute Engine. Le chiavi e i valori delle etichette possono contenere solo lettere, numeri, trattini e trattini bassi. Le chiavi delle etichette devono iniziare con una lettera o un numero. Nessuna Fai clic su Crea. Il completamento del processo di creazione dell'istanza richiede fino a 30 minuti.
Mentre Cloud Data Fusion crea l'istanza, viene visualizzata una ruota di avanzamento accanto al nome dell'istanza nella pagina Istanze. Una volta completata, l'istanza diventa un segno di spunta verde che indica che puoi iniziare a utilizzare l'istanza.
API
Crea un'istanza:
Per creare un'istanza di Cloud Data Fusion con l'API REST di Cloud Data Fusion, crea una richiesta API instances.create
e compila la risorsa Instance
con le informazioni di configurazione.
Passaggi successivi
- Scopri di più su Cloud Data Fusion.
- Segui un tutorial.