Questa pagina spiega come creare un account Cloud Data Fusion instance.
Prima di iniziare
- Attiva l'API Cloud Data Fusion.
- Per creare Cloud Data Fusion è necessaria la seguente autorizzazione
istanze:
instances.create
. Per ulteriori informazioni, vedi Controllo dell'accesso. - Le istanze Cloud Data Fusion vengono eseguite come Compute Engine predefinito. Per informazioni sui tipi e sui ruoli disponibili, consulta Account di servizio.
- Per impostazione predefinita, Cloud Data Fusion esegue le pipeline utilizzando un di un cluster Dataproc nel tuo progetto. Assicurati che il progetto soddisfi i requisiti di rete di Dataproc.
- I nuovi progetti iniziano con una rete predefinita. La rete predefinita è precompilata con una regola firewall default-allow-ssh, che consente le connessioni in entrata sulla porta TCP 22 da qualsiasi origine a qualsiasi istanza nella rete. Nelle versioni precedenti alla 6.2.0, se questa regola per consentire l'ingresso sulla porta TCP 22 non esiste nella rete utilizzata dall'istanza Cloud Data Fusion, devi crearla.
Crea un'istanza
Console
Se l'API è abilitata, La sezione Cloud Data Fusion nella console Google Cloud mostra Istanze, in cui puoi creare e gestire di Cloud Data Fusion.
- Nella console, vai alla pagina Cloud Data Fusion.
- Fai clic su Istanze e poi su Crea un'istanza.
- Inserisci un Nome istanza.
- Inserisci una Descrizione per l'istanza.
- Specifica la regione in cui creare l'istanza.
- Specifica la versione di Cloud Data Fusion.
- Seleziona un'Edizione. L'impostazione predefinita è Di base.
- (Facoltativo) Fai clic su Aggiungi acceleratori per selezionare gli acceleratori da utilizzare nella tua istanza.
- Specifica l'account di servizio Dataproc da utilizzare per eseguire la pipeline di Cloud Data Fusion Dataproc. Il valore predefinito è l'account Compute Engine. Indipendentemente dalla versione, assicurati che un account di servizio disponga dei ruoli di Identity and Access Management appropriati per le tue esigenze. Per ulteriori informazioni, vedi Concessione dell'autorizzazione all'utente con l'account di servizio.
(Facoltativo) Specifica le opzioni avanzate. Se non specifichi nulla, vengono utilizzati i seguenti valori predefiniti:
Categoria Impostazione Descrizione Predefinito IP privato Abilita indirizzi IP interni Crea l'istanza Cloud Data Fusion con un indirizzo IP interno. Disabilitato Logging e monitoraggio Abilita Cloud Logging Visualizza i log della pipeline in Cloud Logging. Disabilitato Integrazione della derivazione dei dati Dataplex Abilita o disabilita l'integrazione con Dataplex derivazione dei dati Visualizza la derivazione in Dataplex. Disabilitato Crittografia Usa chiave di crittografia gestita dal cliente (CMEK) Utilizza il controllo dell'accesso basato sui ruoli nelle versioni 6.5 e successive. Disabilitato Etichette Una coppia chiave-valore Le etichette delle risorse che l'istanza deve utilizzare per annotare alle risorse sottostanti correlate, come Compute Engine delle VM in esecuzione. Le chiavi e i valori delle etichette possono contenere solo lettere, numeri, trattini e trattini bassi. Le chiavi di etichetta devono iniziare con un lettera o numero. Nessuno Manutenzione Abilita periodo di manutenzione Imposta il periodo di tempo in cui Cloud Data Fusion può eseguire operazioni di manutenzione sull'istanza. Per ulteriori informazioni, vedi Configura periodi di manutenzione. Disabilitato Fai clic su Crea. Il processo di creazione dell'istanza richiede fino a 30 minuti.
Mentre Cloud Data Fusion crea l'istanza, accanto al nome dell'istanza nella pagina Istanze viene visualizzata una barra di avanzamento. Al termine, diventa un segno di spunta verde e indica che puoi iniziare a utilizzare l'istanza.
API
Crea un'istanza:
Per creare un'istanza Cloud Data Fusion con l'API REST Cloud Data Fusion, compila una richiesta API instances.create
compilando la risorsa Instance
con le informazioni di configurazione.
Passaggi successivi
- Scopri di più su Cloud Data Fusion.
- Segui un tutorial.