Questa pagina spiega come creare un'istanza Cloud Data Fusion.
Prima di iniziare
- Attiva l'API Cloud Data Fusion.
- Per creare istanze Cloud Data Fusion è necessaria la seguente autorizzazione:
instances.create
. Per ulteriori informazioni, consulta Controllo dell'accesso. - Le istanze Cloud Data Fusion vengono eseguite come account di servizio predefinito di Compute Engine. Per informazioni sui tipi e sui ruoli disponibili, consulta Account di servizio.
- Per impostazione predefinita, Cloud Data Fusion esegue le pipeline utilizzando un cluster Dataproc nel progetto. Assicurati che il progetto soddisfi i requisiti di rete di Dataproc.
- I nuovi progetti vengono avviati con una rete predefinita. La rete predefinita è precaricata con una regola firewall default-allow-ssh, che consente connessioni in entrata sulla porta TCP 22 da qualsiasi origine a qualsiasi istanza nella rete. Nelle versioni precedenti alla 6.2.0, se questa regola per consentire l'ingresso sulla porta TCP 22 non esiste nella rete utilizzata dall'istanza Cloud Data Fusion, devi crearla.
Crea un'istanza
Console
Se l'API è abilitata, la sezione Cloud Data Fusion nella console Google Cloud mostra una pagina Istanze in cui puoi creare e gestire le tue istanze Cloud Data Fusion.
- Nella console, vai alla pagina Cloud Data Fusion.
- Fai clic su Istanze e poi su Crea un'istanza.
- Inserisci un nome istanza.
- Inserisci una Descrizione per l'istanza.
- Specifica la Regione in cui creare l'istanza.
- Specifica la versione di Cloud Data Fusion.
- Seleziona un'Edizione. L'impostazione predefinita è Base.
- (Facoltativo) Fai clic su Aggiungi acceleratori per selezionare gli acceleratori da utilizzare nella tua istanza.
- Specifica l'account di servizio Dataproc da utilizzare per eseguire la pipeline Cloud Data Fusion in Dataproc. Il valore predefinito è l'account Compute Engine. Indipendentemente dalla versione, assicurati che un account di servizio disponga dei ruoli di Identity and Access Management appropriati per le tue esigenze. Per ulteriori informazioni, consulta Concessione dell'autorizzazione utente all'account di servizio.
(Facoltativo) Specifica eventuali opzioni avanzate. Se non specifichi nulla, vengono utilizzati i seguenti valori predefiniti:
Categoria Impostazione Descrizione Predefinito IP privato Attivare gli indirizzi IP interni Crea l'istanza Cloud Data Fusion con un indirizzo IP interno. Disabilitato Logging e monitoraggio Abilita Cloud Logging Visualizza i log della pipeline in Cloud Logging. Disabilitato Integrazione della derivazione dei dati Dataplex Abilita o disabilita l'integrazione con la derivazione dei dati Dataplex Visualizza la derivazione in Dataplex. Disabilitato Crittografia Usa chiave di crittografia gestita dal cliente (CMEK) Utilizza il controllo dell'accesso basato sui ruoli nelle versioni 6.5 e successive. Disabilitato Etichette Una coppia chiave-valore Le etichette delle risorse da utilizzare per l'istanza per annotare eventuali risorse di base correlate, ad esempio le VM di Compute Engine. Le chiavi e i valori delle etichette possono contenere solo lettere, numeri, trattini e trattini bassi. Le chiavi delle etichette devono iniziare con una lettera o un numero. Nessuno Manutenzione Abilita periodo di manutenzione Imposta il periodo di tempo in cui Cloud Data Fusion può eseguire operazioni di manutenzione sull'istanza. Per ulteriori informazioni, consulta Configurare i periodi di manutenzione. Disabilitato Fai clic su Crea. Il processo di creazione dell'istanza richiede fino a 30 minuti.
Mentre Cloud Data Fusion crea l'istanza, accanto al nome dell'istanza nella pagina Istanze viene visualizzata una barra di avanzamento. Al termine, diventa un segno di spunta verde e indica che puoi iniziare a utilizzare l'istanza.
API
Crea un'istanza:
Per creare un'istanza Cloud Data Fusion con l'API REST Cloud Data Fusion, compila una richiesta API instances.create
compilando la risorsa Instance
con le informazioni di configurazione.
Passaggi successivi
- Scopri di più su Cloud Data Fusion.
- Segui un tutorial.