Questa pagina è stata tradotta dall'API Cloud Translation.

Riutilizzare i cluster

Questa pagina descrive come riutilizzare i cluster Dataproc per le esecuzioni della pipeline in Cloud Data Fusion. Per ulteriori informazioni, consulta Quando riutilizzare i cluster e Eseguire una pipeline su un cluster Dataproc esistente.

Prima di iniziare

Devi disporre di un'istanza Cloud Data Fusion nella versione 6.5.0 o successive.

Puoi riutilizzare i cluster in un nuovo profilo di calcolo o in uno che è stato utilizzato in una pipeline di cui è stato eseguito il deployment.

Vai all'istanza:
1. Nella Google Cloud console, vai alla pagina Cloud Data Fusion.
2. Per aprire l'istanza in Cloud Data Fusion Studio, fai clic su Istanze e poi su Visualizza istanza.
  
  Vai a Istanze
Fai clic su Amministrazione di sistema > Configurazione > Profili di calcolo del sistema.
Fai clic su Crea nuovo profilo.
Scegli il provisioning di Dataproc.
Nella finestra Crea un profilo per Dataproc, inserisci i dettagli del cluster:
1. Nei campi Etichetta profilo e Nome profilo, inserisci un nome per identificare il profilo, ad esempio execution_compute-profile.
2. Nel campo Descrizione, descrivi lo scopo del profilo, ad esempio Profile used for pipeline execution.
3. Nel campo Tempo di inattività massimo, inserisci un valore. Per ulteriori informazioni, consulta Impostare il tempo di inattività massimo.
4. Imposta il campo Salta eliminazione cluster su True. Per ulteriori informazioni, consulta Quando riutilizzare i cluster.
5. (Facoltativo) Configura altri campi facoltativi.
6. Fai clic su Crea.

Vai all'istanza:
1. Nella Google Cloud console, vai alla pagina Cloud Data Fusion.
2. Per aprire l'istanza in Cloud Data Fusion Studio, fai clic su Istanze e poi su Visualizza istanza.
  
  Vai a Istanze
Fai clic su Elenco.
Fai clic sulla scheda Eseguito il deployment e poi sul nome di una pipeline. La pipeline di cui è stato eseguito il deployment si apre nella pagina Studio dell'interfaccia web di Cloud Data Fusion.
Fai clic su Configura.
Nella finestra Configurazione di calcolo, vai al profilo scelto e fai clic su Personalizza.
Nella finestra che si apre, inserisci i seguenti valori:
1. Nel campo Tempo di inattività massimo, inserisci un valore. Per ulteriori informazioni, consulta Impostare il tempo di inattività massimo.
2. Imposta Salta l'eliminazione del cluster su True. Per ulteriori informazioni, consulta Quando riutilizzare i cluster.
Fai clic su Fine.