Se usó la API de Cloud Translation para traducir esta página.

Cómo volver a utilizar clústeres

En esta página, se describe cómo volver a usar clústeres de Dataproc para las ejecuciones de tu canalización en Cloud Data Fusion. Para obtener más información, consulta Cuándo volver a usar clústeres y Ejecuta una canalización en un clúster existente de Dataproc.

Antes de comenzar

Debes tener una instancia de Cloud Data Fusion en la versión 6.5.0 o una posterior.

Puedes volver a usar los clústeres en un perfil de procesamiento nuevo o en uno que se haya usado en una canalización implementada.

Ve a tu instancia:
1. En la Google Cloud consola, ve a la página de Cloud Data Fusion.
2. Para abrir la instancia en Cloud Data Fusion Studio, haz clic en Instancias y, luego, en Ver instancia.
  
  Ir a Instancias
Haz clic en Administrador del sistema > Configuración > Perfiles de procesamiento del sistema.
Haz clic en Crear un perfil nuevo.
Elige el aprovisionador de Dataproc.
En la ventana Create a profile for Dataproc, ingresa los detalles sobre tu clúster:
1. En los campos Etiqueta de perfil y Nombre de perfil, ingresa un nombre para identificar el perfil, por ejemplo, execution_compute-profile.
2. En el campo Descripción, describe el propósito del perfil, por ejemplo, Profile used for pipeline execution.
3. En el campo Max idle time, ingresa un valor. Para obtener más información, consulta Establece el tiempo inactivo máximo.
4. Establece el campo Omitir la eliminación del clúster en True. Para obtener más información, consulta Cuándo volver a usar clústeres.
5. Opcional: Configura otros campos opcionales.
6. Haz clic en Crear.

Ve a tu instancia:
1. En la Google Cloud consola, ve a la página de Cloud Data Fusion.
2. Para abrir la instancia en Cloud Data Fusion Studio, haz clic en Instancias y, luego, en Ver instancia.
  
  Ir a Instancias
Haz clic en Lista.
Haz clic en la pestaña Implementada y, luego, en el nombre de una canalización. La canalización implementada se abrirá en la página Studio de la interfaz web de Cloud Data Fusion.
Haz clic en Configurar.
En la ventana Compute config, ve al perfil elegido y haz clic en Customize.
En la ventana que se abre, ingresa los siguientes valores:
1. En el campo Max Idle Time, ingresa un valor. Para obtener más información, consulta Establece el tiempo inactivo máximo.
2. Establece Omitir la eliminación del clúster en True. Para obtener más información, consulta Cuándo volver a usar clústeres.
Haz clic en Listo.