En esta página, se explica cómo crear una instancia de Cloud Data Fusion.
Antes de comenzar
- Habilita la API de Cloud Data Fusion
- Se requiere el siguiente permiso para crear instancias de Cloud Data Fusion:
instances.create
. Para obtener más información, consulta Control de acceso. - Las instancias de Cloud Data Fusion se ejecutan como la cuenta de servicio predeterminada de Compute Engine. Para obtener información sobre los tipos y funciones disponibles, consulta Cuentas de servicio.
- De forma predeterminada, Cloud Data Fusion ejecuta canalizaciones mediante un clúster de Dataproc en tu proyecto. Asegúrate de que tu proyecto cumpla con los requisitos de red para Dataproc.
- Los proyectos nuevos comienzan con una red predeterminada. La red predeterminada se prepropaga con una regla de firewall, default-allow-ssh, que permite las conexiones entrantes en el puerto TCP 22 desde cualquier origen a cualquier instancia en la red. En las versiones inferiores a 6.2.0, si esta regla para permitir la entrada en el puerto TCP 22 no existe en la red que usa tu instancia de Cloud Data Fusion, debes crear esta regla.
Crea una instancia
Console
Si la API está habilitada, la sección de Cloud Data Fusion en Cloud Console muestra una página Instancias en la que puede crear y administrar sus instancias de Cloud Data Fusion.
- Haga clic en Crear una instancia.
- Ingresa un Nombre de instancia.
- Ingresa una Descripción para tu instancia.
- Especifica la Región en la que se creará la instancia.
- Especifica la Versión de Cloud Data Fusion que prefieras.
- Selecciona la edición que prefieras. El valor predeterminado es Básico.
- Haz clic en Agregar aceleradores a fin de seleccionar aceleradores para usar en tu instancia.
- En Cloud Data Fusion 6.2.3 y versiones posteriores, especifica la cuenta de servicio de Dataproc para usar en la ejecución de tu canalización de Cloud Data Fusion en Dataproc. La IU preselecciona la cuenta de Compute Engine predeterminada. Sin importar la versión, asegúrate de que la cuenta de servicio tenga las funciones de Identity and Access Management adecuadas para tus necesidades. Para obtener más información, consulta Otorga permiso de usuario de cuenta de servicio.
Opcional: Especifica las opciones avanzadas. Si no especificas nada, se usarán los siguientes valores predeterminados:
Categoría Configuración Descripción predeterminada IP privada Habilita direcciones IP privadas En su lugar, consulta la sección sobre cómo crear una instancia privada. Inhabilitada Registro y supervisión Habilita Cloud Logging Opción para habilitar Cloud Logging a fin de ver los registros de canalización.
Inhabilitada Logging y Monitoring Habilita Cloud Monitoring Opción para habilitar Monitoring. Inhabilitada Encriptación Usa una clave de encriptación administrada por el cliente (CMEK) Opción para usar el control de acceso basado en funciones en las versiones 6.5 y posteriores. Inhabilitada etiquetas Parámetros de <Ke> <Value> Las etiquetas de recursos de la instancia que se usarán para anotar los recursos subyacentes relacionados, como las VM de Compute Engine. Las claves de etiquetas y los valores de las etiquetas solo pueden contener letras, números, guiones y guiones bajos. Las claves de etiquetas deben comenzar con una letra o un número. Ninguno Haga clic en Crear. El proceso de creación de la instancia toma hasta 30 minutos en completarse.
Mientras Cloud Data Fusion crea la instancia, se muestra una rueda de progreso junto al nombre de la instancia en la página Instances. Cuando se completa, se convierte en una marca de verificación verde y se indica que puedes comenzar a usar la instancia.
API
Cree una instancia
Si deseas crear una instancia de Cloud Data Fusion con la API de REST de Cloud Data Fusion, crea una solicitud a la API instances.create
. Para ello, completa el recurso Instance
con la información de tu configuración.
¿Qué sigue?
- Obtén más información sobre Cloud Data Fusion.
- Lee un instructivo.