En esta página, se presenta la consola de Cloud Data Fusion, también conocida como plano de control. Es un conjunto de operaciones de API y una interfaz de la consola de Google Cloud que te permiten administrar una instancia de Cloud Data Fusion. Por ejemplo, con la consola, puedes crear, borrar, reiniciar o actualizar una instancia.
Antes de comenzar
- Habilita la API de Cloud Data Fusion
- Comprende los costos de las ediciones de Cloud Data Fusion.
- Comprende el control de acceso y las cuentas de servicio en Cloud Data Fusion.
Cloud Data Fusion: Descripción general de la consola
En las siguientes secciones, se describen aspectos importantes de la consola.
Instancias
Una instancia es una implementación única de Cloud Data Fusion. Para comenzar a usar Cloud Data Fusion, crea una instancia en la consola de Google Cloud. Puedes crear varias instancias de Cloud Data Fusion en un solo proyecto deGoogle Cloud . Puedes especificar una región Google Cloud para cada instancia. Cada instancia es una implementación única e independiente de Cloud Data Fusion que contiene un conjunto de servicios que controlan la administración del ciclo de vida de las canalizaciones, la organización, la coordinación y la administración de metadatos. Estos servicios se ejecutan mediante recursos de larga duración en un proyecto de usuario.
Cuando crees la instancia, ten en cuenta las siguientes opciones.
Edición
Creas la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición según los siguientes criterios:
- Costo
- Límites de simultaneidad para la ejecución de canalizaciones
- Disponibilidad del control de acceso basado en roles (RBAC)
Las ediciones están diseñadas para los siguientes casos de uso:
Edición de Cloud Data Fusion | Caso de uso |
---|---|
Versión para desarrolladores | Para integraciones a pequeña escala, pruebas o desarrollo |
Edición básica | Para producción con necesidades moderadas |
Edición Enterprise | Para canalizaciones de datos esenciales a gran escala con RBAC |
Instancia pública o privada
Según tus requisitos, decide si necesitas una instancia pública o privada. Las diferencias clave entre las instancias privadas y públicas en Cloud Data Fusion son la conectividad y la seguridad de la red:
Tipo de instancia de Cloud Data Fusion | Comportamiento |
---|---|
Instancia pública |
|
Instancia privada |
|
Autorización y cuenta de servicio
Por lo general, Cloud Data Fusion tiene dos cuentas de servicio:
- Cuenta de servicio del tiempo de diseño
- Esta cuenta de servicio administrada por Google, llamada Agente de servicio de la API de Cloud Data Fusion, se usa en el proyecto de usuario de Cloud Data Fusion para acceder a los recursos del proyecto del cliente.
- Cuenta de servicio de tiempo de ejecución
- Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para implementar trabajos que acceden a otros recursos deGoogle Cloud . De forma predeterminada, se adjunta a una VM de clúster de Dataproc para permitir que Cloud Data Fusion acceda a los recursos de Dataproc durante la ejecución de una canalización.
Para obtener más información, consulta Cuentas de servicio en Cloud Data Fusion.
Registro y supervisión
Cloud Logging y Cloud Monitoring son fundamentales para obtener estadísticas sobre el estado y el rendimiento de tus canalizaciones de Cloud Data Fusion. Habilitas Logging y Monitoring solo cuando creas la instancia de Cloud Data Fusion.
Si habilitas Logging y Monitoring, podrás ver los registros de canalización de Cloud Data Fusion en la consola de Google Cloud, en la página Visor de registros.
Monitoring proporciona paneles integrados para Cloud Data Fusion. También puedes crear paneles personalizados para supervisar métricas específicas.
Integración de Lineage con Dataplex
Cloud Data Fusion proporciona una integración con Dataplex para el linaje. Para obtener más información, consulta Consulta el linaje en Dataplex.
Encriptación
Las claves de encriptación administradas por el cliente (CMEK) habilitan la encriptación de datos en reposo con una clave que puedes controlar a través del Servicio de administración de claves de Cloud. Las CMEK proporcionan al usuario control sobre los datos escritos en los Google Cloud recursos internos en proyectos de usuario y los datos escritos por las canalizaciones de Cloud Data Fusion. Para obtener más información, consulta Encriptación de datos administrada por el cliente.
Administra los permisos con el control de acceso basado en roles (RBAC)
Cloud Data Fusion te permite controlar la administración de identidades y accesos (IAM).
Para obtener permisos detallados para las acciones que se realizan en las operaciones de Cloud Data Fusion: Studio, usa el RBAC. Para obtener más información, consulta la descripción general del RBAC.
Actualizaciones de versión
Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.
¿Qué sigue?
- Obtén más información sobre Cloud Data Fusion: Studio.