En esta página, se presenta la consola de Cloud Data Fusion, también conocida como plano de control. Es un conjunto de operaciones de API y una interfaz de la consola de Google Cloud que te permite administrar una instancia de Cloud Data Fusion. Por ejemplo, con la consola, puedes crear, borrar, reiniciar o actualizar una instancia.
Antes de comenzar
- Habilita la API de Cloud Data Fusion
- Comprende los costos de las ediciones de Cloud Data Fusion.
- Comprende el control de acceso y las cuentas de servicio en Cloud Data Fusion.
Cloud Data Fusion: Descripción general de la consola
En las siguientes secciones, se describen aspectos importantes de la consola.
Instancias
Una instancia es una implementación única de Cloud Data Fusion. Para comenzar a usar Cloud Data Fusion, crea una instancia en la consola de Google Cloud. Puedes crear varias instancias de Cloud Data Fusion en una sola proyecto de Google Cloud. Puedes especificar una región de Google Cloud para cada instancia. Cada instancia es un servicio de Cloud Data Fusion independiente y único Deployment, que contiene un conjunto de servicios que manejan el ciclo de vida de la canalización gestión, organización, coordinación y gestión de metadatos. Estos servicios se ejecutan mediante recursos de larga duración en un proyecto de usuario.
Cuando crees la instancia, ten en cuenta las siguientes opciones.
Edición
Creas la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición según los siguientes criterios:
- Costo
- Límites de simultaneidad para la ejecución de canalizaciones
- Disponibilidad del control de acceso basado en roles (RBAC)
Las ediciones están pensadas para los siguientes casos de uso:
Edición de Cloud Data Fusion | Caso de uso |
---|---|
Edición para desarrolladores | Para el desarrollo, las pruebas o integraciones a pequeña escala |
Edición básica | Para la producción con necesidades moderadas |
Edición Empresarial | Para canalizaciones de datos esenciales a gran escala con RBAC |
Instancia pública o privada
Según tus requisitos, decide si necesitas una instancia pública o privada. Las diferencias clave entre las instancias privadas y públicas Cloud Data Fusion son la conectividad de red y la seguridad:
Tipo de instancia de Cloud Data Fusion | Comportamiento |
---|---|
Instancia pública |
|
Instancia privada |
|
Autorización y cuenta de servicio
Por lo general, Cloud Data Fusion tiene dos cuentas de servicio:
- Cuenta de servicio de tiempo de diseño
- Esta cuenta de servicio administrada por Google, denominada servicio de la API de Cloud Data Fusion Agente, se usa en el proyecto de usuario de Cloud Data Fusion para acceder los recursos del proyecto del cliente.
- Cuenta de servicio de tiempo de ejecución
- Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para implementar trabajos que acceden a otras recursos de Google Cloud. De forma predeterminada, se adjunta a Dataproc VM de clúster para habilitar Cloud Data Fusion para acceder a Dataproc recursos durante la ejecución de una canalización.
Para obtener más información, consulta Cuentas de servicio en Cloud Data Fusion.
Registro y supervisión
Cloud Logging y Cloud Monitoring son cruciales para obtener estadísticas sobre el estado y de tus canalizaciones de Cloud Data Fusion. Habilitas Logging y Monitoring solo cuando creas la instancia de Cloud Data Fusion.
Habilitar Logging y Monitoring te permite ver Registros de canalización de Cloud Data Fusion en la consola de Google Cloud, Página Visor de Logging
Monitoring proporciona paneles integrados Cloud Data Fusion. También puedes crear paneles personalizados para supervisar métricas específicas.
Integración de Lineage con Dataplex
Cloud Data Fusion proporciona una integración con Dataplex para el linaje. Para obtener más información, consulta Visualiza el linaje en Dataplex.
Encriptación
Las claves de encriptación administradas por el cliente (CMEK) permiten la encriptación de datos en reposo con una que puedes controlar a través de Cloud Key Management Service. Las CMEK proporcionan al usuario control de los datos escritos en los recursos internos de Google Cloud en proyectos de usuario y los datos escritos por las canalizaciones de Cloud Data Fusion. Para obtener más información, consulta Encriptación de datos administrada por el cliente.
Administra los permisos con el control de acceso basado en roles (RBAC)
Cloud Data Fusion te permite controlar la administración de identidades y accesos (IAM).
Para obtener permisos detallados sobre las acciones realizadas en Cloud Data Fusion: Studio las operaciones, usa el RBAC. Para obtener más información, consulta la Descripción general de RBAC.
Actualizaciones de versión
Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.
¿Qué sigue?
- Obtén más información sobre Cloud Data Fusion: Studio.