En esta página se presenta la consola de Cloud Data Fusion, también conocida como panel de control. Es un conjunto de operaciones de API y una interfaz de consola que te permite gestionar una instancia de Cloud Data Fusion. Google Cloud Por ejemplo, puedes crear, eliminar, reiniciar o actualizar una instancia mediante la consola.
Antes de empezar
- Habilita la API Cloud Data Fusion.
- Consulta los costes de las ediciones de Cloud Data Fusion.
- Consulta información sobre el control de acceso y las cuentas de servicio en Cloud Data Fusion.
Cloud Data Fusion: descripción general de la consola
En las siguientes secciones se describen aspectos importantes de la consola.
Instancias
Una instancia es una implementación única de Cloud Data Fusion. Para empezar a usar Cloud Data Fusion, crea una instancia en la Google Cloud consola. Puedes crear varias instancias de Cloud Data Fusion en un mismo proyecto.Google Cloud Puedes especificar una Google Cloud región para cada instancia. Cada instancia es una implementación única e independiente de Cloud Data Fusion, que contiene un conjunto de servicios que gestionan el ciclo de vida, la orquestación, la coordinación y la gestión de metadatos de los flujos de procesamiento. Estos servicios se ejecutan con recursos de larga duración en un proyecto de cliente.
Cuando crees la instancia, ten en cuenta las siguientes opciones.
Edición
Crea la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición en función de los siguientes criterios:
- Coste
- Límites de simultaneidad para la ejecución de flujos de procesamiento
- Disponibilidad del control de acceso basado en roles (RBAC)
Las ediciones están pensadas para los siguientes casos prácticos:
Edición de Cloud Data Fusion | Caso práctico |
---|---|
Edición para desarrolladores | Para desarrollo, pruebas o integraciones a pequeña escala |
Edición Basic | Para producciones con necesidades moderadas |
Edición Enterprise | Para las canalizaciones de datos a gran escala y esenciales con control de acceso basado en roles |
Instancia pública o privada
En función de tus requisitos, decide si necesitas una instancia pública o privada. Las principales diferencias entre las instancias privadas y públicas de Cloud Data Fusion son la conectividad de red y la seguridad:
Tipo de instancia de Cloud Data Fusion | Comportamiento |
---|---|
Instancia pública |
|
Instancia privada |
|
Autorización y cuenta de servicio
Cloud Data Fusion suele tener dos cuentas de servicio:
- Cuenta de servicio en tiempo de diseño
- Esta cuenta de servicio gestionada por Google, llamada agente de servicio de la API de Cloud Data Fusion, se usa en el proyecto de inquilino de Cloud Data Fusion para acceder a los recursos del proyecto del cliente.
- Cuenta de servicio en tiempo de ejecución
- Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para desplegar tareas que acceden a otros recursos.Google Cloud De forma predeterminada, se conecta a una máquina virtual de clúster de Dataproc para permitir que Cloud Data Fusion acceda a los recursos de Dataproc durante la ejecución de una canalización.
Para obtener más información, consulta el artículo Cuentas de servicio en Cloud Data Fusion.
Almacenamiento de registros y monitorización
Cloud Logging y Cloud Monitoring son fundamentales para obtener información valiosa sobre el estado y el rendimiento de tus pipelines de Cloud Data Fusion. Solo puedes habilitar Logging y Monitoring cuando creas la instancia de Cloud Data Fusion.
Si habilitas Logging y Monitoring, podrás ver los registros de las canalizaciones de Cloud Data Fusion en la consola, en la página Visualizador de registros. Google Cloud
Monitoring proporciona paneles de control integrados para Cloud Data Fusion. También puede crear paneles de control personalizados para monitorizar métricas específicas.
Integración del linaje con Dataplex Universal Catalog
Cloud Data Fusion se integra con Dataplex Universal Catalog para proporcionar información sobre el linaje. Para obtener más información, consulta Ver el linaje en Dataplex Universal Catalog.
Cifrado
Las claves de cifrado gestionadas por el cliente (CMEK) permiten cifrar los datos en reposo con una clave que puedes controlar a través de Cloud Key Management Service. Las CMEK permiten a los usuarios controlar los datos que se escriben en los Google Cloud recursos internos de los proyectos de inquilino y los datos que escriben los flujos de procesamiento de Cloud Data Fusion. Para obtener más información, consulta Cifrado de datos gestionado por el cliente.
Gestionar permisos con el control de acceso basado en roles (RBAC)
Cloud Data Fusion te permite controlar con Gestión de Identidades y Accesos (IAM).
Para obtener permisos granulares de las acciones realizadas en Cloud Data Fusion: operaciones de Studio, usa el control de acceso basado en roles. Para obtener más información, consulta la descripción general del control de acceso basado en roles.
Actualizaciones de versiones
Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.
Siguientes pasos
- Consulta más información sobre Cloud Data Fusion: Studio.