Introducción a Cloud Data Fusion: Consola

En esta página, se presenta la consola de Cloud Data Fusion, también conocida como plano de control. Es un conjunto de operaciones de API y una interfaz de la consola de Google Cloud que te permite administrar una instancia de Cloud Data Fusion. Por ejemplo, con la consola, puedes crear, borrar, reiniciar o actualizar una instancia.

Antes de comenzar

Cloud Data Fusion: Descripción general de la consola

En las siguientes secciones, se describen aspectos importantes de la consola.

Instancias

Una instancia es una implementación única de Cloud Data Fusion. Para comenzar a usar Cloud Data Fusion, crea una instancia en la consola de Google Cloud. Puedes crear varias instancias de Cloud Data Fusion en una sola proyecto de Google Cloud. Puedes especificar una región de Google Cloud para cada instancia. Cada instancia es un servicio de Cloud Data Fusion independiente y único Deployment, que contiene un conjunto de servicios que manejan el ciclo de vida de la canalización gestión, organización, coordinación y gestión de metadatos. Estos servicios se ejecutan mediante recursos de larga duración en un proyecto de usuario.

Cuando crees la instancia, ten en cuenta las siguientes opciones.

Edición

Creas la instancia en una de las siguientes ediciones de Cloud Data Fusion: Developer, Basic o Enterprise. Elige la edición según los siguientes criterios:

  • Costo
  • Límites de simultaneidad para la ejecución de canalizaciones
  • Disponibilidad del control de acceso basado en roles (RBAC)

Las ediciones están pensadas para los siguientes casos de uso:

Edición de Cloud Data Fusion Caso de uso
Edición para desarrolladores Para el desarrollo, las pruebas o integraciones a pequeña escala
Edición básica Para la producción con necesidades moderadas
Edición Empresarial Para canalizaciones de datos esenciales a gran escala con RBAC

Instancia pública o privada

Según tus requisitos, decide si necesitas una instancia pública o privada. Las diferencias clave entre las instancias privadas y públicas Cloud Data Fusion son la conectividad de red y la seguridad:

Tipo de instancia de Cloud Data Fusion Comportamiento
Instancia pública
  • Conectividad de red: usa direcciones IP públicas para conectarse a Internet.
  • Acceso a los datos: Accede directamente a las fuentes de datos en la Internet pública.
Para obtener más información, consulta Crea una instancia pública.
Instancia privada
  • Conectividad de red: Usa direcciones IP privadas dentro de una red de nube privada virtual (VPC).
  • Acceso a los datos: Requiere conexiones preconfiguradas para acceder a las fuentes de datos. Se admiten las siguientes conexiones:
    • Las fuentes de datos locales conectadas a través de VPN Cloud Interconnect
    • Otros servicios de Google Cloud que se ejecutan de forma privada dentro de la misma VPC

Autorización y cuenta de servicio

Por lo general, Cloud Data Fusion tiene dos cuentas de servicio:

Cuenta de servicio de tiempo de diseño
Esta cuenta de servicio administrada por Google, denominada servicio de la API de Cloud Data Fusion Agente, se usa en el proyecto de usuario de Cloud Data Fusion para acceder los recursos del proyecto del cliente.
Cuenta de servicio de tiempo de ejecución
Esta es la cuenta de servicio predeterminada de Compute Engine que Cloud Data Fusion crea para implementar trabajos que acceden a otras recursos de Google Cloud. De forma predeterminada, se adjunta a Dataproc VM de clúster para habilitar Cloud Data Fusion para acceder a Dataproc recursos durante la ejecución de una canalización.

Para obtener más información, consulta Cuentas de servicio en Cloud Data Fusion.

Registro y supervisión

Cloud Logging y Cloud Monitoring son cruciales para obtener estadísticas sobre el estado y de tus canalizaciones de Cloud Data Fusion. Habilitas Logging y Monitoring solo cuando creas la instancia de Cloud Data Fusion.

Habilitar Logging y Monitoring te permite ver Registros de canalización de Cloud Data Fusion en la consola de Google Cloud, Página Visor de Logging

Monitoring proporciona paneles integrados Cloud Data Fusion. También puedes crear paneles personalizados para supervisar métricas específicas.

Integración de Lineage con Dataplex

Cloud Data Fusion proporciona una integración con Dataplex para el linaje. Para obtener más información, consulta Visualiza el linaje en Dataplex.

Encriptación

Las claves de encriptación administradas por el cliente (CMEK) permiten la encriptación de datos en reposo con una que puedes controlar a través de Cloud Key Management Service. Las CMEK proporcionan al usuario control de los datos escritos en los recursos internos de Google Cloud en proyectos de usuario y los datos escritos por las canalizaciones de Cloud Data Fusion. Para obtener más información, consulta Encriptación de datos administrada por el cliente.

Administra los permisos con el control de acceso basado en roles (RBAC)

Cloud Data Fusion te permite controlar la administración de identidades y accesos (IAM).

Para obtener permisos detallados sobre las acciones realizadas en Cloud Data Fusion: Studio las operaciones, usa el RBAC. Para obtener más información, consulta la Descripción general de RBAC.

Actualizaciones de versión

Cloud Data Fusion tiene versiones. Puedes actualizar una instancia a una versión posterior en la consola de Cloud Data Fusion. Para obtener más información, consulta Control de versiones en Cloud Data Fusion.

¿Qué sigue?