Cloud Data Fusion

Integración de datos totalmente gestionada y nativa de la nube a cualquier escala

Probar gratis
  • action/check_circle_24px Creado con Sketch

    Interfaz visual y sencilla que facilita el despliegue sin código de flujos de procesamiento de datos de extracción, transformación y carga (ETL) o de extracción, carga y transformación (ELT)

  • action/check_circle_24px Creado con Sketch

    Extensa biblioteca gratuita con más de 150 transformaciones y conectores preconfigurados

  • action/check_circle_24px Creado con Sketch

    Integración nativa con los excepcionales servicios de Google Cloud

  • action/check_circle_24px Creado con Sketch

    Linaje integral de datos para analizar causas y efectos

  • action/check_circle_24px Creado con Sketch

    Diseño con un núcleo de código abierto (CDAP) para facilitar la portabilidad de flujos de procesamiento

Ahórrate cuellos de botella técnicos y aumenta la productividad

Gracias a la intuitiva interfaz para arrastrar y soltar de Data Fusion, a los conectores predefinidos y al modelo de autoservicio para integrar datos sin código, evitas que se produzcan cuellos de botella técnicos debidos a la falta de experiencia y recibes información valiosa en menos tiempo.

Rebaja el coste total de propiedad de los flujos de procesamiento

Como el enfoque sin servidor aprovecha la escalabilidad y la fiabilidad de los servicios de Google (como Dataproc), Data Fusion ofrece las mejores prestaciones de integración de datos con un menor coste total de propiedad.

Basa el desarrollo en el gobierno de datos

Data Fusion ayuda a los equipos a analizar causas o efectos y a monitorizar el cumplimiento mediante algunas de las características que tiene preinstaladas, como el linaje integral de datos, los metadatos de integración y los servicios nativos de la nube de seguridad y de protección de datos.

Características principales

Núcleo de código abierto con integración híbrida y multinube

Data Fusion se ha desarrollado con el proyecto de software libre CDAP. El núcleo de código abierto garantiza a los usuarios la portabilidad de los flujos de procesamiento de datos. Gracias a la amplia integración de CDAP con plataformas on‑premise y en la nube pública, los usuarios de Cloud Data Fusion tienen la posibilidad de deshacerse de los silos y de aportar información valiosa que antes quedaba fuera de su alcance.

Integración con las herramientas de Big Data de Google líderes del sector

La integración de Data Fusion con Google Cloud simplifica la seguridad de los datos y te permite analizarlos de forma inmediata. También agiliza y facilita el desarrollo y la iteración en cualquier caso práctico: crear un lago de datos con Cloud Storage y con Dataproc, transferir datos a BigQuery para almacenarlos o transformar datos para trasladarlos a un almacén relacional, como Cloud Spanner.

Integración de datos mediante la colaboración y la estandarización

Cloud Data Fusion incluye transformaciones predefinidas y permite crear una biblioteca interna con conexiones y transformaciones personalizadas que se pueden validar, compartir y reutilizar en todos los equipos. Por todo ello, sienta las bases de una ingeniería de datos colaborativa y aumenta la productividad, ya que reduce el tiempo de espera para los desarrolladores de ETL y para los ingenieros de datos y, sobre todo, les ahorra tener que preocuparse por la calidad del código.

Ver todas las características

Clientes

Caso de éxito de Star Media Group
Star Media Group se transforma en un medio participativo con Cloud Data Fusion.
Leer testimonio

Lo más destacado

  • La transformación ha sido la consecuencia del cambio basado en la tecnología.

  • Se muestra a los consumidores contenido pertinente y personalizado.

  • Han logrado cumplir los requisitos de rentabilidad y escalabilidad.

Sector

Documentación

Tutorial
Habilitar Cloud Data Fusion

Aprende a habilitar la API de Cloud Data Fusion en tus proyectos de Google Cloud.

Tutorial
Aprender los conceptos de Cloud Data Fusion

Obtén información general sobre los conceptos y las características de Cloud Data Fusion.

Tutorial
Examinar el linaje de datos

En este tutorial se explica cómo usar Cloud Data Fusion para examinar el linaje de los datos, es decir, de dónde proceden y por dónde han pasado a lo largo del tiempo.

Tutorial
Usar controladores JDBC con Cloud Data Fusion

Aprende a utilizar los controladores JDBC con los flujos de procesamiento de Cloud Data Fusion.

Tutorial
Usar la ingeniería de datos en Google Cloud

Aprende de primera mano a diseñar y a crear sistemas de procesamiento de datos en Google Cloud con este curso de cuatro días impartido por un profesor.

Casos prácticos

Caso práctico
Lagos de datos de Google Cloud modernos y más seguros

Cloud Data Fusion ayuda a los usuarios a crear lagos de datos escalables y distribuidos en Google Cloud integrando datos procedentes de plataformas on‑premise aisladas. Los clientes pueden aprovechar la escala que ofrece la nube para centralizar los datos y extraer una mayor utilidad de ellos. Las funciones de autoservicio de Cloud Data Fusion aumentan la visibilidad del proceso y rebajan el coste general de la asistencia operativa.

Caso práctico
Almacenes de datos ágiles con BigQuery

Cloud Data Fusion ayuda a las organizaciones a conocer mejor a sus clientes, puesto que elimina los silos de datos y permite desarrollar en BigQuery soluciones de almacén de datos ágiles y basadas en la nube. La experiencia de los clientes mejora cuando se tiene una vista fiable y unificada de su comportamiento y de sus interacciones, lo que se traduce en un porcentaje de retención mayor y en unos ingresos superiores por cliente.

Caso práctico
Entorno de analíticas unificado

Hoy en día, muchos usuarios quieren crear un entorno de analíticas unificado entre tantos data marts costosos on‑premise. Si utilizas demasiadas herramientas desconectadas y medidas paliativas, pones en riesgo la seguridad y la calidad de los datos. La amplia gama de conectores, interfaces visuales y abstracciones centrados en la lógica empresarial que ofrece Cloud Data Fusion rebaja el coste total de propiedad, favorece tanto el autoservicio como la estandarización y reduce las tareas repetitivas.

Todas las características

Autoservicio sin código Acaba con los cuellos de botella al permitir que los usuarios sin conocimientos técnicos usen una interfaz gráfica sin código para integrar datos de forma sencilla.
Ingeniería de datos colaborativa Cloud Data Fusion permite crear una biblioteca interna con conexiones y transformaciones personalizadas que se pueden validar, compartir y reutilizar en toda la organización.
Arquitectura nativa de Google Cloud Disfruta de las prestaciones de escalabilidad, fiabilidad, seguridad y privacidad de Google Cloud gracias a la arquitectura totalmente gestionada y nativa de esta plataforma.
Seguridad de nivel empresarial La integración con Gestión de Identidades y Accesos de Cloud (Cloud IAM), Controles de Servicio de VPC, las IP privadas y las claves de encriptado gestionadas por clientes no solo ofrece seguridad de nivel empresarial, sino que también mitiga riesgos, ya que garantiza el cumplimiento y la protección de los datos.
Metadatos y linaje de los datos integrados Puedes buscar conjuntos de datos integrados por metadatos técnicos y empresariales. Rastrea el linaje de todos los conjuntos de datos integrados a nivel de campo y de conjunto de datos.
Operaciones óptimas Realizar operaciones en los entornos esenciales te resultará muy fácil gracias a las API REST, las programaciones basadas en horarios, los activadores basados en el estado de los flujos de procesamiento, los registros, las métricas y los paneles de control de monitorización.
Kit integral de herramientas de integración Disfruta de una experiencia de integración de datos completa gracias a los conectores integrados en varios sistemas, tanto modernos como antiguos; a las transformaciones sin código; a los condicionantes y al procesamiento previo y posterior; a las alertas y a las notificaciones; y a la gestión de errores.
Habilitación híbrida El código abierto aporta la flexibilidad y la portabilidad indispensables para crear soluciones estandarizadas de integración de datos en todos los entornos híbridos y multinube.

Precios

Las tarifas de Cloud Data Fusion se desglosan por horas de instancia de interfaz y por máquinas virtuales de Dataproc. La edición Basic ofrece gratis las 120 primeras horas del mes de cada cuenta.

Edición Precio por hora de instancia de Cloud Data Fusion Número de flujos de procesamiento simultáneos admitidos Número de usuarios admitidos
Basic 1,80 USD Sin límite Sin límite
Empresa 4,20 USD Sin límite Sin límite