Cloud Data Fusion

Accede al evento Data Cloud Summit bajo demanda y descubre las últimas innovaciones en analíticas, IA, BI y bases de datos.

Ir a

Cloud Data Fusion

Integración de datos totalmente gestionada y nativa de la nube a cualquier escala.

Los nuevos clientes reciben de regalo 300 USD en crédito para invertirlos en Data Fusion. Todos los clientes reciben de regalo las 120 primeras horas de desarrollo de flujo de procesamiento al mes por cuenta, que no se descuentan de tus créditos.

Interfaz visual y sencilla que facilita el despliegue sin código de flujos de procesamiento de datos de extracción, transformación y carga (ETL) o de extracción, carga y transformación (ELT)
Extensa biblioteca con más de 150 transformaciones y conectores preconfigurados, sin coste económico
Integración nativa con los excepcionales servicios de Google Cloud
Linaje integral de datos para analizar las causas principales y el impacto
Diseño con un núcleo de código abierto (CDAP) para facilitar la portabilidad de flujos de procesamiento

Miniatura de vídeo: tres personas suben escalones con ventanas de fondo que dan a varias arquitecturas de almacenamiento de datos

Introducción a Cloud Data Fusion

1:54

Ventajas

Ahórrate cuellos de botella técnicos y aumenta la productividad

Gracias a la intuitiva interfaz para arrastrar y soltar de Data Fusion, a los conectores predefinidos y al modelo de autoservicio para integrar datos sin código, evitas que se produzcan cuellos de botella técnicos debidos a la falta de experiencia y recibes información valiosa en menos tiempo.

Rebaja el coste total de propiedad de los flujos de procesamiento

Como el enfoque sin servidor aprovecha la escalabilidad y la fiabilidad de los servicios de Google (como Managed Service for Apache Spark), Data Fusion ofrece las mejores prestaciones de integración de datos con un menor coste total de propiedad.

Basa el desarrollo en la gobernanza de datos

Data Fusion ayuda a los equipos a analizar causas o efectos y a monitorizar el cumplimiento mediante algunas de las características integradas, como el linaje integral de datos, los metadatos de integración y los servicios nativos de la nube de seguridad y de protección de datos.

Características principales

Núcleo de código abierto con integración híbrida y multinube

Data Fusion se ha desarrollado con el proyecto de software libre CDAP. El núcleo de código abierto garantiza a los usuarios la portabilidad de los flujos de procesamiento de datos. La amplia integración de CDAP con las plataformas de nube tanto on-premise como públicas ofrece a los usuarios de Cloud Data Fusion la posibilidad de deshacerse de los silos y obtener información valiosa a la que no podían acceder antes.

Integración con las herramientas de Big Data líderes del sector de Google

La integración de Data Fusion con Google Cloud facilita la seguridad de los datos y te permite analizarlos de forma inmediata. También agiliza y facilita el desarrollo y la iteración en cualquier caso práctico: seleccionar un lago de datos con Cloud Storage y con Managed Service for Apache Spark, transferir datos a BigQuery para almacenarlos o transformar datos para trasladarlos a un almacén relacional, como Cloud Spanner.

Integración de datos mediante la colaboración y la estandarización

Cloud Data Fusion ofrece transformaciones predefinidas para el procesamiento por lotes y en tiempo real. Permite crear una biblioteca interna de conexiones y transformaciones personalizadas que pueden validarse, compartirse y reutilizarse en todos los equipos. Por todo ello, sienta las bases de una ingeniería de datos colaborativa y mejora la productividad, ya que reduce el tiempo de espera para los desarrolladores de ETL y para los ingenieros de datos y, sobre todo, les ahorra tener que preocuparse por la calidad del código.

Ventajas económicas de Data Fusion y de sus alternativas de integración de datos

Descarga el informe

Clientes

Descubre cómo usan nuestros clientes Cloud Data Fusion

Blog post

Liveramp escala la gestión de datos de identidad con Cloud Data Fusion

Lectura de 5 minutos

Case study

Star Media Group se transforma en un medio de participación con Cloud Data Fusion.

Lectura de 5 minutos

Novedades

Descubre las últimas novedades

Suscríbete para recibir boletines informativos de Google Cloud con novedades sobre los productos, información de eventos, ofertas especiales y mucho más.

Icono de How to bring data from SAP to Google Cloud

Video

How to bring data from SAP to Google CloudVer vídeo

Icono de Embedded data wrangling with Data Fusion

Video

Embedded data wrangling with Data FusionVer vídeo

logotipo de flujos de procesamiento de datos

Blog post

Reduce el CTP para gestionar flujos de procesamiento de datos en un 80 % con Cloud Data FusionMás información

Blog post

Acaba con los silos de datos con Data FusionLeer el blog

Icono de Captura de datos de cambios en tiempo real para replicarlos en BigQuery

Blog post

Captura de datos de cambios en tiempo real para replicarlos en BigQueryLeer el blog

Icono de La unión hace la fuerza: orquestar los flujos de procesamiento de Data Fusion con Managed Service for Apache Airflow

Blog post

La unión hace la fuerza: orquestar los flujos de procesamiento de Data Fusion con Managed Service for Apache AirflowLeer el blog

Documentación

Tutorial

Habilitar Cloud Data Fusion

Aprende a habilitar la API de Cloud Data Fusion en tus proyectos de Google Cloud.

Tutorial

Aprender los conceptos de Cloud Data Fusion

Obtén información general sobre los conceptos y las características de Cloud Data Fusion.

Tutorial

Explorar el linaje de datos

En este tutorial se explica cómo usar Cloud Data Fusion para examinar el linaje de los datos, es decir, de dónde proceden y por dónde han pasado a lo largo del tiempo.

Tutorial

Usar controladores JDBC con Cloud Data Fusion

Aprende a utilizar los controladores de Java Database Connectivity (JDBC) con los flujos de procesamiento de Cloud Data Fusion.

Tutorial

Usar la ingeniería de datos en Google Cloud

Aprende de primera mano a diseñar y a crear sistemas de procesamiento de datos en Google Cloud con este curso de cuatro días impartido por un docente.

¿No encuentras lo que buscas?

Notas de la versión

Consulta más información sobre las últimas versiones de Cloud Data Fusion.

Casos prácticos

Caso práctico

Lagos de datos de Google Cloud modernos y más seguros

Cloud Data Fusion ayuda a los usuarios a crear lagos de datos escalables y distribuidos en Google Cloud integrando datos procedentes de plataformas on‑premise aisladas. Los clientes pueden aprovechar la escala que ofrece la nube para centralizar los datos y añadirles valor. Las funciones de autoservicio de Cloud Data Fusion aumentan la visibilidad del proceso y reducen los costes generales de la asistencia operativa.

Caso práctico

Almacenes de datos ágiles con BigQuery

Cloud Data Fusion ayuda a las organizaciones a conocer mejor a sus clientes, puesto que elimina los silos de datos y permite desarrollar en BigQuery soluciones de almacén de datos ágiles y basadas en la nube. La experiencia de los clientes mejora cuando se tiene una vista fiable y unificada de su comportamiento y de sus interacciones, lo que se traduce en un porcentaje de retención mayor y en unos ingresos superiores por cliente.

Caso práctico

Entorno de análisis unificado

Hoy en día, muchos usuarios quieren crear un entorno de analíticas unificado en innumerables data marts caros on-premise. Si utilizas demasiadas herramientas desconectadas y medidas paliativas, pones en riesgo la seguridad y la calidad de los datos. La amplia gama de conectores, interfaces visuales y simplificaciones centrados en la lógica empresarial que ofrece Cloud Data Fusion ayuda a disminuir el coste total de propiedad, promueve el autoservicio y la estandarización, y reduce las tareas repetitivas.

Todas las características

Autoservicio sin código	Acaba con los cuellos de botella al permitir que los usuarios sin conocimientos técnicos usen una interfaz gráfica sencilla y sin código.
Ingeniería de datos colaborativa	Cloud Data Fusion permite crear una biblioteca interna de conexiones y transformaciones personalizadas que pueden validarse, compartirse y reutilizarse en toda una organización.
Arquitectura nativa de Google Cloud	Disfruta de las prestaciones de escalabilidad, fiabilidad, seguridad y privacidad de Google Cloud gracias a la arquitectura totalmente gestionada y nativa de esta plataforma.
Integración de datos en tiempo real	Replica bases de datos transaccionales y operativas, como SQL Server, Oracle y MySQL, directamente a BigQuery con solo unos clics a través de la función de réplica de Data Fusion. La integración con Datastream te permite proporcionar flujos de cambio a BigQuery para llevar a cabo análisis continuados. Usa la evaluación de viabilidad para agilizar las iteraciones de desarrollo y supervisar el rendimiento y el estado, de modo que optimices la observabilidad.
Integración por lotes	Diseña, ejecuta y gestiona grandes volúmenes de flujos de procesamiento de datos periódicamente, con compatibilidad con fuentes de datos populares, como sistemas de archivos y almacenes de objetos, bases de datos relacionales y NoSQL, sistemas de SaaS y mainframes.
Seguridad empresarial	La integración con Gestión de Identidades y Accesos de Cloud (Cloud IAM), Controles de Servicio de VPC, las IP privadas y las CMEK no solo ofrece seguridad de nivel empresarial, sino que también mitiga riesgos, ya que garantiza el cumplimiento y la protección de los datos.
Metadatos y linaje de los datos integrados	Puedes buscar conjuntos de datos integrados según los metadatos técnicos y empresariales. Sigue el linaje de todos los conjuntos de datos integrados a nivel de campo y conjunto de datos.
Operaciones óptimas	Realizar operaciones en los entornos esenciales te resultará muy fácil gracias a las API REST, las programaciones basadas en horarios, los activadores basados en el estado de los flujos de procesamiento, los registros, las métricas y los paneles de monitorización.
Kit de herramientas de integración completo	Disfruta de una experiencia de integración de datos completa gracias a los conectores integrados en varios sistemas, tanto modernos como antiguos; a las transformaciones sin código; a los condicionantes y al procesamiento previo y posterior; a las alertas y a las notificaciones; y a la gestión de errores.
Habilitación híbrida	El código abierto proporciona la flexibilidad y la portabilidad que necesitas para crear soluciones de integración de datos estandarizadas en todos los entornos híbridos y multinube.

Precios

Los precios de Cloud Data Fusion se desglosan por:

1. Coste de diseño: se basa en el número de horas que se está ejecutando una instancia y no en el número de flujos de procesamiento que se desarrollen y ejecuten. La edición Basic ofrece de regalo las 120 primeras horas del mes de cada cuenta.

2. Coste de procesamiento: el coste de los clústeres de Managed Service for Apache Spark utilizados para ejecutar los flujos de procesamiento.

Edición	Precio por hora de instancia de Cloud Data Fusion	Número de flujos de procesamiento simultáneos admitidos	Número de usuarios admitidos
Desarrollador	0,35 USD	2 (recomendado)	2 (recomendado)
Basic	1,80 USD	Ilimitado	Ilimitado
Enterprise	4,20 USD	Ilimitado	Ilimitado

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito de regalo y más de 20 productos que siempre se ofrecen sin coste económico.

¿Necesitas ayuda para empezar?
Contactar con Ventas
Colabora con un partner de confianza
Buscar un partner
Sigue explorando
Ver todos los productos

Ahórrate cuellos de botella técnicos y aumenta la productividad

Rebaja el coste total de propiedad de los flujos de procesamiento

Basa el desarrollo en la gobernanza de datos

Características principales

Núcleo de código abierto con integración híbrida y multinube

Integración con las herramientas de Big Data líderes del sector de Google

Integración de datos mediante la colaboración y la estandarización

Descubre cómo usan nuestros clientes Cloud Data Fusion

Descubre las últimas novedades

Documentación

Habilitar Cloud Data Fusion

Aprender los conceptos de Cloud Data Fusion

Explorar el linaje de datos

Usar controladores JDBC con Cloud Data Fusion

Usar la ingeniería de datos en Google Cloud

¿No encuentras lo que buscas?

Más documentación

Casos prácticos

Lagos de datos de Google Cloud modernos y más seguros

Almacenes de datos ágiles con BigQuery

Entorno de análisis unificado

Todas las características

Precios

Ve un paso más allá

¿Necesitas ayuda para empezar?

Colabora con un partner de confianza

Sigue explorando