Conoce nuestras innovaciones más recientes en bases de datos, estadísticas y, también, IA en la Cumbre de datos de la nube. En vivo y on demand a partir del 26 de mayo.

Ir a

Cloud Data Fusion

Integración completamente administrada de datos nativos de la nube a cualquier escala.

Los clientes nuevos obtienen $300 en créditos gratuitos para gastar en Google Cloud durante los primeros 90 días. Todos los clientes obtienen las primeras 120 horas de desarrollo de canalizaciones mensuales por cuenta de forma gratuita.

  • action/check_circle_24pxCreado con Sketch.

    Interfaz visual interactiva que permite la implementación sin código de las canalizaciones de ETL/ELT

  • action/check_circle_24pxCreado con Sketch.

    Amplia biblioteca con más de 150 conectores y transformaciones preconfigurados sin costo adicional

  • action/check_circle_24pxCreado con Sketch.

    Los mejores servicios de Google Cloud integrados de forma nativa

  • action/check_circle_24pxCreado con Sketch.

    Linaje de datos de extremo a extremo para analizar el impacto y la causa raíz

  • action/check_circle_24pxCreado con Sketch.

    Compilada con un núcleo de código abierto (CDAP) para lograr la portabilidad de la canalización

Ventajas

Evita cuellos de botella técnicos y aumenta la productividad

La interfaz intuitiva de Data Fusion en la que se puede arrastrar y soltar, los conectores integrados y el modelo de autoservicio de integración de datos sin código quitan los cuellos de botella técnicos basados en la experiencia y aceleran las estadísticas.

Disminuye el costo total de propiedad de la canalización

Un enfoque sin servidores que aprovecha la escalabilidad y confianza de los servicios de Google como Dataproc significa que Data Fusion ofrece la mejor capacidad de integración con un menor costo total de propiedad.

Compila con una base de administración de datos

Con funciones integradas como el linaje de datos de extremo a extremo, la integración de metadatos y los servicios de protección de datos y seguridad nativos de la nube, Data Fusion asiste a los equipos con el cumplimiento y el análisis del impacto o los problemas raíz.

Características clave

Características clave

Un núcleo abierto que entrega una integración híbrida y de múltiples nubes

Data Fusion se compiló mediante el proyecto CDAP de código abierto; este núcleo abierto garantiza a los usuarios la portabilidad de la canalización de datos. La amplia integración de CDAP a las plataformas locales y de nube pública brinda a los usuarios de Cloud Data Fusion la capacidad de desglosar sistemas aislados y entregar estadísticas valiosas que antes eran inaccesibles.

Integración en las herramientas de macrodatos líderes de la industria de Google

La integración de Data Fusion en Google Cloud simplifica la seguridad de los datos y garantiza la disponibilidad inmediata de los datos para su análisis. Ya sea que selecciones un data lake con Cloud Storage y Cloud Dataproc, transfieras datos a BigQuery para su almacenamiento o transformes datos a fin de dirigirlos a un almacén relacional como Cloud Spanner, la integración de Cloud Data Fusion acelera y simplifica el desarrollo y la iteración.

Integración de datos mediante la colaboración y la estandarización

Cloud Data Fusion ofrece transformaciones compiladas previamente para el procesamiento por lotes y en tiempo real. Proporciona la capacidad de crear una biblioteca interna de conexiones y transformaciones personalizadas que se puedan validar, compartir y reutilizar entre equipos. Sienta las bases de la ingeniería de datos colaborativa y mejora la productividad. El resultado son menores tiempos de espera para los desarrolladores de ETL y los ingenieros de datos y, lo que es más importante, una menor preocupación por la calidad del código.

Ver todas las características

Clientes

Aprende de los clientes que usan Cloud Data Fusion

Novedades

Documentación

Documentación

Instructivo
Habilita Cloud Data Fusion

Aprende cómo habilitar la API de Cloud Data Fusion para tu proyecto de Google Cloud.

Instructivo
Descripción general de conceptos de Cloud Data Fusion

Aprende sobre los conceptos y las características de Cloud Data Fusion.

Instructivo
Explora el linaje de datos

En este instructivo, se muestra cómo usar Cloud Data Fusion para explorar el linaje de datos: los orígenes de los datos y sus movimientos en el tiempo.

Instructivo
Usa controladores de JDBC en Cloud Data Fusion

Descubre cómo usar controladores de Java Database Connectivity (JDBC) con las canalizaciones de Cloud Data Fusion.

Instructivo
Ingeniería de datos en Google Cloud

Aprende a diseñar y compilar sistemas de procesamiento de datos en Google Cloud mediante esta clase de cuatro días con un instructor.

Casos de uso

Casos de uso

Caso de uso
Data lakes más seguros y modernos en Google Cloud

Cloud Data Fusion ayuda a los usuarios a compilar data lakes distribuidos y escalables en Google Cloud mediante la integración de datos desde plataformas locales aisladas. Los clientes pueden aprovechar el escalamiento de la nube para centralizar los datos y, como resultado, obtener un mayor valor de ellos. Las capacidades de autoservicio de Cloud Data Fusion aumentan la visibilidad del proceso y reducen el costo general de la asistencia operativa.

Caso de uso
Almacenes de datos ágiles con BigQuery

Cloud Data Fusion puede ayudar a las organizaciones a comprender mejor a sus clientes mediante el desglose de los sistemas de datos aislados y la habilitación del desarrollo de soluciones de almacén de datos ágiles y basadas en la nube en BigQuery. Una vista confiable y unificada de la interacción con los clientes y su comportamiento permite mejorar la interacción, lo que conduce a una mayor retención y a mayores ingresos por cliente.

Caso de uso
Entorno de estadísticas unificado

Hoy en día, muchos usuarios desean establecer un entorno de estadísticas unificado en una gran cantidad de costosos data marts locales. El uso de una amplia gama de herramientas desconectadas y medidas provisionales genera desafíos de calidad y seguridad de datos. La amplia variedad de conectores, interfaces visuales y abstracciones centradas en la lógica empresarial de Cloud Data Fusion ayudan a reducir el TCO, a promocionar el autoservicio y la estandarización, y a reducir el trabajo repetitivo.

Todas las características

Todas las características

Autoservicio sin código Para quitar los cuellos de botella, habilita a los usuarios no técnicos a través de una interfaz gráfica sin código que ofrece una integración de datos interactiva.
Ingeniería de datos colaborativa Cloud Data Fusion ofrece la capacidad de crear una biblioteca interna de conexiones y transformaciones personalizadas que pueden validarse, compartirse y reutilizarse en una organización.
Nativa de Google Cloud Arquitectura nativa de Google Cloud completamente administrada que habilita las funciones de escalabilidad, confiabilidad, seguridad y privacidad de Google Cloud.
Integración de datos en tiempo real Replica las bases de datos operativas y transaccionales como SQL Server, Oracle y MySQL, directamente en BigQuery con solo unos pocos clics mediante la función de replicación de Data Fusion. La integración en Datastream te permite enviar transmisiones de cambios a BigQuery para estadísticas continuas. Usa la evaluación de viabilidad para acelerar las iteraciones de desarrollo y la supervisión del rendimiento y el estado de la observabilidad.
Integración por lotes Diseña, ejecuta y opera grandes volúmenes de canalizaciones de datos de manera frecuente con asistencia para fuentes de datos populares, incluidos sistemas de archivos y almacenes de objetos, bases de datos relacionales y NoSQL, sistemas SaaS y unidades centrales. de Google.
Seguridad de nivel empresarial La integración en Cloud Identity and Access Management (IAM), IP privada, VPC-SC y CMEK proporciona seguridad empresarial y disminuye los riesgos, ya que garantiza el cumplimiento normativo y la protección de datos.
Linaje y metadatos de integración Busca conjuntos de datos integrados por metadatos técnicos y de negocio. Realiza un seguimiento del linaje para todos los conjuntos de datos integrados a nivel de conjunto de datos y de campo.
Operaciones sin interrupciones Las API de REST, los programas basados en el tiempo, los activadores basados en el estado de las canalizaciones, los registros, las métricas y los paneles de supervisión simplifican las operaciones en los entornos críticos.
Kit completo de herramientas de integración Los conectores integrados en una variedad de sistemas modernos y heredados, las transformaciones sin código, los condicionales y el procesamiento previo y posterior, las alertas y las notificaciones, y el procesamiento de errores proporcionan una experiencia de integración de datos completa.
Habilitación híbrida El código abierto proporciona la flexibilidad y la portabilidad necesarias para compilar soluciones de integración de datos estandarizadas en entornos híbridos y de múltiples nubes.

Precios

Precios

Los precios de Cloud Data Fusion se dividen entre las horas de instancia de la interfaz y las VM de Dataproc. La edición básica ofrece las primeras 120 horas mensuales por cuenta sin costo.

Edición Precio por hora de instancia de Cloud Data Fusion Cantidad de canalizaciones simultáneas admitidas Cantidad de usuarios admitidos
Desarrollador $0.35 2 (recomendado) 2 (recomendado)
Básica $1.80 Ilimitada Ilimitada
Empresarial $4.20 Ilimitada Ilimitada