Mira la Cumbre de datos de la nube on demand y obtén información sobre las innovaciones más recientes en estadísticas, IA, IE y bases de datos.

Ir a
Cloud Data Fusion

Cloud Data Fusion

Integración completamente administrada de datos nativos de la nube a cualquier escala.

Los clientes nuevos obtienen $300 en créditos gratuitos que pueden usar en Data Fusion. Todos los clientes obtienen las primeras 120 horas de desarrollo de canalizaciones gratis por mes y por cuenta, y no se cobran de tus créditos.

  • Interfaz visual de apuntar y hacer clic que permite la implementación sin código de las canalizaciones de ETL/ELT

  • Amplia biblioteca con más de 150 conectores y transformaciones preconfigurados sin costo adicional

  • Los mejores servicios integrados de forma nativa de Google Cloud

  • Linaje de datos de extremo a extremo para analizar el impacto y la causa raíz

  • Compilado con un núcleo de código abierto (CDAP) para lograr la portabilidad de la canalización

Beneficios

Evita cuellos de botella técnicos y aumenta la productividad

La interfaz intuitiva de Data Fusion en la que se puede arrastrar y soltar, los conectores integrados y el modelo de autoservicio de integración de datos sin código quitan los cuellos de botella técnicos basados en la experiencia y aceleran las estadísticas.

Disminuye el costo total de propiedad de la canalización

Un enfoque sin servidores que aprovecha la escalabilidad y confianza de los servicios de Google como Managed Service para Apache Spark significa que Data Fusion ofrece la mejor capacidad de integración con un menor costo total de propiedad.

Compila con una base de administración de datos

Con funciones integradas como el linaje de datos de extremo a extremo, la integración de metadatos y los servicios de protección de datos y seguridad nativos de la nube, Data Fusion asiste a los equipos con el cumplimiento y el análisis del impacto o la causa raíz.

Características clave

Características clave

Un núcleo abierto que entrega una integración híbrida y de múltiples nubes

Data Fusion se compiló con el proyecto CDAP de código abierto; este núcleo abierto garantiza a los usuarios la portabilidad de la canalización de datos. La amplia integración de CDAP con las plataformas locales y de nube pública brinda a los usuarios de Cloud Data Fusion la capacidad de desglosar sistemas aislados y entregar estadísticas valiosas que antes eran inaccesibles.

Integración en las herramientas de macrodatos líderes de la industria de Google

La integración de Data Fusion en Google Cloud simplifica la seguridad de los datos y garantiza la disponibilidad inmediata de los datos para su análisis. Ya sea que selecciones un data lake con Cloud Storage y Managed Service para Apache Spark, transfiriendo datos a BigQuery para su almacenamiento o transformando datos para dirigirlos a un almacén relacional como Spanner, la integración de Cloud Data Fusion acelera y simplifica el desarrollo y la iteración.

Integración de datos a través de la colaboración y la estandarización

Cloud Data Fusion ofrece transformaciones compiladas previamente para el procesamiento por lotes y en tiempo real. Proporciona la capacidad de crear una biblioteca interna de conexiones y transformaciones personalizadas que se puedan validar, compartir y reutilizar entre equipos. Sienta las bases de la ingeniería de datos colaborativa y mejora la productividad. El resultado son menores tiempos de espera para los desarrolladores de ETL y los ingenieros de datos y, lo que es más importante, una menor preocupación por la calidad del código.

Documentación

Documentación

Tutorial

Habilita Cloud Data Fusion

Aprende cómo habilitar la API de Cloud Data Fusion para tu proyecto de Google Cloud.

Tutorial

Descripción general de conceptos de Cloud Data Fusion

Aprende sobre los conceptos y las funciones de Cloud Data Fusion.

Tutorial

Explorar linaje de datos

En este instructivo, se muestra cómo usar Cloud Data Fusion para explorar el linaje de datos: los orígenes de los datos y sus movimientos en el tiempo.

Tutorial

Usa controladores de JDBC en Cloud Data Fusion

Descubre cómo usar controladores de Java Database Connectivity (JDBC) con las canalizaciones de Cloud Data Fusion.

Tutorial

Ingeniería de datos en Google Cloud

Aprende cómo diseñar y compilar sistemas de procesamiento de datos en Google Cloud con esta clase de cuatro días dirigida por un instructor.

¿No encuentras lo que buscas?

Casos de uso

Casos de uso

Caso de uso
Data lakes más seguros y modernos en Google Cloud

Cloud Data Fusion ayuda a los usuarios a compilar data lakes distribuidos y escalables en Google Cloud integrando datos desde plataformas locales aisladas. Los clientes pueden aprovechar la escala de la nube para centralizar los datos y, como resultado, obtener un mayor valor de ellos. Las capacidades de autoservicio de Cloud Data Fusion aumentan la visibilidad del proceso y reducen el costo general de la asistencia operativa.

Caso de uso
Almacenes de datos ágiles con BigQuery

Cloud Data Fusion puede ayudar a las organizaciones a comprender mejor a sus clientes a través del desglose de los silo de datos y la habilitación del desarrollo de soluciones de almacén de datos ágiles y basadas en la nube en BigQuery. Una vista confiable y unificada de la participación y el comportamiento del cliente permite impulsar una mejor experiencia del cliente, lo que conduce a una mayor retención y a mayores ingresos por cliente.

Caso de uso
Entorno de estadísticas unificado

Hoy en día, muchos usuarios desean establecer un entorno de estadísticas unificado en una gran cantidad de costosos data marts locales. El uso de una amplia gama de herramientas desconectadas y medidas provisionales genera desafíos de calidad y comprobaciones de seguridad. La amplia variedad de conectores, interfaces visuales y abstracciones de Cloud Data Fusion, centrados en la lógica empresarial, ayudan a reducir el costo total de propiedad (TCO), promocionar el autoservicio y la estandarización, y reducir el trabajo repetitivo.

Todas las características

Todas las funciones

Autoservicio sin código

Elimina los cuellos de botella mediante la admisión de los usuarios no técnicos a través de una interfaz gráfica sin código que ofrece una integración de datos interactiva.

Ingeniería de datos colaborativa

Cloud Data Fusion ofrece la capacidad de crear una biblioteca interna de conexiones y transformaciones personalizadas que pueden validarse, compartirse y volver a usarse en una organización.

Nativa de Google Cloud

La arquitectura nativa de Google Cloud completamente administrada habilita las funciones de escalabilidad, confiabilidad, seguridad y privacidad de Google Cloud.

Integración de datos en tiempo real

Replica las bases de datos operativas y transaccionales como SQL Server, Oracle y MySQL, directamente en BigQuery con solo unos pocos clics con la función de replicación de Data Fusion. La integración en Datastream te permite enviar flujos de cambios a BigQuery para estadísticas continuas. Usa la evaluación de viabilidad para acelerar las iteraciones de desarrollo y la supervisión del rendimiento y el estado de la observabilidad.

Integración por lotes

Diseña, ejecuta y opera grandes volúmenes de canalizaciones de datos de manera frecuente con asistencia para fuentes de datos populares, incluidos sistemas de archivos y almacenes de objetos, bases de datos relacionales y NoSQL, sistemas SaaS y unidades centrales.

Seguridad de nivel empresarial

La integración en Cloud Identity and Access Management (IAM), IP privada, VPC-SC y CMEK proporciona seguridad empresarial y disminuye los riesgos, ya que garantiza el cumplimiento normativo y la protección de datos.

Linaje y metadatos de integración

Busca conjuntos de datos integrados por metadatos técnicos y de negocio. Realiza un seguimiento del linaje para todos los conjuntos de datos integrados a nivel de conjunto de datos y de campo.

Operaciones sin interrupciones

Las API de REST, los programas basados en el tiempo, los activadores de las canalizaciones basados en el estado, los registros, las métricas y los paneles de supervisión simplifican las operaciones en los entornos críticos.

Kit completo de herramientas de integración

Los conectores integrados en una variedad de sistemas modernos y heredados, las transformaciones sin código, los condicionales y el procesamiento previo y posterior, las alertas y las notificaciones, y el procesamiento de errores proporcionan una experiencia de integración de datos completa.

Habilitación híbrida

El código abierto proporciona la flexibilidad y la portabilidad necesarias para crear soluciones de integración de datos estandarizadas en entornos híbridos y de múltiples nubes.

Precios

Precios

Los precios de Cloud Data Fusion se desglosan de la siguiente manera:  

1. Costo de diseño: Se basa en la cantidad de horas que se ejecuta una instancia y no en la cantidad de canalizaciones que se desarrollan y ejecutan. La edición básica ofrece las primeras 120 horas mensuales por cuenta sin costo.

2. Costo de procesamiento: El costo de los clústeres de Managed Service para Apache Spark que se usan para ejecutar las canalizaciones.

Edición

Precio por hora de instancia de Cloud Data Fusion

Número de canalizaciones simultáneas admitidas

Número de usuarios admitidos

Desarrollador

US$0.35

2 (Recomendado)

2 (Recomendado)

Básico

US$1.80

Ilimitado

Ilimitado

Enterprise

US$4.20

Ilimitado

Ilimitado

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Cloud Data Fusion
Google Cloud