Replicación continua desde bases de datos relacionales directamente a BigQuery, lo que permite obtener estadísticas casi en tiempo real sobre los datos operativos.
Replicación de baja latencia para habilitar estadísticas casi en tiempo real en BigQuery
Acceso a datos de transmisión de bases de datos MySQL, PostgreSQL, AlloyDB, SQL Server y Oracle
Plataforma sin servidores que escala automáticamente, sin recursos para aprovisionar o administrar
Configuración sencilla de canalizaciones ELT (extraer, cargar, transformar) con conectividad segura integrada
Miles de clientes los usan para replicar sus datos operativos en BigQuery
Beneficios
Replica sin problemas datos de bases de datos MySQL, PostgreSQL, AlloyDB, SQL Server y Oracle directamente en BigQuery, con una latencia baja y sin afectar el rendimiento de las fuentes.
Elimina la sobrecarga operativa con un enfoque sin servidores que escala de forma automática sin necesidad de administrar la infraestructura.
Una experiencia de configuración simplificada te permite comenzar a replicar datos de tus bases de datos operativas a BigQuery en pocos pasos.
Características clave
Datastream usa la funcionalidad de captura de datos modificados (CDC) de BigQuery y la API de Storage Write para replicar de manera eficiente las actualizaciones directamente desde los sistemas de origen casi en tiempo real. Ya no necesitas soluciones de replicación que desperdician recursos valiosos en canalizaciones de datos complejas, tablas de etapa de pruebas autoadministradas, una lógica de combinación difícil o una conversión de tipo de datos manual.
Datastream te permite comenzar a replicar datos en BigQuery en unos pocos pasos. Solo configura la base de datos de origen, el tipo de conexión y el destino en BigQuery, y listo. Datastream para BigQuery reabastecerá los datos históricos y replicará continuamente los cambios nuevos a medida que ocurran.
Datastream lee y entrega cada cambio (inserción, actualización, eliminación) desde tus bases de datos MySQL, PostgreSQL, AlloyDB, SQL Server y Oracle en BigQuery con una latencia mínima. La base de datos de origen se puede alojar de forma local en los servicios de Google Cloud, como Cloud SQL o la solución Bare Metal para Oracle, o en cualquier otro lugar de la nube. Un servicio sin agentes y nativo de Google creado específicamente para BigQuery, que transmite de manera confiable cada evento a medida que sucede.
A medida que cambian los esquemas de origen, Datastream maneja sin problemas el desvío de esquema y replica automáticamente las columnas y tablas nuevas que se agregan en la fuente a BigQuery.
Datastream admite varios métodos de conectividad privada y segura para proteger los datos en tránsito. Los datos también se encriptan en reposo.
Clientes
Casos de uso
Datastream lee los eventos de cambio (inserciones, actualizaciones y eliminaciones) de las bases de datos de origen y los escribe en tablas de BigQuery casi en tiempo real. Esto te permite enriquecer los almacenes de datos y los modelos de AA de BigQuery existentes con datos transaccionales, como las compras minoristas, para crear un panorama más completo de los datos. Datastream reabastecerá los datos históricos, repetirá continuamente los cambios nuevos a medida que ocurren y manejará sin problemas los cambios de esquema.
Ventajas clave
La opción más fácil para replicar datos operativos a BigQuery
Arquitectura sin servidores que aumenta y reduce la escala automáticamente
Interfaz única para visualizar y supervisar las canalizaciones de replicación de extremo a extremo
Solución personalizable con flexibilidad adicional
Plantillas prediseñadas compatibles con Google para varios destinos
Integración de funciones adicionales, como la calidad y el enmascaramiento de datos
Interfaz sencilla para desarrolladores de ETL y analistas de datos
Identificación de posibles problemas y brechas en la replicación por adelantado
Estadísticas casi en tiempo real sobre el rendimiento de la replicación
Ventajas clave
La opción más fácil para replicar datos operativos a BigQuery
Arquitectura sin servidores que aumenta y reduce la escala automáticamente
Interfaz única para visualizar y supervisar las canalizaciones de replicación de extremo a extremo
Ventajas clave
Solución personalizable con flexibilidad adicional
Plantillas prediseñadas compatibles con Google para varios destinos
Integración de funciones adicionales, como la calidad y el enmascaramiento de datos
Ventajas clave
Interfaz sencilla para desarrolladores de ETL y analistas de datos
Identificación de posibles problemas y brechas en la replicación por adelantado
Estadísticas casi en tiempo real sobre el rendimiento de la replicación
Precios
Los precios de Datastream se basan en datos reales procesados. Los precios por niveles basados en el volumen están disponibles, lo que hace que sea más asequible si transfieres grandes volúmenes de datos. Para obtener detalles adicionales sobre los precios, consulta la página de precios de Datastream.
Los recursos adicionales, como BigQuery, Cloud Storage y Dataflow, se facturan según los precios de esos servicios.
Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.