Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.
Datastream para BigQuery habilita las estadísticas empresariales casi en tiempo real. Leer el blog.
Ir a

Vista previa de Datastream para BigQuery

Replicación continua desde bases de datos relacionales directamente a BigQuery, lo que permite obtener estadísticas casi en tiempo real sobre los datos operativos.

  • Replicación de baja latencia para habilitar estadísticas casi en tiempo real en BigQuery

  • Acceso a datos de transmisión desde bases de datos MySQL, PostgreSQL, AlloyDB y Oracle

  • Plataforma sin servidores que escala automáticamente, sin recursos para aprovisionar o administrar

  • Configuración sencilla de canalizaciones ELT (extraer, cargar, transformar) con conectividad segura integrada

Beneficios

Replica los datos operativos con una latencia mínima

Replica sin problemas datos de bases de datos de MySQL, PostgreSQL, AlloyDB y Oracle directamente en BigQuery, con una latencia baja y sin afectar el rendimiento de las fuentes.

Escala y reduce la escala verticalmente con una arquitectura sin servidores

Elimina la sobrecarga operativa con un enfoque sin servidores que escala de forma automática sin necesidad de administrar la infraestructura.

Ponte en marcha en minutos

Una experiencia de configuración simplificada te permite comenzar a replicar datos de tus bases de datos operativas a BigQuery en pocos pasos.

Características clave

Funciones clave

Replicación de datos operativos en BigQuery

Datastream usa la funcionalidad de captura de datos modificados (CDC) de BigQuery y la API de Storage Write para replicar de manera eficiente las actualizaciones directamente desde los sistemas de origen casi en tiempo real. Ya no necesitas soluciones de replicación que desperdician recursos valiosos en canalizaciones de datos complejas, tablas de etapa de pruebas autoadministradas, una lógica de combinación difícil o una conversión de tipo de datos manual.

Configuración simplificada

Datastream te permite comenzar a replicar datos en BigQuery en unos pocos pasos. Solo configura la base de datos de origen, el tipo de conexión y el destino en BigQuery, y listo. Datastream para BigQuery reabastecerá los datos históricos y replicará continuamente los cambios nuevos a medida que ocurran.

Transmisión de datos desde bases de datos relacionales

Datastream lee y entrega cada cambio (inserción, actualización, eliminación) desde tus bases de datos MySQL, PostgreSQL, AlloyDB y Oracle y Oracle en BigQuery con una latencia mínima. La base de datos de origen se puede alojar de forma local en los servicios de Google Cloud, como Cloud SQL o la solución Bare Metal para Oracle, o en cualquier otro lugar de la nube. Un servicio sin agente y nativo de Google creado específicamente para BigQuery, que transmite de manera confiable cada evento a medida que sucede. 

Resolución de desvío de esquema

A medida que cambian los esquemas de origen, Datastream maneja sin problemas el desvío de esquema y replica automáticamente las columnas y tablas nuevas que se agregan en la fuente a BigQuery.

Diseño que brinda seguridad

Datastream admite varios métodos de conectividad privada y segura para proteger los datos en tránsito. Los datos también se encriptan en reposo.

Clientes

Los clientes usan Datastream y BigQuery para obtener estadísticas en tiempo real

Casos de uso

Casos de uso

Caso de uso
Replicación sin servidores en BigQuery

Datastream lee los eventos de cambio (inserciones, actualizaciones y eliminaciones) de las bases de datos de origen y los escribe en tablas de BigQuery casi en tiempo real. Esto te permite enriquecer los almacenes de datos y los modelos de AA de BigQuery existentes con datos transaccionales, como las compras minoristas, para crear un panorama más completo de los datos. Datastream reabastecerá los datos históricos, repetirá continuamente los cambios nuevos a medida que ocurren y manejará sin problemas los cambios de esquema.

Replicación sin servidores en BigQuery

Comparar funciones

Compara las opciones para transmitir datos de bases de datos operativas a BigQuery

Datastream para BigQuery

Solución completamente administrada para replicar datos de bases de datos transaccionales en BigQuery

Datastream y Dataflow

Solución personalizable para replicar cambios en las fuentes de datos

Datastream y Data Fusion

Asistente sin código que forma parte de un servicio de ETL completamente administrado

Ventajas clave

  • La opción más fácil para replicar datos operativos a BigQuery

  • Arquitectura sin servidores que aumenta y reduce la escala automáticamente

  • Interfaz única para la visibilidad de extremo a extremo y la supervisión de las canalizaciones de replicación

  • Solución personalizable con flexibilidad adicional

  • Plantillas prediseñadas compatibles con Google para varios destinos

  • Integración de funciones adicionales, como la calidad y el enmascaramiento de datos

  • Interfaz sencilla para desarrolladores de ETL y analistas de datos

  • Identificación de posibles problemas y brechas en la replicación por adelantado

  • Estadísticas casi en tiempo real sobre el rendimiento de la replicación

Solución completamente administrada para replicar datos de bases de datos transaccionales en BigQuery

Ventajas clave

  • La opción más fácil para replicar datos operativos a BigQuery

  • Arquitectura sin servidores que aumenta y reduce la escala automáticamente

  • Interfaz única para visualizar y supervisar las canalizaciones de replicación de extremo a extremo

Solución personalizable para replicar cambios en las fuentes de datos

Ventajas clave

  • Solución personalizable con flexibilidad adicional

  • Plantillas prediseñadas compatibles con Google para varios destinos

  • Integración de funciones adicionales, como la calidad y el enmascaramiento de datos

Asistente sin código que forma parte de un servicio de ETL completamente administrado

Ventajas clave

  • Interfaz sencilla para desarrolladores de ETL y analistas de datos

  • Identificación de posibles problemas y brechas en la replicación por adelantado

  • Estadísticas casi en tiempo real sobre el rendimiento de la replicación

También puedes transmitir datos desde bases de datos operativas a BigQuery con soluciones de ETL/ELT de socios, Kafka o trabajos por lotes. En comparación con estas opciones, Datastream suele tener las ventajas de la arquitectura sin servidores, la facilidad de integración y la latencia baja.

Precios

Precios de DataStream

Los precios de Datastream se basan en datos reales procesados. Los precios por niveles basados en el volumen están disponibles, lo que hace que sea más asequible si transfieres grandes volúmenes de datos. Para obtener detalles adicionales sobre los precios, consulta la página de precios de Datastream.

Los recursos adicionales, como BigQuery, Cloud Storage y Dataflow, se facturan según los precios de esos servicios.