Replica senza interruzioni dai database relazionali direttamente a BigQuery, consentendo insight quasi in tempo reale sui dati operativi.
Replica a bassa latenza per consentire insight quasi in tempo reale in BigQuery
Accesso ai flussi di dati da database MySQL, PostgreSQL, AlloyDB, SQL Server e Oracle
Piattaforma serverless con scalabilità automatica, senza risorse per il provisioning o la gestione
Facile configurazione di pipeline ELT (estrazione, carico, trasformazione) con connettività sicura integrata
Utilizzato da migliaia di clienti per replicare i propri dati operativi in BigQuery
Vantaggi
Replica senza interruzioni i dati da database MySQL, PostgreSQL, AlloyDB SQL Server e Oracle direttamente in BigQuery, con bassa latenza e senza influire sulle prestazioni dell'origine.
Elimina l'overhead operativo con un approccio serverless con scalabilità automatica senza alcuna infrastruttura da gestire.
Un'esperienza di configurazione semplificata consente di avviare la replica dei dati dai database operativi in BigQuery in pochi passaggi.
Funzionalità principali
Datastream utilizza la funzionalità Change Data Capture (CDC) e l'API Storage Write di BigQuery per replicare in modo efficiente gli aggiornamenti direttamente dai sistemi di origine quasi in tempo reale. Non hai più bisogno di soluzioni di replica che sprecano risorse preziose su pipeline di dati complesse, tabelle di gestione temporanea autogestite, logica di unione complessa o conversione per tipo di dati manuale.
Datastream consente di avviare la replica dei dati in BigQuery in pochi passaggi. È sufficiente configurare il database di origine, il tipo di connessione e la destinazione in BigQuery. Datastream per BigQuery esegue il backfill dei dati storici e replica continuamente le nuove modifiche man mano che si verificano.
Datastream legge e distribuisce tutte le modifiche (inserimento, aggiornamento ed eliminazione) dai database MySQL, PostgreSQL, AlloyDB, SQL Server e Oracle in BigQuery con latenza minima. Il database di origine può essere ospitato on-premise, su servizi Google Cloud come Cloud SQL o Bare Metal Solution per Oracle o in qualsiasi altra parte su qualsiasi cloud. Un servizio nativo di Google senza agente creato appositamente per BigQuery che trasmette in modo affidabile ogni evento man mano che si verifica.
Man mano che cambiano gli schemi di origine, Datastream gestisce senza problemi la deviazione dallo schema e replica automaticamente le nuove colonne e le nuove tabelle aggiunte nell'origine a BigQuery.
Datastream supporta diversi metodi di connettività sicura e privata per proteggere i dati in transito. Anche sono inoltre criptati at-rest.
Clienti
Casi d'uso
Datastream legge gli eventi di modifica (inserimenti, aggiornamenti ed eliminazioni) dai database di origine e li scrive nelle tabelle BigQuery quasi in tempo reale. Ciò consente di arricchire i modelli di data warehouse e i modelli di machine learning di BigQuery esistenti con dati transazionali, come gli acquisti al dettaglio, per creare un quadro end-to-end dei dati più completo. Datastream esegue il backfill dei dati storici, replica continuamente le nuove modifiche man mano che vengono apportate e gestisce senza problemi le modifiche allo schema.
Vantaggi principali
La soluzione più semplice per la replica dei dati operativi in BigQuery
Architettura serverless con scale up e scale down automatici
Un'unica interfaccia per la visibilità end-to-end e il monitoraggio delle pipeline di replica
Soluzione personalizzabile con ulteriore flessibilità
Modelli predefiniti supportati da Google per un intervallo di destinazioni
Integrazione di funzionalità aggiuntive come qualità dei dati e mascheramento dei dati
Interfaccia semplice per sviluppatori e analisti di dati ETL
Identificazione anticipata di potenziali problemi e lacune nella replica
Insight quasi in tempo reale sulle prestazioni di replica
Vantaggi principali
La soluzione più semplice per la replica dei dati operativi in BigQuery
Architettura serverless con scale up e scale down automatici
Un'unica interfaccia per la visibilità end-to-end e il monitoraggio delle pipeline di replica
Vantaggi principali
Soluzione personalizzabile con ulteriore flessibilità
Modelli predefiniti supportati da Google per un intervallo di destinazioni
Integrazione di funzionalità aggiuntive come qualità dei dati e mascheramento dei dati
Vantaggi principali
Interfaccia semplice per sviluppatori e analisti di dati ETL
Identificazione anticipata di potenziali problemi e lacune nella replica
Insight quasi in tempo reale sulle prestazioni di replica
Prezzi
I prezzi di Datastream si basano sui dati effettivi elaborati. Sono disponibili prezzi a più livelli basati sui volumi, che sono più convenienti se sposti volumi di dati più elevati. Ulteriori dettagli sui prezzi sono disponibili nella pagina dei prezzi di Datastream.
Le risorse aggiuntive come BigQuery, Cloud Storage e Dataflow vengono fatturate in base ai prezzi di questi servizi.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.