BigLake
BigLake è un motore di archiviazione che unifica data warehouse e data lake consentendo a BigQuery e framework open source come Spark di accedere ai dati con un controllo dell'accesso granulare. BigLake offre prestazioni di query accelerate su archiviazione multi-cloud e formati aperti come Apache Iceberg.
-
Archiviazione di un'unica copia di dati con caratteristiche uniformi in data warehouse e lake.
-
Controllo dell'accesso granulare e governance multi-cloud sui dati distribuiti.
-
Integrazione perfetta con strumenti di analisi open source e formati di dati aperti.
Vantaggi
Libertà di scelta
Sblocca l'analisi sui dati distribuiti indipendentemente da dove e come vengono archiviati, scegliendo i migliori strumenti di analisi, open source o cloud-native su una singola copia dei dati.
Data lake sicuri e ad alte prestazioni
Controllo granulare degli accessi su motori open source come Apache Spark, Presto e Trino e formati aperti come Parquet. Query ad alte prestazioni sui data lake basati su BigQuery.
Governance e gestione unificate su larga scala
Integrazione con Dataplex, per la gestione su larga scala, che include l'organizzazione di dati logica, la gestione centralizzata di criteri e metadati, la gestione della qualità e del ciclo di vita e la coerenza tra dati distribuiti.
Funzionalità principali
Funzionalità principali
Controlli di sicurezza granulari
BigLake elimina la necessità di concedere l'accesso a livello di file agli utenti finali. Applica i criteri di sicurezza a livello di tabella, riga e colonna alle tabelle dell'archivio oggetti in modo simile alle tabelle BigQuery esistenti.
Analisi multi-compute
Mantieni una singola copia di dati e rendila accessibile in modo uniforme su Google Cloud e sui motori open source, tra cui BigQuery, Vertex AI, Dataflow, Spark, Presto, Trino e Hive utilizzando i connettori BigLake. Gestisci centralmente i criteri di sicurezza in un unico posto e applicali in modo coerente ai motori di query tramite l'interfaccia API integrata nei connettori.
Governance multi-cloud
Scopri tutte le tabelle di BigLake, incluse quelle definite su Amazon S3, data lake Azure di seconda generazione in Data Catalog. Configura un controllo dell'accesso granulare e applicalo ai cloud durante le query con BigQuery Omni.
Accelerazione delle prestazioni
Ottieni prestazioni leader del settore sulle tabelle di data lake su Google Cloud, AWS e Azure, grazie alla comprovata infrastruttura di BigQuery.
Formati aperti alla base
Ottieni l'accesso ai formati di dati aperti più diffusi, tra cui Parquet, Avro, ORC, CSV e JSON. L'API gestisce più motori di calcolo tramite Apache Arrow.
"Come azienda di e-commerce in rapida espansione, abbiamo riscontrato una rapida crescita dei dati. BigLake ci permette di sfruttare il valore dei data lake consentendo il controllo dell'accesso alle nostre viste, fornendo al contempo un'interfaccia unificata ai nostri utenti e mantenendo bassi i costi di archiviazione dei dati. Questo a sua volta consente di analizzare più rapidamente i nostri set di dati da parte dei nostri utenti".
Novità
Novità
Documentazione
Documentazione
Introduzione a BigLake
Presenta i concetti di BigLake e scopri cosa può fare per semplificare la tua esperienza di analisi.
Introduzione a BigLake
Scopri come creare e gestire le tabelle BigLake, eseguire query su una tabella BigLake tramite BigQuery o altri motori open source utilizzando i connettori.
Prezzi
Prezzi
I prezzi di BigLake si basano sull'esecuzione di query sulle tabelle BigLake, tra cui:
1. I prezzi di BigQuery si applicano alle query su tabelle BigLake definite su Google Cloud Storage.
2. I prezzi di BigQuery Omni si applicano alle query su tabelle BigLake definite su Amazon S3 e Azure Data Lake Gen 2.
3. Query da motori open source che utilizzano i connettori BigLake: i connettori BigLake utilizzano l'API BigQuery Storage e vengono applicati i prezzi corrispondenti fatturati in byte letti e in uscita.