Lavorare con i dati di Salesforce Data Cloud in BigQuery
Gli utenti del cloud di dati possono accedere ai propri dati in modo nativo in BigQuery. Puoi analizzare i dati del cloud di dati con BigQuery Omni ed esegui operazioni cross-cloud l'analisi con i dati in Google Cloud. In questo documento forniamo istruzioni per accedere ai dati di Data Cloud e a diverse attività di analisi che puoi eseguire con questi dati in BigQuery.
Il cloud di dati funziona con BigQuery sulla base la seguente architettura:
Prima di iniziare
Prima di lavorare con i dati del cloud di dati, devi essere un un utente del cloud di dati. Se i Controlli di servizio VPC sono abilitati nel tuo devi avere autorizzazioni aggiuntive.
Ruoli obbligatori
I ruoli e le autorizzazioni seguenti sono obbligatori:
- Iscritto Analytics Hub (
roles/analyticshub.subscriber
) - Amministratore BigQuery (
roles/bigquery.admin
)
Condividi dati dal cloud di dati
Questa documentazione mostra come condividere i dati da Data Cloud a BigQuery - BYOL Data Shares - Zero-ETL Integration with BigQuery.
Collega il set di dati del cloud di dati a BigQuery
Per accedere a un set di dati di un cloud di dati in BigQuery, Devi prima collegare il set di dati a BigQuery seguendo questi passaggi:
Nella console Google Cloud, vai alla pagina BigQuery.
Fai clic su Salesforce Data Cloud.
Vengono visualizzati i set di dati del cloud di dati. Puoi visualizzare nome del set di dati utilizzando il seguente pattern di denominazione:
Sostituisci quanto segue:listing_DATA_SHARE_NAME_TARGET_NAME
DATA_SHARE_NAME
: il nome della condivisione dei dati in Data Cloud.TARGET_NAME
: il nome della destinazione BigQuery in Data Cloud.
Fai clic sul set di dati che vuoi aggiungere a BigQuery.
Fai clic su Aggiungi set di dati al progetto.
Specifica il nome del set di dati collegato.
Dopo aver creato il set di dati collegato, puoi esplorare il set di dati e le tabelle al suo interno. Tutte le tabelle i metadati vengono recuperati dal cloud di dati in modo dinamico. Tutti gli oggetti all'interno del set di dati sono viste mappate Oggetti cloud di dati. BigQuery supporta tre tipi di oggetti Data Cloud:
- Oggetti data lake (DLO)
- Oggetti modello di dati (DMO)
- Oggetti di approfondimento calcolati (CIO)
Tutti questi oggetti sono rappresentati come visualizzazioni in BigQuery. Queste visualizzazioni puntano a tabelle nascoste archiviate in Amazon S3.
Lavorare con i dati di Data Cloud
Gli esempi seguenti utilizzano un set di dati denominato Northwest Trail Outfitters (NTO) ospitato in Data Cloud. Questo set di dati è composto da tre tabelle che rappresentano i dati delle vendite online dell'organizzazione NTO:
linked_nto_john.nto_customers__dll
linked_nto_john.nto_products__dll
linked_nto_john.nto_orders__dll
L'altro set di dati utilizzato in questi esempi è costituito da dati offline dei punti di vendita. Copre le vendite offline e si compone di tre tabelle:
nto_pos.customers
nto_pos.products
nto_pos.orders
I seguenti set di dati archiviano oggetti aggiuntivi:
aws_data
us_data
Eseguire query ad hoc
Con BigQuery Omni, puoi eseguire query ad hoc per analizzare Cloud di dati tramite il set di dati a cui è stata effettuata la sottoscrizione. L'esempio riportato di seguito mostra una query semplice che esegue query sulla tabella customers di Data Cloud.
SELECT name__c, age__c FROM `listing_nto_john.nto_customers__dll` WHERE age > 40 LIMIT 1000;
Esegui query cross-cloud
Le query cross-cloud consentono di unire qualsiasi tabella nella
Regione e tabelle di BigQuery Omni in BigQuery
regioni. Per ulteriori informazioni sulle query tra cloud, consulta questo post del blog.
In questo esempio, recuperiamo le vendite totali per un cliente denominato john
.
-- Get combined sales for a customer from both offline and online sales USING ( SELECT total_price FROM `listing_nto_john.nto_orders__dll` WHERE customer_name = 'john' UNION ALL SELECT total_price FROM `listing_nto_john.nto_orders__dll` WHERE customer_name = 'john' ) a SELECT SUM(total_price);
Trasferimento dati cross-cloud tramite CTAS
Puoi utilizzare Crea tabella come selezione (CTAS) per spostare i dati dalle tabelle Data Cloud nella regione BigQuery Omni alla regione US
.
-- Move all the orders for March to the US region CREATE OR REPLACE TABLE us_data.online_orders_march AS SELECT * FROM listing_nto_john.nto_orders__dll WHERE EXTRACT(MONTH FROM order_time) = 3
La tabella di destinazione è una tabella gestita BigQuery nella regione US
. Questa tabella può essere unita ad altre tabelle. Questa operazione comporta
Costi del traffico AWS in uscita in base alla quantità di dati trasferiti.
Una volta spostati i dati, non dovrai più pagare le tariffe di uscita per le query eseguite nella tabella online_orders_march
.
Viste materializzate cross-cloud
Le viste materializzate cross cloud
(CCMV)
trasferiscono i dati in modo incrementale da una regione BigQuery Omni a una regione BigQuery non Omni.
Configura un nuovo CCMV che trasferisca un riepilogo delle vendite totali dalle transazioni online e replica questi dati nella regione US
.
Puoi accedere ai CCMV da Ads Data Hub e unirli ad altri dati di Ads Data Hub. Per la maggior parte, le VM con CCMV si comportano come le normali tabelle gestite BigQuery.
Creare una vista materializzata locale
Per creare una vista materializzata locale:
-- Create a local materialized view that keeps track of total sales by day CREATE MATERIALIZED VIEW `aws_data.total_sales` OPTIONS (enable_refresh = true, refresh_interval_minutes = 60) AS SELECT EXTRACT(DAY FROM order_time) AS date, SUM(order_total) as sales FROM `listing_nto_john.nto_orders__dll` GROUP BY 1;
Autorizza la vista materializzata
Devi autorizzare le viste materializzate per creare un CCMV. Tu
può autorizzare la vista (aws_data.total_sales
) o il set di dati (aws_data
). Per autorizzare la vista materializzata:
Nella console Google Cloud, vai alla pagina BigQuery.
Apri il set di dati di origine
listing_nto_john
.Fai clic su Condivisione e poi su Autorizza set di dati.
Inserisci il nome del set di dati (in questo caso
listing_nto_john
) e fai clic su Ok.
Crea una vista materializzata della replica
Crea una nuova vista materializzata della replica nella regione US
. La vista materializzata viene replicata periodicamente ogni volta che si verifica una modifica dei dati di origine per mantenere aggiornata la replica.
-- Create a replica MV in the us region. CREATE MATERIALIZED VIEW `us_data.total_sales_replica` AS REPLICA OF `aws_data.total_sales`;
Esegui una query su una vista materializzata della replica
L'esempio seguente esegue una query su una vista materializzata della replica:
-- Find total sales for the current month for the dashboard SELECT EXTRACT(MONTH FROM CURRENT_DATE()) as month, SUM(sales) FROM us_data.total_sales_replica WHERE month = EXTRACT(MONTH FROM date) GROUP BY 1
Utilizzo dei dati di Data Cloud con INFORMATION_SCHEMA
I set di dati Data Cloud supportano le visteINFORMATION_SCHEMA
BigQuery. I dati di INFORMATION_SCHEMA
viste sono
sincronizzati regolarmente dal cloud di dati e potrebbero non essere aggiornati. La
Colonna SYNC_STATUS
in TABLES
e SCHEMATA
visualizzazioni di programmi
data e ora dell'ultima sincronizzazione completata, gli eventuali errori che impediscono
a BigQuery di fornire dati aggiornati e qualsiasi
i passaggi necessari per correggere l'errore.
Le query INFORMATION_SCHEMA
non riflettono i set di dati creati di recente prima della sincronizzazione iniziale.
I set di dati di Data Cloud sono soggetti alle stesse
limitazioni degli altri
set di dati collegati, ad esempio sono accessibili solo in INFORMATION_SCHEMA
nelle
query basate sui set di dati.
Passaggi successivi
Scopri di più su BigQuery Omni.
Scopri di più sui join cross-cloud.
Scopri di più sulle viste materializzate.