Introduzione ad Analytics Hub
Analytics Hub è una piattaforma di scambio di dati che ti consente di condividere dati e approfondimenti su larga scala oltre i confini dell'organizzazione con un solido framework per la sicurezza e la privacy. Con Analytics Hub puoi scoprire e accedere a una raccolta di dati selezionati da vari fornitori di dati. Questa biblioteca di dati include anche i set di dati forniti da Google.
Ad esempio, utilizzando Analytics Hub puoi migliorare le tue iniziative di analisi e ML con set di dati di terze parti e di Google.
In qualità di utente di Analytics Hub, puoi eseguire le seguenti attività:
In qualità di publisher di Analytics Hub, puoi monetizzare i dati condividendoli in tempo reale con la tua rete di partner o all'interno della tua organizzazione. Le schede ti consentono di condividere i dati senza replicarli. Puoi creare un catalogo di origini dati pronte per l'analisi con autorizzazioni granulari che ti consentono di fornire i dati ai segmenti di pubblico giusti. Puoi anche gestire gli abbonamenti e visualizzare le metriche di utilizzo per le tue schede.
In qualità di abbonato ad Analytics Hub, puoi trovare i dati che stai cercando, combinare i dati condivisi con quelli esistenti e sfruttare le funzionalità integrate di BigQuery. Quando ti abboni a una scheda, nel tuo progetto viene creato un set di dati collegato o una sottoscrizione Pub/Sub collegata. Puoi gestire le tue iscrizioni utilizzando la risorsa Subscription, che memorizza le informazioni pertinenti sull'abbonato e rappresenta il collegamento tra editore e abbonato.
In qualità di visualizzatore di Analytics Hub, puoi sfogliare i set di dati a cui hai accesso in Analytics Hub e richiedere al publisher di accedere ai dati condivisi.
In qualità di amministratore di Analytics Hub, puoi creare scambi di dati che consentano la condivisione dei dati e poi concedere le autorizzazioni ai publisher e ai sottoscrittori di dati per accedere a questi scambi.
Per saperne di più sui ruoli utente di Analytics Hub, consulta Configurare i ruoli di Analytics Hub.
Architettura
Analytics Hub si basa su un modello di pubblicazione e sottoscrizione delle risorse di dati di Google Cloud, che consente la condivisione in zero-copy. Analytics Hub supporta le seguenti risorse Google Cloud:
- Set di dati di BigQuery
- Argomenti Pub/Sub
I flussi di lavoro di publisher e abbonati in Analytics Hub sono descritti in dettaglio nelle sezioni seguenti.
Flusso di lavoro del publisher
Il seguente diagramma descrive l'interazione dei publisher con Analytics Hub:
Nella figura 1 sono etichettate le seguenti funzionalità: Risorse condivise, Scambio di dati e Scheda.
Risorse condivise
Le risorse condivise sono l'unità di condivisione da parte di un publisher in Analytics Hub.
Set di dati condivisi
- Un set di dati condiviso è un set di dati BigQuery che costituisce l'unità di condivisione dei dati in Analytics Hub. La separazione del calcolo e dello spazio di archiviazione nell'architettura di BigQuery consente ai publisher di dati di condividere set di dati con un numero illimitato di iscritti senza dover creare più copie dei dati. In qualità di publisher, crei o utilizzi un set di dati BigQuery esistente nel tuo progetto con i seguenti oggetti supportati che vuoi inviare ai tuoi abbonati:
- Visualizzazioni autorizzate
- Set di dati autorizzati
- Modelli BigQuery ML
- Tabelle esterne
- Viste materializzate
- Routine. Non tutte le routine sono supportate nei set di dati condivisi. Per ulteriori informazioni, vedi Limitazioni.
- Tabelle
- Snapshot delle tabelle
- Visualizzazioni
Argomenti condivisi (anteprima)
- Un argomento condiviso è un argomento Pub/Sub, ovvero l'unità di condivisione dei dati in streaming in Analytics Hub. In qualità di publisher, crei o utilizzi un canale Pub/Sub esistente nel tuo progetto e lo distribuisci ai tuoi sottoscrittori.
Scambi di dati
- Uno scambio di dati è un contenitore che consente la condivisione self-service dei dati. Contiene schede che fanno riferimento a risorse condivise. Con
Analytics Hub, i publisher e gli amministratori possono concedere l'accesso ai
subscriber a livello di piattaforma di scambio pubblicitario e di scheda. Questo metodo consente di evitare di concedere esplicitamente l'accesso alle risorse condivise sottostanti. Un abbonato ad Analytics Hub può sfogliare gli scambi di dati, scoprire a quali dati può accedere e abbonarsi alle risorse condivise. Quando crei uno scambio di dati, puoi assegnargli un'email di contatto principale. L'indirizzo email del contatto principale consente agli utenti di contattare il proprietario di uno scambio di dati in caso di domande o dubbi in merito. Uno scambio di dati può essere dei seguenti tipi:
- Scambio di dati privati. Per impostazione predefinita, uno scambio di dati è privato e solo gli utenti o i gruppi che hanno accesso allo scambio possono visualizzare o iscriversi alle relative schede.
- Scambio di dati pubblici. Per impostazione predefinita, uno scambio di dati è privato e solo gli utenti o i gruppi che hanno accesso allo scambio possono visualizzare o iscriversi alle sue schede. Tuttavia, puoi scegliere di rendere pubblico uno scambio di dati. Le schede nelle piattaforme di scambio dati pubbliche possono essere riportate alla luce e oggetto di iscrizione da parte degli utenti di Google Cloud (
allAuthenticatedUsers
). Per saperne di più sulle piattaforme di scambio dati pubbliche, consulta Rendere pubblico un scambio di dati.
In qualità di amministratore di Analytics Hub, puoi creare più scambi di dati in Analytics Hub e gestire altri utenti di Analytics Hub.
Schede
- Una scheda è un riferimento a una risorsa condivisa che un publisher elenca in uno scambio di dati. In qualità di publisher, puoi creare una scheda e specificare la descrizione della risorsa, query di esempio da eseguire o dati di messaggio di esempio, link a documentazione pertinente e eventuali informazioni aggiuntive che possono aiutare gli abbonati a utilizzare la risorsa condivisa. Quando crei una scheda, puoi assegnare un indirizzo email di contatto principale, il nome e il contatto del fornitore e il nome e il contatto dell'editore.
L'indirizzo email del contatto principale consente agli utenti di contattare il proprietario di una scheda in caso di domande o dubbi sull'interscambio di dati. Il nome e i dati di contatto del fornitore sono le informazioni dell'agenzia che ha fornito originariamente i dati per la scheda. Queste informazioni sono facoltative. Il nome e i dati di contatto del publisher sono quelli dell'agenzia che ha pubblicato i dati per l'utilizzo in Analytics Hub. Queste informazioni sono facoltative. Per saperne di più, consulta Gestire le schede. Una scheda può essere di due tipi, in base al criterio IAM (Identity and Access Management) impostato per la scheda e al tipo di piattaforma di scambio dati che la contiene:
- Scheda pubblica. È condivisa con tutti gli
utenti di Google Cloud (
allAuthenticatedUsers
). Le schede in uno scambio di dati pubblico sono schede pubbliche. Queste schede possono essere riferimenti a una risorsa pubblica gratuita o a una risorsa commerciale. Se la scheda riguarda una risorsa commerciale, gli abbonati possono richiedere l'accesso alla scheda e il fornitore di dati li contatta direttamente. - Scheda privata. Viene condivisa direttamente con persone o gruppi. Ad esempio, una scheda privata può fare riferimento al set di dati delle metriche di marketing che condividi con altri team interni della tua organizzazione.
- Scheda pubblica. È condivisa con tutti gli
utenti di Google Cloud (
Flusso di lavoro degli abbonati
Il seguente diagramma descrive l'interazione degli abbonati con Analytics Hub:
Nella figura 2 sono etichettate le seguenti funzionalità di Analytics Hub: Risorse condivise, Scambio di dati, Scheda e Risorse collegate.
Risorse collegate
Le risorse collegate vengono create quando ti abboni a una scheda di Analytics Hub, collegando un abbonato alla risorsa condivisa sottostante.
Set di dati collegati
- Un set di dati collegato è un set di dati BigQuery di sola lettura che funge da indice o riferimento a un set di dati condiviso. L'abbonamento a una scheda crea un set di dati collegato nel progetto e non una copia del set di dati, pertanto gli abbonati possono leggere i dati, ma non possono aggiungere o aggiornare gli oggetti al suo interno. Quando esegui query su oggetti come tabelle e viste tramite un set di dati collegato, vengono restituiti i dati del set di dati condiviso. Per ulteriori informazioni sui set di dati collegati, consulta Visualizzare e abbonarsi alle schede. I set di dati collegati sono autorizzati ad accedere alle tabelle e alle viste di un set di dati condiviso. Gli abbonati con set di dati collegati accedono alle tabelle e alle viste di un set di dati condiviso senza alcuna autorizzazione aggiuntiva di Identity and Access Management. I set di dati collegati supportano i seguenti oggetti:
Abbonamenti Pub/Sub collegati (anteprima)
- La sottoscrizione a una scheda con un argomento condiviso crea una sottoscrizione Pub/Sub collegata nel progetto del sottoscrittore. Non vengono create copie dei dati degli argomenti o dei messaggi condivisi. I sottoscrittori della sottoscrizione Pub/Sub collegata possono accedere ai messaggi pubblicati nell'argomento condiviso. Gli iscritti accedono ai dati dei messaggi di un argomento condiviso senza alcuna autorizzazione aggiuntiva di Identity and Access Management. I publisher possono gestire gli abbonamenti sia direttamente in Pub/Sub sia tramite la gestione degli abbonamenti di Analytics Hub. Per ulteriori informazioni sulle sottoscrizioni Pub/Sub collegate, consulta Condivisione di stream con Pub/Sub.
Opzioni di traffico in uscita dei dati (solo set di dati condivisi BigQuery)
Le opzioni per il traffico in uscita dai dati consentono ai publisher di limitare l'esportazione dei dati dai set di dati collegati di BigQuery da parte degli abbonati.
I publisher possono attivare la limitazione dell'esportazione dei dati su una scheda, sui risultati di una query o su entrambi. Quando l'esportazione dei dati è limitata, vengono applicate le seguenti limitazioni:
Le API di copia, clonazione, esportazione e snapshot sono disabilitate.
Le opzioni di copia, clonazione, esportazione e snapshot nella console Google Cloud sono disattivate.
La connessione del set di dati con limitazioni all'esplora tabelle è disabilitata.
BigQuery Data Transfer Service è disattivato nel set di dati con limitazioni.
Gli istruzioni
CREATE TABLE AS SELECT
e la scrittura in una tabella di destinazione sono disattivate.Le istruzione
CREATE VIEW AS SELECT
e la scrittura in una visualizzazione di destinazione sono disattivate.
Quando crei una scheda, puoi impostare le opzioni di esportazione dei dati appropriate.
Limitazioni
Analytics Hub presenta i seguenti limiti:
Un set di dati condiviso può avere un massimo di 1000 set di dati collegati.
Un argomento condiviso può avere massimo 10.000 iscrizioni Pub/Sub. Questo limite include le sottoscrizioni Pub/Sub collegate e le sottoscrizioni Pub/Sub create al di fuori di Analytics Hub (ad es. direttamente da Pub/Sub).
Un set di dati con risorse non supportate non può essere selezionato come set di dati condiviso quando crei una scheda. Per ulteriori informazioni sugli oggetti BigQuery supportati da Analytics Hub, consulta Set di dati condivisi in questo documento.
Non puoi impostare ruoli IAM o norme IAM su singole tabelle all'interno di un set di dati collegato. Applicali invece a livello di set di dati collegato.
I set di dati collegati creati prima del 25 luglio 2023 non vengono sottoposti a backfill dalla risorsa di abbonamento. Solo gli abbonamenti creati dopo il 25 luglio 2023 funzionano con i metodi dell'API.
Se sei un publisher, si applicano i seguenti limiti di interoperabilità di BigQuery:
Per poter eseguire query sulle visualizzazioni all'interno dei set di dati collegati, gli abbonati devono disporre di autorizzazioni esplicite per leggere il set di dati di origine. Per concedere l'accesso alle visualizzazioni, come best practice i publisher dovrebbero creare viste autorizzate. Le viste autorizzate possono concedere agli iscritti l'accesso ai dati della vista senza concedere loro l'accesso ai dati di origine sottostanti.
Il piano di query mostra la query della vista condivisa e la query di routine, inclusi gli ID progetto e altri set di dati coinvolti nelle viste autorizzate. Non includere mai elementi come le chiavi di crittografia che ritieni sensibili nella query della routine o della visualizzazione condivisa.
I set di dati condivisi sono indicizzati in Data Catalog. Gli aggiornamenti di un set di dati condiviso, ad esempio l'aggiunta di tabelle o viste, vengono messi a disposizione degli abbonati senza alcun ritardo. Tuttavia, in alcuni scenari, ad esempio quando in un set di dati condiviso sono presenti più di cento iscritti o tabelle, l'indicizzazione degli aggiornamenti in Data Catalog potrebbe richiedere fino a 18 ore. A causa del ritardo nell'indicizzazione, gli abbonati non possono cercare immediatamente queste risorse aggiornate nella console Google Cloud.
Gli argomenti condivisi sono indicizzati in Data Catalog, ma non puoi filtrare in base al tipo di risorsa.
Se hai configurato criteri di sicurezza a livello di riga o di mascheramento dei dati sulle tabelle elencate, gli abbonati devono essere clienti Enterprise o Enterprise Plus per eseguire il job di query sul set di dati collegato. Per informazioni sulle versioni, consulta Introduzione alle versioni di BigQuery.
Se hai un abbonamento, si applicano i seguenti limiti di interoperabilità di BigQuery:
Le viste materializzate che fanno riferimento alle tabelle nel set di dati collegato non sono supportate.
Non è supportato l'acquisizione di snapshot delle tabelle dei set di dati collegati.
Le query con set di dati collegati e istruzioni
JOIN
di dimensioni superiori a 1 TB (spazio di archiviazione fisico) potrebbero non riuscire. Per risolvere il problema, puoi contattare l'assistenza.Non puoi utilizzare i qualificatori di regione con le viste
INFORMATION_SCHEMA
per visualizzare i metadati del set di dati collegato.Quando esegui query per le routines in un set di dati collegato, puoi eseguire query solo per le funzioni definite dall'utente (sia UDF SQL che JavaScript) e per i tipi di routine Funzioni tabella. Se esegui una query per un tipo di routine non supportato, viene visualizzato il messaggio di errore:
Querying routine type type is not yet supported on linked dataset dataset.
Per le metriche di utilizzo si applicano le seguenti limitazioni:
Non puoi ottenere le metriche sull'utilizzo per le schede sottoscritte prima del 20 luglio 2023.
Le metriche relative all'utilizzo della tabella esterna per i campi
num_rows_processed
etotal_bytes_processed
potrebbero contenere dati imprecisi.Le metriche di utilizzo per il consumo sono supportate solo per l'utilizzo tramite job BigQuery. Il consumo tramite le seguenti risorse non è supportato:
Le metriche di utilizzo per le visualizzazioni vengono compilate solo per le query effettuate dopo il 22 aprile 2024.
Le metriche relative all'utilizzo non vengono acquisite per gli abbonamenti Pub/Sub collegati in Analytics Hub (puoi continuare a visualizzare l'utilizzo direttamente in Pub/Sub).
Quando ti abboni ai dati di Salesforce Data Cloud, si applicano le seguenti limitazioni:
- I dati di Data Cloud vengono condivisi come visualizzazioni. In qualità di abbonato, non puoi accedere alle tabelle sottostanti a cui fanno riferimento le viste.
Aree geografiche supportate
Analytics Hub è supportato nelle seguenti regioni e nelle regioni con più regioni.
Regioni
La tabella seguente elenca le regioni delle Americhe in cui è disponibile Analytics Hub.Descrizione della regione | Nome regione | Dettagli |
---|---|---|
Columbus, Ohio | us-east5 |
|
Dallas | us-south1 |
Bassi livelli di CO2 |
Iowa | us-central1 |
Bassi livelli di CO2 |
Las Vegas | us-west4 |
|
Los Angeles | us-west2 |
|
Montréal | northamerica-northeast1 |
Bassi livelli di CO2 |
Virginia del Nord | us-east4 |
|
Oregon | us-west1 |
Bassi livelli di CO2 |
Salt Lake City | us-west3 |
|
San Paolo | southamerica-east1 |
Bassi livelli di CO2 |
Santiago | southamerica-west1 |
|
Carolina del Sud | us-east1 |
|
Toronto | northamerica-northeast2 |
|
Descrizione della regione | Nome regione | Dettagli |
---|---|---|
Delhi | asia-south2 |
|
Hong Kong | asia-east2 |
|
Giacarta | asia-southeast2 |
|
Melbourne | australia-southeast2 |
|
Mumbai | asia-south1 |
|
Osaka | asia-northeast2 |
|
Seul | asia-northeast3 |
|
Singapore | asia-southeast1 |
|
Sydney | australia-southeast1 |
|
Taiwan | asia-east1 |
|
Tokyo | asia-northeast1 |
Descrizione della regione | Nome regione | Dettagli |
---|---|---|
Belgio | europe-west1 |
Bassi livelli di CO2 |
Finlandia | europe-north1 |
Bassi livelli di CO2 |
Francoforte | europe-west3 |
Bassi livelli di CO2 |
Londra | europe-west2 |
Bassi livelli di CO2 |
Paesi Bassi | europe-west4 |
Bassi livelli di CO2 |
Varsavia | europe-central2 |
|
Zurigo | europe-west6 |
Bassi livelli di CO2 |
Descrizione della regione | Nome della regione | Dettagli |
---|---|---|
Dammam | me-central2 |
|
Tel Aviv | me-west1 |
Descrizione della regione | Nome della regione | Dettagli |
---|---|---|
Johannesburg | africa-south1 |
Più regioni
La tabella seguente elenca le regioni in cui Analytics Hub è disponibile.Descrizione multiregione | Nome multiregione |
---|---|
Data center all'interno degli stati membri dell'Unione Europea1 | EU |
Data center negli Stati Uniti | US |
1 I dati che si trovano nella regione multipla EU
non vengono memorizzati nei data center europe-west2
(Londra) o europe-west6
(Zurigo).
Regioni omnicanale
La tabella seguente elenca le piattaforme Omni in cui è disponibile Analytics Hub.Descrizione della regione omnicanale | Nome della regione omnicanale | |
---|---|---|
AWS | ||
AWS - Stati Uniti, costa orientale (Virginia del Nord) | aws-us-east-1 |
|
AWS - US West (Oregon) | aws-us-west-2 |
|
AWS - Asia Pacifico (Seul) | aws-ap-northeast-2 |
|
AWS - Asia Pacifico (Sydney) | aws-ap-southeast-2 |
|
AWS - Europa (Irlanda) | aws-eu-west-1 |
|
AWS - Europa (Francoforte) | aws-eu-central-1 |
|
Azure | ||
Azure - Stati Uniti orientali 2 | azure-eastus2 |
Caso d'uso di esempio
Questa sezione mostra un esempio di come utilizzare Analytics Hub.
Supponiamo che tu sia un rivenditore e che la tua organizzazione disponga di dati di previsione della domanda in tempo reale in un progetto Google Cloud denominato Forecasting. Vuoi condividere questi dati di previsione della domanda con centinaia di fornitori nel tuo sistema di catena di approvvigionamento. Ecco come puoi condividere i tuoi dati con i fornitori tramite Analytics Hub:
Amministratori di Analytics Hub
In qualità di proprietario del progetto Forecasting, devi prima attivare l'API Analytics Hub e poi assegnare il ruolo di amministratore di Analytics Hub a un utente che amministra lo scambio di dati nel progetto. Gli utenti con il ruolo di amministratore di Analytics Hub sono chiamati amministratori di Analytics Hub.
Un amministratore di Analytics Hub può eseguire le seguenti attività:
Crea, aggiorna, elimina e condividi lo scambio di dati nel progetto Forecasting della tua organizzazione.
Gestisci altri amministratori di Analytics Hub.
Gestisci i publisher concedendo il ruolo Editore di Analytics Hub ai dipendenti della tua organizzazione. Se vuoi che alcuni dipendenti possano solo aggiornare, eliminare e condividere le schede, ma non crearle, puoi assegnare loro il ruolo Amministratore delle schede di Analytics Hub.
Gestisci gli abbonati concedendo il ruolo Abbonato di Analytics Hub a un gruppo Google composto da tutti i fornitori. Se vuoi che alcuni fornitori abbiano solo accesso in visualizzazione alle piattaforme di scambio pubblicitario e alle schede disponibili, puoi concedergli il ruolo Visualizzatore di Analytics Hub. Questi fornitori non sono in grado di iscriversi alle schede.
Per saperne di più, consulta Gestire gli scambi di dati.
Publisher di Analytics Hub
I publisher creano le seguenti schede per i propri set di dati nel progetto Forecasting o in un altro progetto:
- Elenco A: set di dati di previsione della domanda 1
- Elenco B: set di dati di previsione della domanda 2
- Elenco C: set di dati di previsione della domanda 3
In qualità di fornitore di dati, puoi monitorare le metriche di utilizzo per il tuo set di dati condiviso. Le metriche relative all'utilizzo includono i seguenti dettagli:
- Job eseguiti sul set di dati condiviso.
- I dettagli sul consumo del tuo set di dati condiviso da progetti e organizzazioni degli abbonati.
- Il numero di righe e byte elaborati dal job.
Per saperne di più, consulta Gestire le schede.
Abbonati ad Analytics Hub
Gli abbonati possono sfogliare le schede a cui hanno accesso nei data exchange. Possono anche iscriversi a queste schede e aggiungere questi set di dati ai propri progetti creando un set di dati collegato. I fornitori possono quindi eseguire query su questi set di dati collegati e recuperare i risultati in tempo reale.
Per ulteriori informazioni, vedi Visualizzare e iscriversi alle schede.
Prezzi
Non sono previsti costi aggiuntivi per la gestione delle schede o degli scambi di dati.
Per i set di dati BigQuery, ai publisher di Analytics Hub viene addebitato l'archiviazione dei dati, mentre i sottoscrittori pagano le query eseguite sui dati condivisi in base a un modello di prezzi on demand o basato sulla capacità. Per informazioni sui prezzi, consulta Prezzi di BigQuery.
Per Pub/Sub, agli editori degli argomenti viene addebitato il numero totale di byte scritti (throughput di pubblicazione) nell'argomento condiviso e nell'uscita di rete (se applicabile). Agli abbonati viene addebitato il numero totale di byte letti (throughput dell'abbonamento) dall'abbonamento collegato e dal traffico in uscita della rete (se applicabile). Per ulteriori dettagli, consulta la pagina Prezzi di Pub/Sub.
Quote
Per informazioni sulle quote di Analytics Hub, consulta Quote e limiti.
Controlli di servizio VPC
Puoi impostare le regole in entrata e in uscita necessarie per consentire a publisher e abbonati di accedere ai dati dei progetti che hanno perimetri Controlli di servizio VPC. Per ulteriori informazioni, consulta Regole dei controlli di servizio VPC di Analytics Hub.
Passaggi successivi
- Scopri come visualizzare e iscriverti alle schede.
- Scopri come concedere ruoli agli utenti di Analytics Hub.