Set di dati pubblici BigQuery
Per set di dati pubblico si intende qualsiasi set di dati archiviato in BigQuery rese disponibili al pubblico tramite Programma per i set di dati pubblici di Google Cloud. I set di dati pubblici sono quelli ospitati da BigQuery per l'accesso e l'integrazione nelle applicazioni. Google paga lo spazio di archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati tramite progetto. Paghi solo per le query che esegui sui dati. Il primo TB al mese è gratuito, soggetto alle dettagli sui prezzi delle query.
I set di dati pubblici sono disponibili per l'analisi
le SQL precedente
GoogleSQL
query. Utilizza un nome di tabella completo quando esegui query su set di dati pubblici, per
esempio bigquery-public-data.bbc_news.fulltext
. Se la tua organizzazione limita
per l'accesso ai dati, ad esempio con i perimetri di sicurezza,
contatta l'amministratore per chiedere l'autorizzazione ad accedere ai set di dati pubblici.
Puoi accedere a BigQuery set di dati pubblici utilizzando Console Google Cloud, utilizzando lo strumento a riga di comando bq oppure effettuare chiamate all'API REST BigQuery utilizzando una varietà di librerie client come Java, .NET, o Python. Puoi anche visualizzare ed eseguire query su set di dati pubblici tramite Analytics Hub una piattaforma di scambio di dati che ti aiuta a scoprire le librerie di dati e accedervi.
I set di dati pubblici non sono accessibili per impostazione predefinita dall'interno di un Perimetro Controlli di servizio VPC. Là non è un accordo sul livello del servizio (SLA) per il programma per i set di dati pubblici.
Puoi trovare maggiori dettagli su ogni singolo set di dati facendo clic sul nome del set di dati nella sezione Google Cloud Marketplace.
Vai a Set di dati in Cloud Marketplace
Prima di iniziare
Per iniziare a utilizzare un set di dati pubblico BigQuery, devi creare o selezionare un progetto. Il primo terabyte di dati elaborati al mese è gratuito, quindi puoi iniziare a eseguire query pubbliche senza abilitare la fatturazione. Se intendi andare oltre livello gratuito, devi abilitare anche la fatturazione.
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
- BigQuery viene abilitato automaticamente nei nuovi progetti.
Per attivare BigQuery in un progetto preesistente,
Attiva l'API BigQuery.
Località set di dati pubblici
Ogni set di dati pubblico viene archiviato in una località specifica come US
o
EU
. Attualmente, le tabelle BigQuery di esempio sono archiviate in
Località multiregionale di US
.
Quando esegui una query su una tabella di esempio, fornisci il flag --location=US
nella
riga di comando, scegli US
come posizione di elaborazione nel
nella console Google Cloud o specifica la proprietà location
nella
Sezione jobReference
del
risorse di lavoro
quando utilizzi l'API. Poiché le tabelle di esempio sono archiviate negli Stati Uniti, non puoi
scrivi risultati di query di tabella di esempio in una tabella in un'altra regione e non potrai
unire tabelle di esempio a tabelle di un'altra regione.
Accedi a set di dati pubblici nella console Google Cloud
Puoi accedere ai set di dati pubblici in Console Google Cloud con i seguenti metodi:
Nel riquadro Explorer, visualizza il progetto
bigquery-public-data
. Per ulteriori informazioni, vedi Apri un set di dati pubblico.Utilizza Analytics Hub per visualizzare e iscriverti alle sessioni pubbliche set di dati.
Per sapere quando è stata aggiornata l'ultima volta una tabella di dati, vai ai Dettagli della tabella come descritto in Recupero delle informazioni delle tabelle. visualizza il campo Ultima modifica. Per ulteriori informazioni su come selezionare e sulla rimozione dei progetti, consulta l'articolo Utilizzare i progetti.
Altri set di dati pubblici
Sono disponibili molti altri set di dati pubblici su cui eseguire query, alcuni dei quali sono ospitati anche da Google, ma molti altri sono ospitati da terze parti. Altro i set di dati includono:
- Set di dati pubblici di Cloud Life Sciences
- Set di dati a raggi x chest NIH
- Set di dati Cancer Imaging Archive (TCIA)
- Set di dati di note di rilascio per la maggior parte dei prodotti Google Cloud in disponibilità generale.
Condividi un set di dati con il pubblico
Puoi condividere qualsiasi set di dati con il pubblico modificando il campo per consentire l'accesso da parte di "Tutti gli utenti autenticati". Per ulteriori informazioni informazioni sull'impostazione dei controlli di accesso al set di dati, consulta Controllo dell'accesso ai set di dati.
Quando condividi un set di dati con il pubblico:
- I costi di archiviazione sono addebitati dall'account di fatturazione associato al progetto che contiene il set di dati condiviso pubblicamente.
- I costi delle query sono addebitati dall'account di fatturazione associato al progetto in cui vengono eseguiti i job di query.
Per ulteriori informazioni, vedi Panoramica dei prezzi di BigQuery.
Tabelle di esempio
Oltre ai set di dati pubblici,
BigQuery offre un numero limitato di tabelle di esempio che puoi
query. Queste tabelle sono contenute
bigquery-public-data:samples
set di dati.
I requisiti per eseguire query sulle tabelle BigQuery di esempio sono secondo i requisiti per l'esecuzione di query sui set di dati pubblici.
Il set di dati bigquery-public-data:samples
include le seguenti tabelle:
Nome | Descrizione |
---|---|
gsod |
Contiene le informazioni meteorologiche raccolte dal NOAA, come la quantità di precipitazioni e la velocità del vento dalla fine del 1929 all'inizio del 2010. |
github_nested |
Contiene una cronologia di azioni come richieste di pull e commenti sui repository GitHub con uno schema nidificato. Creato nel settembre 2012. |
github_timeline |
Contiene una cronologia di azioni come richieste di pull e commenti sui repository GitHub con uno schema semplice. Creato nel maggio 2012. |
natality |
Descrive tutte le nascite degli Stati Uniti registrate nei 50 Stati, nel Distretto di Columbia e a New York dal 1969 al 2008. |
shakespeare |
Contiene un indice di parole delle opere di Shakespeare, che indica il numero di volte in cui ogni parola compare in ciascun corpus. |
trigrams |
Contiene trigrammi in lingua inglese tratti da un campione di opere pubblicate tra il 1520 e il 2008. |
wikipedia |
Contiene la cronologia delle revisioni completa per tutti gli articoli di Wikipedia fino ad aprile 2010. |
Contattaci
Se hai domande sul set di dati pubblico BigQuery
, contattaci all'indirizzo bq-public-data@google.com
.
Passaggi successivi
Scopri come eseguire query su una tabella in un set di dati pubblico all'indirizzo Guida rapida all'utilizzo della console Google Cloud.