Questa pagina è stata tradotta dall'API Cloud Translation.

Set di dati pubblici BigQuery

Un set di dati pubblico è un set di dati archiviato in BigQuery e reso disponibile al pubblico tramite il programma per i set di dati pubblici di Google Cloud. I set di dati pubblici sono set di dati ospitati da BigQuery a cui puoi accedere e che puoi integrare nelle tue applicazioni. Google paga lo spazio di archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati utilizzando un progetto. Paghi solo per le query che esegui sui dati. Il primo TB al mese è gratuito, in base ai dettagli dei prezzi delle query.

I set di dati pubblici sono disponibili per l'analisi utilizzando query SQL precedente o GoogleSQL. Utilizza un nome di tabella completo quando esegui query su set di dati pubblici, ad esempio bigquery-public-data.bbc_news.fulltext. Se la tua organizzazione limita l'accesso ai dati, ad esempio con perimetri di sicurezza, potresti dover contattare l'amministratore per ottenere l'autorizzazione ad accedere ai set di dati pubblici.

Puoi accedere ai set di dati pubblici di BigQuery utilizzando la consoleGoogle Cloud , utilizzando lo strumento a riga di comando bq o effettuando chiamate all'API REST BigQuery tramite varie librerie client, tra cui Java, .NET o Python. Puoi anche visualizzare ed eseguire query sui set di dati pubblici tramite la condivisione BigQuery (in precedenza Analytics Hub), una piattaforma di scambio di dati che ti aiuta a scoprire e accedere alle librerie di dati.

I set di dati pubblici non sono accessibili per impostazione predefinita dall'interno di un perimetro Controlli di servizio VPC. Non è previsto un accordo sul livello del servizio (SLA) per il programma di dataset pubblici.

Vai a Condivisione (Analytics Hub)

Per saperne di più su ogni singolo set di dati, fai clic sul nome del set di dati nella sezione Set di dati di Cloud Marketplace.

Vai a Set di dati in Cloud Marketplace

Prima di iniziare

Per iniziare a utilizzare un set di dati pubblici BigQuery, devi creare o selezionare un progetto. Il primo terabyte di dati elaborati al mese è gratuito, quindi puoi iniziare a eseguire query sui set di dati pubblici senza attivare la fatturazione. Se intendi superare il livello gratuito, devi anche attivare la fatturazione.

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

BigQuery viene attivato automaticamente nei nuovi progetti. Per attivare BigQuery in un progetto preesistente,
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the API

Località dei set di dati pubblici

Ogni set di dati pubblico è archiviato in una località specifica, ad esempio US o EU. Attualmente, le tabelle di esempio BigQuery sono archiviate nella località multiregionale US. Quando esegui una query su una tabella di esempio, fornisci il flag --location=US nella riga di comando, scegli US come località di elaborazione nella consoleGoogle Cloud o specifica la proprietà location nella sezione jobReference della risorsa job quando utilizzi l'API. Poiché le tabelle di esempio sono archiviate negli Stati Uniti, non puoi scrivere i risultati della query della tabella di esempio in una tabella di un'altra regione e non puoi unire le tabelle di esempio con le tabelle di un'altra regione.

Accedere ai set di dati pubblici nella console Google Cloud

Puoi accedere ai set di dati pubblici nella Google Cloud console tramite i seguenti metodi:

Nel riquadro Explorer, visualizza il progetto bigquery-public-data. Per saperne di più, consulta Aprire un set di dati pubblico.
Utilizza la condivisione per visualizzare e abbonarti a set di dati pubblici.

Per scoprire quando è stato aggiornato l'ultima volta un tavolo di dati, vai alla sezione Dettagli della tabella, come descritto in Ottenere informazioni sulle tabelle, e visualizza il campo Ultima modifica. Per saperne di più sulla selezione e sulla rimozione dei progetti, consulta Utilizzare i progetti.

Altri set di dati pubblici

Sono disponibili molti altri set di dati pubblici su cui eseguire query, alcuni dei quali sono ospitati anche da Google, ma molti altri sono ospitati da terze parti. Altri set di dati includono:

Condividere un set di dati con il pubblico

Puoi condividere qualsiasi set di dati con il pubblico modificando i controlli di accesso del set di dati per consentire l'accesso a "Tutti gli utenti autenticati". Per ulteriori informazioni sull'impostazione dei controlli dell'accesso ai set di dati, consulta Controllare l'accesso ai set di dati.

Quando condividi un set di dati con il pubblico:

I costi di archiviazione vengono sostenuti dall'account di fatturazione collegato al progetto che contiene il set di dati condiviso pubblicamente.
I costi delle query vengono sostenuti dall'account di fatturazione collegato al progetto in cui vengono eseguiti i job di query.

Per ulteriori informazioni, vedi Panoramica dei prezzi di BigQuery.

Tabelle di esempio

Oltre ai set di dati pubblici, BigQuery fornisce un numero limitato di tabelle di esempio su cui puoi eseguire query. Queste tabelle sono contenute nel set di dati bigquery-public-data:samples.

I requisiti per eseguire query sulle tabelle di esempio di BigQuery sono gli stessi dei requisiti per eseguire query sui set di dati pubblici.

Il set di dati bigquery-public-data:samples include le seguenti tabelle:

Nome	Descrizione
`gsod`	Contiene informazioni meteo raccolte dalla NOAA, ad esempio quantità di precipitazioni e velocità del vento dalla fine del 1929 all'inizio del 2010.
`github_nested`	Contiene una cronologia di azioni come richieste di pull e commenti sui repository GitHub con uno schema nidificato. Creato a settembre 2012.
`github_timeline`	Contiene una cronologia delle azioni, ad esempio richieste di pull e commenti sui repository GitHub, con uno schema piatto. Creato a maggio 2012.
`natality`	Descrive tutte le nascite negli Stati Uniti registrate nei 50 stati, nel Distretto di Columbia e a New York City dal 1969 al 2008.
`shakespeare`	Contiene un indice delle parole delle opere di Shakespeare, che indica il numero di volte in cui ogni parola compare in ogni corpus.
`trigrams`	Contiene trigrammi in lingua inglese di un campione di opere pubblicate tra il 1520 e il 2008.
`wikipedia`	Contiene la cronologia completa delle revisioni di tutti gli articoli di Wikipedia fino ad aprile 2010.

Contattaci

Se hai domande sul programma BigQuery Public Dataset, contattaci all'indirizzo bq-public-data@google.com.

Passaggi successivi

Scopri come eseguire query su una tabella in un set di dati pubblico nella guida rapida all'utilizzo della console Google Cloud .