Panoramica di BigQuery

BigQuery è una piattaforma dati completamente gestita e predisposta per l'AI che ti aiuta a gestire e analizzare i dati con funzionalità integrate come machine learning, ricerca, analisi geospaziale e business intelligence. L'architettura serverless di BigQuery consente di utilizzare linguaggi come SQL e Python per rispondere alle domande più importanti della tua organizzazione senza il bisogno di gestire alcuna infrastruttura.

BigQuery offre un modo uniforme per lavorare con i dati strutturati e non strutturati e supporta formati di tabelle aperte come Apache Iceberg, Delta e Hudi. BigQuery streaming supporta l'importazione e l'analisi continua dei dati, mentre il motore di analisi distribuito e scalabile di BigQuery ti consente di eseguire query su terabyte in pochi secondi e su petabyte in pochi minuti.

L'architettura di BigQuery è composta da due parti: un livello di archiviazione che importa, archivia e ottimizza i dati e un livello di calcolo che fornisce funzionalità di analisi. Questi livelli di calcolo e archiviazione operano in modo efficiente indipendentemente l'uno dall'altro grazie alla rete di Google su scala petabit che consente la comunicazione necessaria tra di loro.

I database legacy di solito devono condividere le risorse tra le operazioni di lettura e scrittura e le operazioni di analisi. Ciò può comportare conflitti di risorse e può rallentare le query durante la scrittura o la lettura dei dati dall'archiviazione. I pool di risorse condivise possono essere ulteriormente sotto stress quando le risorse sono richieste per attività di gestione del database come l'assegnazione o la revoca delle autorizzazioni. La separazione dei livelli di calcolo e archiviazione di BigQuery consente a ciascun livello di allocare le risorse in modo dinamico senza influire sulle prestazioni o sulla disponibilità dell'altro.

L'architettura di BigQuery separa le risorse con una rete petabit.

Questo principio di separazione consente a BigQuery di innovare più velocemente perché i miglioramenti di archiviazione e calcolo possono essere implementati in modo indipendente, senza tempi di inattività o impatto negativo sulle prestazioni del sistema. È inoltre essenziale offrire un data warehouse serverless completamente gestito in cui il team di ingegneri di BigQuery gestisce gli aggiornamenti e la manutenzione. Di conseguenza, non devi eseguire il provisioning o scalare manualmente le risorse, ma puoi concentrarti sul fornire valore anziché sulle attività di gestione del database tradizionali.

Le interfacce BigQuery includono l'interfaccia della console Google Cloud e lo strumento a riga di comando BigQuery. Gli sviluppatori e i data scientist possono utilizzare librerie client con linguaggi di programmazione comuni, tra cui Python, Java, JavaScript e Go, nonché l'API REST e l'API RPC di BigQuery per trasformare e gestire i dati. I driver ODBC e JDBC consentono l'interazione con le applicazioni esistenti, inclusi strumenti e utilità di terze parti.

In qualità di data analyst, data engineer, amministratore di data warehouse o data scientist, BigQuery ti aiuta a caricare, elaborare e analizzare i dati per supportare le decisioni aziendali critiche.

Inizia a utilizzare BigQuery

Puoi iniziare a esplorare BigQuery in pochi minuti. Sfrutta il livello di utilizzo gratuito o la sandbox senza costi di BigQuery per iniziare a caricare e eseguire query sui dati.

  1. Sandbox di BigQuery: inizia a utilizzare la sandbox di BigQuery senza rischi e senza costi.
  2. Guida rapida alla console Google Cloud: familiarizza con la potenza della console BigQuery.
  3. Set di dati pubblici: prova le prestazioni di BigQuery esplorando dati di grandi dimensioni e reali del programma per i set di dati pubblici.

Esplora BigQuery

L'infrastruttura serverless di BigQuery ti consente di concentrarti sui dati anziché sulla gestione delle risorse. BigQuery combina un data warehouse basato su cloud e potenti strumenti di analisi.

Spazio di archiviazione BigQuery

BigQuery archivia i dati utilizzando un formato di archiviazione a colonne ottimizzato per le query di analisi. BigQuery presenta i dati in tabelle, righe e colonne e fornisce il supporto completo per la semantica delle transazioni del database (ACID). Lo spazio di archiviazione BigQuery viene replicato automaticamente in più località per garantire un'alta disponibilità.

Per ulteriori informazioni, consulta la Panoramica dello spazio di archiviazione BigQuery.

BigQuery Analytics

Le analisi descrittive e prescrittive includono business intelligence, analisi ad hoc, analisi geospaziali e machine learning. Puoi eseguire query sui dati archiviati in BigQuery o sui dati nella posizione in cui si trovano utilizzando tabelle esterne o query federate, tra cui Cloud Storage, Bigtable, Spanner o Fogli Google archiviati in Google Drive.

  • Query SQL standard ANSI (supporto di SQL:2011), incluso il supporto di join, campi nidificati e ripetuti, funzioni di analisi e aggregazione, query con più istruzioni e una serie di funzioni spaziali con analisi geospaziali - sistemi di informazione geografica.
  • Crea visualizzazioni per condividere la tua analisi.
  • Supporto degli strumenti di business intelligence, tra cui BI Engine con Looker Studio, Looker, Fogli Google e strumenti di terze parti come Tableau e Power BI.
  • BigQuery ML fornisce machine learning e analisi predittiva.
  • BigQuery Studio offre funzionalità come i notebook Python e il controllo della versione sia per i notebook sia per le query salvate. Queste funzionalità ti consentono di completare più facilmente i flussi di lavoro di analisi dei dati e di machine learning (ML) in BigQuery.
  • Esegui query sui dati al di fuori di BigQuery con tabelle esterne e query federate.

Per ulteriori informazioni, consulta Panoramica di BigQuery Analytics.

Amministrazione di BigQuery

BigQuery fornisce la gestione centralizzata delle risorse di dati e calcolo, mentre Identity and Access Management (IAM) ti aiuta a proteggere queste risorse con il modello di accesso utilizzato in tutto Google Cloud. Le best practice per la sicurezza di Google Cloud forniscono un approccio solido ma flessibile che può includere la sicurezza perimetrale tradizionale o un approccio di difesa in profondità più complesso e granulare.

  • Introduzione alla sicurezza e alla governance dei dati ti aiuta a comprendere la governance dei dati e i controlli di cui potresti avere bisogno per proteggere le risorse BigQuery.
  • I job sono azioni eseguite da BigQuery per tuo conto per caricare, esportare, eseguire query o copiare i dati.
  • Le prenotazioni ti consentono di passare dai prezzi on demand a quelli basati sulla capacità.

Per ulteriori informazioni, consulta Introduzione all'amministrazione di BigQuery.

Risorse di BigQuery

Esplora le risorse BigQuery:

API, strumenti e riferimenti

Materiali di riferimento per sviluppatori e analisti BigQuery:

Ruoli e risorse BigQuery

BigQuery soddisfa le esigenze dei professionisti dei dati nei seguenti ruoli e responsabilità.

Analista di dati

Indicazioni sulle attività per aiutarti se devi svolgere le seguenti operazioni:

Per fare un tour delle funzionalità di analisi dei dati di BigQuery direttamente nella console Google Cloud, fai clic su Fai il tour.

Inizia la presentazione

Amministratore dati

Indicazioni sulle attività per aiutarti se devi svolgere le seguenti operazioni:

Per ulteriori informazioni, consulta Introduzione all'amministrazione di BigQuery.

Per fare un tour delle funzionalità di amministrazione dei dati di BigQuery direttamente nella console Google Cloud, fai clic su Fai il tour.

Inizia la presentazione

Data scientist

Indicazioni sulle attività per aiutarti se devi utilizzare il machine learning di BigQuery ML per svolgere le seguenti operazioni:

Data Developer

Indicazioni sulle attività per aiutarti se devi svolgere le seguenti operazioni:

Tutorial video su BigQuery

La seguente serie di tutorial video ti aiuta a iniziare a utilizzare BigQuery:

Titolo

Descrizione

Come iniziare a utilizzare BigQuery (17:18) Una panoramica che riassume che cos'è BigQuery e come usarlo. I segmenti includono: pipeline ETL, prezzi e ottimizzazione, BigQuery ML e BI Engine e una demo di BigQuery nella console Google Cloud.
Che cos'è BigQuery? (4:39) Una panoramica di BigQuery e di come è progettato per importare e archiviare grandi quantità di dati per aiutare sia gli analisti sia gli sviluppatori
Utilizzare la sandbox di BigQuery (3:05) Come configurare una sandbox di BigQuery per eseguire query senza bisogno di una carta di credito
Porre domande, eseguire query (5:11) Come scrivere ed eseguire query SQL nell'interfaccia utente di BigQuery, oltre a scegliere un numero di maglia vincente
Caricare i dati in BigQuery (5:31) Come importare e analizzare i dati in tempo reale o eseguire un'analisi in batch una tantum dei dati, oltre a gatti e cani
Visualizzazione dei risultati delle query (5:38) In che modo la visualizzazione dei dati è utile per comprendere e interiorizzare più facilmente i set di dati complessi
Gestire l'accesso con IAM (5:23) Come consentire ad altri utenti di eseguire query sui tuoi set di dati in BigQuery con le autorizzazioni IAM e controllo dell'accesso#39;accesso
Salvataggio e condivisione delle query (6:17) Come salvare e condividere facilmente le query in BigQuery
Protezione dei dati sensibili con le viste autorizzate (7:12) Come condividere facilmente set di dati con utenti diversi impostando controlli di accesso personalizzati
Eseguire query sui dati esterni con BigQuery (5:49) Come configurare un'origine dati esterna in BigQuery ed eseguire query su dati di Cloud Storage, Cloud SQL, Google Drive e altro ancora
Che cosa sono le funzioni definite dall'utente? (4:59) Come creare funzioni definite dall'utente (UDF) per analizzare i set di dati in BigQuery

Passaggi successivi