Panoramica di BigQuery
BigQuery è un data warehouse aziendale completamente gestito che ti aiuta a gestire e analizzare i dati con funzionalità integrate come machine learning, analisi geospaziale e business intelligence. L'architettura serverless di BigQuery ti consente di utilizzare query SQL per rispondere alle domande più importanti della tua organizzazione senza alcuna gestione dell'infrastruttura. Le query federate ti consentono di leggere i dati da origini esterne, mentre i flussi di dati supportano gli aggiornamenti continui dei dati. Il motore di analisi scalabile e distribuito di BigQuery consente di eseguire query su terabyte in pochi secondi e petabyte.
L'architettura di BigQuery è costituita da due parti: un livello di archiviazione che importa, archivia e ottimizza i dati e un livello di computing che fornisce funzionalità di analisi. Questi livelli di computing e archiviazione operano in modo efficiente in modo indipendente l'uno dall'altro grazie alla rete su scala petabyte di Google, che consente la comunicazione necessaria tra loro.
In genere, i database legacy devono condividere le risorse per le operazioni di lettura/scrittura e le operazioni analitiche. Questo può causare conflitti tra le risorse e rallentare le query durante la scrittura o la lettura dei dati dallo spazio di archiviazione. I pool di risorse condivisi possono subire ulteriori sforzi quando sono necessarie risorse per attività di gestione del database, come l'assegnazione o la revoca delle autorizzazioni. La separazione dei livelli di calcolo e di archiviazione consente a ogni livello di allocare dinamicamente le risorse senza influire sulle prestazioni o sulla disponibilità dell'altro.
Questo principio di separazione consente a BigQuery di innovare più rapidamente perché i miglioramenti di archiviazione e calcolo possono essere distribuiti in modo indipendente, senza tempi di inattività o un impatto negativo sulle prestazioni del sistema. È inoltre essenziale per offrire un data warehouse serverless completamente gestito in cui il team di progettazione di BigQuery gestisce gli aggiornamenti e la manutenzione. Il risultato è che non dovrai eseguire il provisioning o scalare manualmente le risorse, lasciandoti la libertà di concentrarti sulla fornitura di valore anziché sulle tradizionali attività di gestione dei database.
Le interfacce di BigQuery includono l'interfaccia della console Google Cloud e lo strumento a riga di comando di BigQuery. Sviluppatori e data scientist possono utilizzare librerie client con programmi familiari, tra cui Python, Java, JavaScript e Go, nonché l'API REST e l'API RPC di BigQuery per trasformare e gestire i dati. I driver ODBC e JDBC consentono l'interazione con le applicazioni esistenti, inclusi strumenti e utilità di terze parti.
In qualità di analista di dati, data engineer, amministratore di data warehouse o data scientist, BigQuery ti aiuta a caricare, elaborare e analizzare i dati per prendere decisioni aziendali critiche.
Inizia a utilizzare BigQuery
Puoi iniziare a esplorare BigQuery in pochi minuti. Sfrutta il livello di utilizzo gratuito o la sandbox senza costi di BigQuery per iniziare a caricare ed eseguire query sui dati.
- Sandbox di BigQuery: inizia nella sandbox di BigQuery, senza rischi e senza costi.
- Guida rapida della console Google Cloud: Acquisisci familiarità con la potenza della console BigQuery.
- Set di dati pubblici: scopri le prestazioni di BigQuery esplorando grandi dati reali del programma per set di dati pubblici.
Esplora BigQuery
L'infrastruttura serverless di BigQuery ti permette di concentrarti sui dati anziché sulla gestione delle risorse. BigQuery combina un data warehouse basato su cloud con potenti strumenti di analisi.
Spazio di archiviazione BigQuery
BigQuery archivia i dati utilizzando un formato di archiviazione a colonne ottimizzato per le query analitiche. BigQuery presenta i dati in tabelle, righe e colonne e offre il supporto completo per la semantica delle transazioni del database (ACID). L'archiviazione di BigQuery viene replicata automaticamente in più località per garantire la disponibilità elevata.
- Scopri i pattern comuni per organizzare le risorse BigQuery nel data warehouse e nei data mart.
- Scopri di più sui set di dati, il contenitore di primo livello di BigQuery per tabelle e viste.
- Carica i dati in BigQuery utilizzando:
- Trasmetti flussi di dati con l'API Storage Write.
- Esegui il caricamento in batch dei dati da file locali o Cloud Storage utilizzando formati che includono: Avro, Parquet, ORC, CSV, JSON, Datastore e Firestore.
- BigQuery Data Transfer Service automatizza l'importazione dati.
Per ulteriori informazioni, consulta la Panoramica sullo spazio di archiviazione di BigQuery.
Analisi di BigQuery
Gli utilizzi dell'analisi descrittiva e prescrittiva includono business intelligence, analisi ad hoc, analisi geospaziale e machine learning. Puoi eseguire query sui dati archiviati in BigQuery o sui dati nella loro posizione utilizzando tabelle esterne o query federate, tra cui Cloud Storage, Bigtable, Spanner o Fogli Google archiviati su Google Drive.
- Query SQL standard ANSI (supporto SQL:2011) che include il supporto per join, campi nidificati e ripetuti, funzioni di analisi e aggregazione, query con istruzioni multiple e una varietà di funzioni spaziali con analisi geospaziale: Geographic Information System.
- Crea viste per condividere l'analisi.
- Supporto per gli strumenti di business intelligence, tra cui BI Engine con Looker Studio, Looker, Fogli Google e strumenti di terze parti come Tableau e Power BI.
- BigQuery ML offre machine learning e analisi predittiva.
- BigQuery Studio offre funzionalità come i blocchi note Python e il controllo della versione sia per i blocchi note sia per le query salvate. Queste funzionalità semplificano il completamento dei flussi di lavoro di analisi dei dati e di machine learning (ML) in BigQuery.
- Esegui query sui dati al di fuori di BigQuery con tabelle esterne e query federate.
Per ulteriori informazioni, consulta la panoramica di BigQuery Analytics.
Amministrazione di BigQuery
BigQuery offre una gestione centralizzata di dati e risorse di calcolo, mentre Identity and Access Management (IAM) ti consente di proteggere le risorse con il modello di accesso utilizzato in Google Cloud. Le best practice per la sicurezza di Google Cloud forniscono un approccio solido ma flessibile che può includere la sicurezza perimetrale tradizionale o un approccio di difesa in profondità più complesso e granulare.
- L'introduzione alla sicurezza e alla governance dei dati ti aiuta a comprendere la governance dei dati e i controlli di cui potresti aver bisogno per proteggere le risorse BigQuery.
- I job sono azioni che BigQuery esegue per tuo conto al fine di caricare, esportare, eseguire query o copiare i dati.
- Le prenotazioni consentono di passare dai prezzi on demand ai prezzi basati sulla capacità.
Per ulteriori informazioni, consulta Introduzione all'amministrazione di BigQuery.
Risorse di BigQuery
Esplora le risorse di BigQuery:
- Le note di rilascio forniscono log delle modifiche di funzionalità, modifiche e deprecazioni.
Prezzi per analisi e archiviazione. Vedi anche: prezzi di BigQuery ML, BI Engine e Data Transfer Service.
Le località definiscono dove crei e archivi i set di dati (località a livello di una o più regioni).
Pattern di riferimento per l'analisi intelligente fornisce link a codice campione e guide di riferimento tecniche per casi d'uso di analisi comuni, incluse le best practice per lo sviluppo di funzionalità di analisi comuni.
Stack Overflow ospita una community coinvolta di sviluppatori e analisti che lavorano con BigQuery.
L'assistenza di BigQuery fornisce supporto per BigQuery.
Google BigQuery: The Definitive Guide: Data Warehousing, Analytics, and Machine Learning at Scale di Valliappa Lakshmanan e Jordan Tigani, spiega il funzionamento di BigQuery e fornisce una procedura dettagliata end-to-end sull'utilizzo del servizio.
API, strumenti e riferimenti
Materiali di riferimento per sviluppatori e analisti BigQuery:
- Sintassi delle query SQL per dettagli sull'utilizzo di GoogleSQL.
- L'API BigQuery e le librerie client presentano panoramiche delle funzionalità di BigQuery e del loro utilizzo.
- Gli esempi di codice BigQuery forniscono centinaia di snippet per le librerie client in C#, Go, Java, Node.js, Python e Ruby. In alternativa, visualizza il browser di esempio.
- La sintassi DML, DDL e funzioni definite dall'utente (UDF) consente di gestire e trasformare i dati di BigQuery.
- Il riferimento dello strumento a riga di comando bq documenta la sintassi, i comandi, i flag e gli argomenti dell'interfaccia dell'interfaccia a riga di comando di
bq
. - L'integrazione ODBC / JDBC collega BigQuery ai tuoi strumenti e alla tua infrastruttura esistenti.
Ruoli e risorse BigQuery
BigQuery risponde alle esigenze dei professionisti dei dati in tutti i ruoli e le responsabilità seguenti.
Analista di dati
Indicazioni relative alle attività utili se devi:
- Esegui query sui dati di BigQuery utilizzando query interattive o batch con la sintassi delle query SQL
- Fai riferimento a espressioni, funzioni e operatori SQL per eseguire query sui dati
Utilizza strumenti per analizzare e visualizzare i dati di BigQuery, tra cui Looker, Looker Studio e Fogli Google.
Utilizza l'analisi geospaziale per analizzare e visualizzare i dati geospaziali con i sistemi di informazione geografica di BigQuery
Ottimizza le prestazioni delle query utilizzando:
- Tabelle partizionate: elimina le tabelle di grandi dimensioni in base a intervalli temporali o di numeri interi.
- Viste materializzate: definisci le viste memorizzate nella cache per ottimizzare le query o fornire risultati permanenti.
- BI Engine: il servizio di analisi in memoria veloce di BigQuery.
Per un tour delle funzionalità di analisi dei dati di BigQuery direttamente nella console Google Cloud, fai clic su Fai il tour.
Amministratore dati
Indicazioni relative alle attività utili se devi:
- Gestisci i costi con prenotazioni per bilanciare i prezzi on demand e basati sulla capacità.
- Comprendi la sicurezza e la governance dei dati per proteggere i dati in base a set di dati, tabella, colonna, riga o vista
- Esegui il backup dei dati con gli snapshot delle tabelle per conservare i contenuti di una tabella in un momento specifico.
- Visualizza BigQuery INFORMATION_SCHEMA per comprendere i metadati di set di dati, job, controllo dell'accesso, prenotazioni, tabelle e altro ancora.
- Utilizza i job per fare in modo che BigQuery carico, esportazione, query o copia di dati siano azioni per tuo conto.
- Monitora log e risorse per comprendere BigQuery e i carichi di lavoro.
Per ulteriori informazioni, consulta Introduzione all'amministrazione di BigQuery.
Per un tour delle funzionalità di amministrazione dei dati di BigQuery direttamente nella console Google Cloud, fai clic su Fai il tour.
Data scientist
Indicazioni sulle attività utili se devi utilizzare il machine learning di BigQuery ML per:
- Comprendere il percorso dell'utente end-to-end per i modelli di machine learning
- Gestisci il controllo dell'accesso per BigQuery ML
- Creazione e addestramento di modelli BigQuery ML,
tra cui:
- Previsione di regressione lineare
- Classificazioni di regressione logistica binaria e logistica multiclasse
- Clustering K-means per la segmentazione dei dati
- Previsione di serie temporali con i modelli Arima+
Sviluppatore dati
Indicazioni relative alle attività utili se devi:
- Carica dati in BigQuery
con:
- caricare dati in batch per i formati Avro, Parquet, ORC, CSV, JSON, Datastore e Firestore
- BigQuery Data Transfer Service
- API BigQuery Storage Write
Browser Google Cloud di esempio (ambito per BigQuery)
Tutorial video su BigQuery
La seguente serie di tutorial video per iniziare a utilizzare BigQuery:
Titolo |
Descrizione |
---|---|
Come iniziare a utilizzare BigQuery (17:18) | Una panoramica che riassume che cos'è BigQuery e come utilizzarlo. I segmenti includono: pipeline ETL, prezzi e ottimizzazione, BigQuery ML e BI Engine e la conclusione con una demo di BigQuery nella console Google Cloud. |
Che cos'è BigQuery? (04:39) | Una panoramica di BigQuery su come BigQuery è progettato per importare e archiviare grandi quantità di dati per aiutare analisti e sviluppatori |
Utilizzo della sandbox di BigQuery (3:05) | Come configurare una sandbox BigQuery, per eseguire query senza bisogno di carta di credito |
Fare domande, eseguire query (5:11) | Scrivere ed eseguire query SQL nell'interfaccia utente di BigQuery e scegliere il numero di maglia più adatto |
Caricamento di dati in BigQuery (5:31) | Come importare e analizzare i dati in tempo reale o solo un'analisi batch una tantum dei dati - più gatti e cani |
Visualizzazione dei risultati della query (5:38) | In che modo la visualizzazione dei dati è utile per semplificare la comprensione e l'interiorità di set di dati complessi |
Gestione dell'accesso con IAM (5:23) | Come consentire ad altri utenti di eseguire query sui tuoi set di dati in BigQuery con le autorizzazioni e il controllo dell'accesso IAM |
Salvataggio e condivisione delle query (6:17) | Come salvare e condividere facilmente le query in BigQuery |
Protezione dei dati sensibili con le visualizzazioni autorizzate (7:12) | Come condividere facilmente set di dati con utenti diversi impostando controlli dell'accesso personalizzati |
Esecuzione di query su dati esterni con BigQuery (5:49) | Come configurare un'origine dati esterna in BigQuery ed eseguire query sui dati da Cloud Storage, Cloud SQL, Google Drive e altro ancora |
Che cosa sono le funzioni definite dall'utente? 04:59 | Come creare funzioni definite dall'utente per l'analisi di set di dati in BigQuery |
Passaggi successivi
- Per una panoramica dello spazio di archiviazione di BigQuery, consulta la Panoramica dello spazio di archiviazione di BigQuery.
- Per una panoramica delle query BigQuery, consulta Panoramica dell'analisi di BigQuery.
- Per una panoramica dell'amministrazione di BigQuery, consulta Introduzione all'amministrazione di BigQuery.
- Per una panoramica della sicurezza di BigQuery, consulta Panoramica della sicurezza e della governance dei dati.