Panoramica di BigQuery

BigQuery è una piattaforma di dati completamente gestita e predisposta per l'AI che ti aiuta a gestire e analizzare i dati con funzionalità integrate come machine learning, ricerca, analisi geospaziale e business intelligence. L'architettura serverless di BigQuery ti consente di utilizzare linguaggi come SQL e Python per rispondere alle domande più importanti della tua organizzazione senza alcuna gestione dell'infrastruttura.

BigQuery offre un modo uniforme di lavorare con dati strutturati e non strutturati e supporta formati di tabelle aperte come Apache Iceberg, Delta e Hudi. Lo streaming BigQuery supporta l'importazione e l'analisi continue dei dati, mentre il motore di analisi scalabile e distribuito di BigQuery ti consente di eseguire query su terabyte in pochi secondi e su petabyte in pochi minuti.

BigQuery offre funzionalità di governance integrate che consentono di scoprire e organizzare i dati, nonché di gestire i metadati e la qualità dei dati. Grazie a funzionalità come la ricerca semantica e la derivazione dei dati, puoi trovare e convalidare i dati pertinenti per l'analisi. Puoi condividere dati e asset AI all'interno della tua organizzazione con i vantaggi del controllo dell'accesso#39;accesso. Queste funzionalità sono basate su Dataplex Universal Catalog, una soluzione di governance unificata e intelligente per dati e asset di AI in Google Cloud.

L'architettura di BigQuery è composta da due parti: un livello di archiviazione che acquisisce, archivia e ottimizza i dati e un livello di calcolo che fornisce funzionalità di analisi. Questi livelli di calcolo e archiviazione operano in modo efficiente indipendentemente l'uno dall'altro grazie alla rete di petabit di Google che consente la comunicazione necessaria tra loro.

I database legacy di solito devono condividere le risorse tra le operazioni di lettura e scrittura e le operazioni di analisi. Ciò può causare conflitti di risorse e query lente durante la scrittura o la lettura dei dati dall'archiviazione. I pool di risorse condivisi possono essere ulteriormente messi a dura prova quando le risorse sono necessarie per attività di gestione del database come l'assegnazione o la revoca delle autorizzazioni. La separazione dei livelli di calcolo e archiviazione di BigQuery consente a ogni livello di allocare dinamicamente le risorse senza influire sulle prestazioni o sulla disponibilità dell'altro.

L'architettura di BigQuery separa le risorse con una rete petabit.

Questo principio di separazione consente a BigQuery di innovare più rapidamente perché i miglioramenti di archiviazione e calcolo possono essere implementati in modo indipendente, senza tempi di inattività o impatto negativo sulle prestazioni del sistema. È anche essenziale per offrire un data warehouse serverless completamente gestito in cui il team di ingegneri di BigQuery gestisce aggiornamenti e manutenzione. Il risultato è che non devi eseguire il provisioning o scalare manualmente le risorse, il che ti consente di concentrarti sulla creazione di valore anziché sulle attività tradizionali di gestione dei database.

Le interfacce BigQuery includono l'interfaccia della console e lo strumento a riga di comando BigQuery. Google Cloud Sviluppatori e data scientist possono utilizzare librerie client con linguaggi di programmazione familiari, tra cui Python, Java, JavaScript e Go, nonché l'API REST e l'API RPC di BigQuery per trasformare e gestire i dati. I driver ODBC e JDBC consentono l'interazione con le applicazioni esistenti, inclusi strumenti e utilità di terze parti.

In qualità di analista dei dati, data engineer, amministratore del data warehouse o data scientist, BigQuery ti aiuta a caricare, elaborare e analizzare i dati per prendere decisioni aziendali fondamentali.

Inizia a utilizzare BigQuery

Puoi iniziare a esplorare BigQuery in pochi minuti. Sfrutta il livello di utilizzo gratuito o la sandbox senza costi di BigQuery per iniziare a caricare ed eseguire query sui dati.

  1. Sandbox di BigQuery: inizia a utilizzare la sandbox di BigQuery senza rischi e senza costi.
  2. Google Cloud Guida rapida alla console: Acquisisci familiarità con la potenza di BigQuery Studio.
  3. Set di dati pubblici: scopri le prestazioni di BigQuery esplorando dati reali di grandi dimensioni del programma per i set di dati pubblici.

Esplora BigQuery

L'infrastruttura serverless di BigQuery ti consente di concentrarti sui dati anziché sulla gestione delle risorse. BigQuery combina un data warehouse basato su cloud e potenti strumenti di analisi.

Spazio di archiviazione BigQuery

BigQuery archivia i dati utilizzando un formato di archiviazione a colonne ottimizzato per le query analitiche. BigQuery presenta i dati in tabelle, righe e colonne e fornisce il supporto completo per la semantica delle transazioni di database (ACID). Lo spazio di archiviazione BigQuery viene replicato automaticamente in più località per garantire un'elevata disponibilità.

Per ulteriori informazioni, vedi Panoramica dello spazio di archiviazione BigQuery.

BigQuery Analytics

L'analisi descrittiva e prescrittiva viene utilizzata per la business intelligence, l'analisi ad hoc, l'analisi geospaziale e il machine learning. Puoi eseguire query sui dati archiviati in BigQuery o eseguire query sui dati nella posizione in cui si trovano utilizzando tabelle esterne o query federate, inclusi Cloud Storage, Bigtable, Spanner o Google Sheets archiviati in Google Drive.

Per ulteriori informazioni, vedi Panoramica di BigQuery Analytics.

Amministrazione di BigQuery

BigQuery fornisce una gestione centralizzata delle risorse di dati e di calcolo, mentre Identity and Access Management (IAM) ti aiuta a proteggere queste risorse con il modello di accesso utilizzato in Google Cloud.LeGoogle Cloud best practice per la sicurezza forniscono un approccio solido ma flessibile che può includere la sicurezza perimetrale o un approccio di difesa in profondità più complesso e granulare.

  • Introduzione alla sicurezza e alla governance dei dati ti aiuta a comprendere la governance dei dati e quali controlli potresti dover proteggere le risorse BigQuery.
  • I job sono azioni che BigQuery esegue per tuo conto per caricare, esportare, eseguire query o copiare i dati.
  • Le prenotazioni ti consentono di passare dai prezzi on demand a quelli basati sulla capacità.

Per ulteriori informazioni, vedi Introduzione all'amministrazione di BigQuery.

Risorse di BigQuery

Esplora le risorse BigQuery:

API, strumenti e riferimenti

Materiali di riferimento per sviluppatori e analisti BigQuery:

Funzionalità di Gemini in BigQuery

Gemini in BigQuery fa parte della suite di prodotti Gemini for Google Cloud che fornisce assistenza basata sull'AI per aiutarti a utilizzare i tuoi dati.

Gemini in BigQuery fornisce assistenza AI per aiutarti a:

Per scoprire come configurare Gemini in BigQuery, consulta Configura Gemini in BigQuery.

Ruoli e risorse BigQuery

BigQuery soddisfa le esigenze dei professionisti dei dati nei seguenti ruoli e responsabilità.

Analista di dati

Indicazioni per le attività per aiutarti se devi:

Per fare un tour delle funzionalità di analisi dei dati di BigQuery direttamente nella console Google Cloud , fai clic su Fai il tour.

Inizia il tour

Amministratore dei dati

Indicazioni per le attività per aiutarti se devi:

Per ulteriori informazioni, vedi Introduzione all'amministrazione di BigQuery.

Per fare un tour delle funzionalità di amministrazione dei dati di BigQuery direttamente nella Google Cloud console, fai clic su Fai il tour.

Inizia il tour

Data scientist

Indicazioni per le attività per aiutarti se devi utilizzare il machine learning di BigQuery ML per svolgere le seguenti operazioni:

Data Developer

Indicazioni per le attività per aiutarti se devi:

Tutorial video su BigQuery

La seguente serie di tutorial video ti aiuta a iniziare a utilizzare BigQuery:

Titolo

Descrizione

Come iniziare a utilizzare BigQuery (17:18) Una panoramica che riassume cos'è BigQuery e come utilizzarlo. I segmenti includono: pipeline ETL, prezzi e ottimizzazione, BigQuery ML e BI Engine e si concludono con una demo di BigQuery nella console Google Cloud .
Che cos'è BigQuery? (4:39) Una panoramica di BigQuery su come è progettato per importare e archiviare grandi quantità di dati per aiutare analisti e sviluppatori
Utilizzo della sandbox di BigQuery (3:05) Come configurare una sandbox di BigQuery, che ti consente di eseguire query senza carta di credito
Porre domande, eseguire query (5:11) Come scrivere ed eseguire query SQL nella UI di BigQuery, oltre a scegliere un numero di maglia vincente
Caricamento dei dati in BigQuery (5:31) Come importare e analizzare i dati in tempo reale o eseguire un'analisi batch una tantum dei dati, oltre a gatti contro cani
Visualizzare i risultati della query (5:38) In che modo la visualizzazione dei dati è utile per rendere più comprensibili e interiorizzati i set di dati complessi
Gestione dell'accesso con IAM (5:23) Come consentire ad altri utenti di eseguire query sui tuoi set di dati in BigQuery con autorizzazioni IAM e controllo dell'accesso#39;accesso
Salvataggio e condivisione delle query (6:17) Come salvare e condividere le query in BigQuery senza problemi
Protezione dei dati sensibili con le visualizzazioni autorizzate (7:12) Come condividere set di dati con utenti diversi impostando controlli di accesso personalizzati
Esecuzione di query sui dati esterni con BigQuery (5:49) Come configurare un'origine dati esterna in BigQuery ed eseguire query sui dati di Cloud Storage, Cloud SQL, Google Drive e altro ancora
Che cosa sono le funzioni definite dall'utente? (4:59) Come creare funzioni definite dall'utente (UDF) per analizzare i set di dati in BigQuery

Passaggi successivi