Introduzione alle connessioni
BigQuery consente di eseguire query sui dati archiviati al di fuori di BigQuery nei servizi Google Cloud come Cloud Storage o Spanner oppure in origini di terze parti come AWS o Azure. Queste connessioni esterne utilizzano l'API BigQuery Connection.
Ad esempio, supponi di archiviare i dettagli degli ordini dei clienti in Cloud SQL e i dati sulle vendite in BigQuery e di voler unire le due tabelle in una singola query. Puoi creare una connessione Cloud SQL al database esterno utilizzando l'API BigQuery Connection. Con le connessioni, le credenziali del database non vengono mai inviate come testo in chiaro.
Una connessione viene criptata e archiviata in modo sicuro nel servizio di connessione BigQuery. Per concedere agli utenti l'accesso alle connessioni, concedi loro i ruoli IAM (Identity and Access Management) della connessione BigQuery.
Tipi di connessione
BigQuery offre diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Archiviazione blob Azure
- Risorse di Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL (anteprima)
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Connessione ad Amazon S3.
Una volta esistente una connessione Amazon S3, puoi fare quanto segue:
- Creare tabelle esterne su Amazon S3
- Esegui query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Crea set di dati basati su database AWS Glue.
Connessioni Spark
Le stored procedure per Spark consentono di eseguire stored procedure scritte in Python utilizzando BigQuery. Una connessione Spark consente di connetterti a Dataproc Serverless ed eseguire le stored procedure per Spark.
Per creare questa connessione, consulta Creare connessioni.
Connessioni di archiviazione BLOB
Per creare una connessione per l'archiviazione BLOB con BigQuery Omni, consulta Connessione all'archiviazione BLOB.
Quando disponi di una connessione Blob Storage esistente, puoi fare quanto segue:
- Creare tabelle esterne basate su Archiviazione BLOB
- Esegui una query sui dati di Blob Storage
- Esportare i risultati in Blob Storage
Connessioni alle risorse Google Cloud
Una connessione a risorse Google Cloud è una connessione per autorizzare l'accesso ad altre risorse Google Cloud come i modelli remoti di Vertex AI, le funzioni remote e BigLake. Per maggiori dettagli su come configurare una connessione alle risorse Google Cloud, consulta Creare e configurare una connessione alle risorse Cloud.
Una volta stabilita una connessione a una risorsa Google Cloud, puoi utilizzarla per creare i seguenti oggetti BigQuery:
- Modelli remoti. Per maggiori informazioni, consulta l'istruzione CREATE MODEL per i modelli remoti su LLM, l'istruzione CREATE MODEL per i modelli remoti sui servizi di AI Cloud e l'istruzione CREATE MODEL per i modelli remoti sui modelli ospitati su Vertex AI.
- Funzioni remote. Le funzioni remote di BigQuery ti consentono di implementare le funzioni con qualsiasi linguaggio supportato in Cloud Functions o in Cloud Run. Una connessione a funzione remota ti consente di connetterti con Cloud Functions o Cloud Run ed eseguire queste funzioni. Per creare una connessione a una funzione remota BigQuery, consulta Creare una connessione.
- Tabelle BigLake. Le connessioni BigLake connettono le tabelle BigLake alle origini dati esterne, garantendo al contempo la sicurezza e il controllo dell'accesso granulari per BigQuery per i dati strutturati e non strutturati in Cloud Storage.
- Tabelle di oggetti. Per ulteriori informazioni, consulta Introduzione alle tabelle degli oggetti.
Connessioni Spanner
Per creare una connessione Spanner, consulta Connettersi a Spanner.
Dopo aver creato una connessione Spanner, puoi creare query federate. Queste query possono stabilire connessioni a Spanner prima di inviare una query.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Dopo aver creato una connessione Cloud SQL, puoi creare query federate. Queste query possono stabilire connessioni a Cloud SQL prima di inviare una query.
Connessioni AlloyDB
Per creare una connessione AlloyDB, vedi Connettersi ad AlloyDB per PostgreSQL.
Una volta esistente una connessione AlloyDB, puoi creare query federate. Queste query possono stabilire connessioni ad AlloyDB prima di inviare una query.
Audit log
BigQuery registra le richieste di utilizzo e gestione relative alle connessioni. Per saperne di più, consulta Panoramica degli audit log di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri come analizzare le tabelle di oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Eseguire query sui dati archiviati in Amazon S3.
- Esegui query sui dati archiviati in Blob Storage.
- Eseguire query sui dati strutturati archiviati in Cloud Storage.
- Esegui query su dati non strutturati archiviati in Cloud Storage.
- Eseguire query sui dati archiviati in Spanner.
- Esegui le query sui dati archiviati in Cloud SQL.
- Esegui query sui dati archiviati in AlloyDB.
- Eseguire query sui dati utilizzando le funzioni remote.
- Esegui query su dati non strutturati usando le funzioni remote.
- Esegui una query sui dati utilizzando stored procedure per Apache Spark.
- Scopri di più sulle tabelle esterne.