Introduzione alle connessioni
BigQuery ti consente di eseguire query sui dati archiviati al di fuori di BigQuery in servizi Google Cloud come Cloud Storage o Spanner oppure in origini di terze parti come AWS o Azure. Queste connessioni esterne utilizzano l'API BigQuery Connection.
Ad esempio, supponi di archiviare i dettagli degli ordini dei clienti in Cloud SQL e i dati sulle vendite in BigQuery. Unire i due in una singola query. Puoi creare una connessione Cloud SQL un database esterno usando l'API BigQuery Connection. Con le connessioni, non invii mai le credenziali del database come testo non cifrato.
Una connessione è criptata e archiviata in modo sicuro in BigQuery completamente gestito di Google Cloud. Puoi concedere agli utenti l'accesso alle connessioni granting them BigQuery connection Identity and Access Management (IAM) roles.
Tipi di connessione
BigQuery fornisce diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Archiviazione blob Azure
- Risorse di Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL
- SAP DataSfera
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Eseguire la connessione ad Amazon S3.
Una volta stabilita una connessione ad Amazon S3, puoi:
- Creare tabelle esterne su Amazon S3
- Eseguire query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Crea set di dati basati su database AWS Glue.
Connessioni Spark
Archiviate procedure per Spark esegui stored procedure scritte in Python utilizzando BigQuery. Una connessione Spark ti consente di connetterti a Dataproc Serverless ed eseguire le stored procedure per Spark.
Per creare questa connessione, consulta Creare connessioni.
Connessioni di archiviazione BLOB
Per creare una connessione Archiviazione BLOB con BigQuery Omni, consulta Connettiti allo spazio di archiviazione BLOB.
Una volta stabilita una connessione a Blob Storage, puoi:
- Crea tabelle esterne basate sull'archiviazione BLOB
- Eseguire query sui dati di Archiviazione BLOB
- Esportare i risultati in Archiviazione BLOB
Connessioni alle risorse Google Cloud
Una connessione alla risorsa Google Cloud è una connessione per autorizzare l'accesso ad altre risorse Google Cloud come i modelli remoti di Vertex AI, le funzioni remote e BigLake. Per maggiori dettagli su come configurare una connessione alle risorse Google Cloud, consulta Crea e configura una connessione a una risorsa Cloud.
Una volta creata una connessione alla risorsa Google Cloud, puoi utilizzare gli oggetti BigQuery elencati di seguito:
- Modelli remoti. Per ulteriori informazioni, vedi L'istruzione CREATE MODEL per i modelli remoti su LLM, L'istruzione CREATE MODEL per i modelli remoti sui servizi di IA Cloud e L'istruzione CREATE MODEL per i modelli remoti su modelli ospitati da Vertex AI.
- Funzioni remote. Le funzioni remote di BigQuery consentono di implementare funzioni con qualsiasi lingua supportata nelle funzioni Cloud Run o in Cloud Run. Una connessione della funzione remota ti consente di connetterti alle funzioni Cloud Run o a Cloud Run ed eseguirle. Per creare una connessione a una funzione remota BigQuery, consulta Creare una connessione.
- Tabelle BigLake. Le connessioni BigLake collegano tabelle BigLake a origini dati esterne mantenendo il controllo dell'accesso e la sicurezza granulari di BigQuery per i dati strutturati e non strutturati in Cloud Storage.
- Tabelle di oggetti. Per ulteriori informazioni, consulta la sezione Introduzione alle tabelle oggetti.
Connessioni Spanner
Per creare una connessione Spanner, consulta Eseguire la connessione a Spanner.
Quando hai una connessione Spanner esistente, puoi eseguire query federate.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Una volta stabilita una connessione Cloud SQL, puoi eseguire query federate.
Connessioni AlloyDB
Per creare una connessione AlloyDB, consulta Connettersi ad AlloyDB per PostgreSQL.
Quando hai una connessione AlloyDB esistente, puoi eseguire query federate.
Connessioni SAP Datasphere
Per creare una connessione SAP DataSphere, consulta Connettersi a SAP DataSpa.
Una volta creata una connessione SAP DataSphere, puoi eseguire query federate.
Audit log
BigQuery registra le richieste di utilizzo e gestione relative alle connessioni. Per saperne di più, consulta Panoramica degli audit log di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri come analizzare le tabelle degli oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Esegui query sui dati archiviati in Amazon S3.
- Eseguire query sui dati archiviati in Archiviazione BLOB.
- Esegui query sui dati strutturati archiviati in Cloud Storage.
- Esegui query sui dati non strutturati archiviati in Cloud Storage.
- Esegui query sui dati archiviati in Spanner.
- Esegui query sui dati archiviati in Cloud SQL.
- Eseguire query sui dati archiviati in AlloyDB.
- Eseguire query sui dati utilizzando funzioni remote.
- Eseguire query su dati non strutturati utilizzando funzioni remote.
- Eseguire query sui dati utilizzando stored procedure per Apache Spark.
- Scopri di più sulle tabelle esterne.