Einführung in Verbindungen
Mit BigQuery können Sie Daten abfragen, die außerhalb von BigQuery in Google Cloud-Diensten wie Cloud Storage oder Spanner oder in Drittanbieterquellen wie AWS oder Azure gespeichert sind. Diese externen Verbindungen verwenden die BigQuery Connection API.
Angenommen, Sie speichern Details zu Kundenaufträgen in Cloud SQL und Daten zu Verkäufen in BigQuery und möchten die beiden Tabellen in einer einzigen Abfrage verknüpfen. Sie können mit der BigQuery Connection API eine Cloud SQL-Verbindung zur externen Datenbank herstellen. Bei Verbindungen senden Sie Anmeldedaten für Datenbanken niemals als Klartext.
Jede Verbindung wird verschlüsselt und sicher im BigQuery-Verbindungsdienst gespeichert. Um Nutzern Zugriff auf Verbindungen zu gewähren weisen Sie diesen IAM-Rollen (Identity and Access Management) für BigQuery-Verbindungen zu.
Verbindungstypen
BigQuery bietet verschiedene Verbindungstypen für die folgenden externen Datenquellen:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob Storage
- Google Cloud-Ressourcen wie Vertex AI-Remote-Modelle, Remote-Funktionen und BigLake
- Spanner
- Cloud SQL
- AlloyDB for PostgreSQL
Amazon S3-Verbindungen
Informationen zum Erstellen einer Amazon S3-Verbindung mit BigQuery Omni finden Sie unter Verbindung zu Amazon S3 herstellen.
Sobald Sie eine Amazon S3-Verbindung haben, können Sie Folgendes tun:
- Externe Tabellen in Amazon S3 erstellen
- Amazon S3-Daten abfragen
- Ergebnisse nach Amazon S3 exportieren
- Datasets basierend auf AWS Glue-Datenbanken erstellen.
Spark-Verbindungen
Mit gespeicherten Prozeduren für Spark können Sie gespeicherte, in Python geschriebene Prozeduren mit BigQuery ausführen. Mit einer Spark-Verbindung können Sie eine Verbindung zu Dataproc Serverless herstellen und die gespeicherten Prozeduren für Spark ausführen.
Informationen zum Erstellen dieser Verbindung finden Sie unter Verbindungen erstellen.
Blob-Speicherverbindungen
Informationen zum Erstellen einer Blob Storage-Verbindung mit BigQuery Omni finden Sie unter Mit Blob Storage verbinden.
Sobald Sie eine Blob Storage-Verbindung haben, können Sie Folgendes tun:
- Externe Tabellen anhand von Blob Storage erstellen
- Blob Storage-Daten abfragen
- Ergebnisse in Blob Storage exportieren
Google Cloud-Ressourcenverbindungen
Eine Google Cloud-Ressourcenverbindung ist eine Verbindung, um den Zugriff auf andere Google Cloud-Ressourcen wie Vertex AI-Remote-Modelle, Remote-Funktionen und BigLake zu autorisieren. Weitere Informationen zum Einrichten einer Google Cloud-Ressourcenverbindung finden Sie unter Cloud-Ressourcenverbindung erstellen und einrichten.
Sobald Sie eine Google Cloud-Ressourcenverbindung haben, können Sie folgende BigQuery-Objekte damit erstellen:
- Remotemodelle Weitere Informationen finden Sie in der CREATE MODEL-Anweisung für Remote-Modelle über LLMs, der CREATE MODEL-Anweisung für Remote-Modelle über Cloud AI-Diensten und der CREATE MODEL-Anweisung für Remote-Modelle über von Vertex AI gehostete Modelle.
- Remote-Funktionen Mit den Remote-Funktionen von BigQuery können Sie Funktionen mit allen unterstützten Sprachen in Cloud Run-Funktionen oder Cloud Run implementieren. Mit einer Remote-Funktionsverbindung können Sie eine Verbindung zu Cloud Run-Funktionen oder Cloud Run herstellen und diese Funktionen ausführen. Informationen zum Erstellen einer BigQuery-Remote-Funktionsverbindung finden Sie unter Verbindung erstellen.
- BigLake-Tabellen BigLake-Verbindungen verbinden BigLake-Tabellen mit externen Datenquellen und behalten gleichzeitig eine detaillierte BigQuery-Zugriffssteuerung und Sicherheit für strukturierte und unstrukturierte Daten in Cloud Storage bei.
- Objekttabellen Weitere Informationen finden Sie unter Einführung in Objekttabellen.
Cloud Spanner-Verbindungen
Informationen zum Erstellen einer Spanner-Verbindung finden Sie unter Verbindung zu Spanner herstellen.
Sobald Sie eine Spanner-Verbindung haben, können Sie föderierte Abfragen erstellen. Diese Abfragen können Verbindungen zu Spanner herstellen, bevor Sie eine Abfrage senden.
Cloud SQL-Verbindungen
Informationen zum Erstellen einer Cloud SQL-Verbindung finden Sie unter Verbindung zu Cloud SQL herstellen.
Sobald Sie eine Cloud SQL-Verbindung haben, können Sie föderierte Abfragen erstellen. Diese Abfragen können Verbindungen zu Cloud SQL herstellen, bevor Sie eine Abfrage senden.
AlloyDB-Verbindungen
Informationen zum Erstellen einer AlloyDB-Verbindung finden Sie unter Verbindung zu AlloyDB for PostgreSQL herstellen.
Sobald Sie eine AlloyDB-Verbindung haben, können Sie föderierte Abfragen erstellen. Diese Abfragen können Verbindungen zu AlloyDB herstellen, bevor Sie eine Abfrage senden.
Audit-Logs
BigQuery protokolliert Nutzungs- und Verwaltungsanfragen zu Verbindungen. Weitere Informationen finden Sie in der Übersicht zu BigQuery-Audit-Logs.
Nächste Schritte
- Verbindungen verwalten.
- Objekttabellen mithilfe von Remotefunktionen analysieren
- So fragen Sie gespeicherte Daten ab:
- In Amazon S3 gespeicherte Daten abfragen
- In Blob Storage gespeicherte Daten abfragen
- In Cloud Storage strukturierte gespeicherte Daten abfragen.
- In Cloud Storage unstrukturierte gespeicherte Daten abfragen.
- In Spanner gespeicherte Daten abfragen.
- In Cloud SQL gespeicherte Daten abfragen.
- In AlloyDB gespeicherte Daten abfragen.
- Daten mit Remotefunktionen abfragen.
- Unstrukturierte Daten mit Remote-Funktionen abfragen
- Daten mit gespeicherten Prozeduren für Apache Spark abfragen.
- Externe Tabellen