Présentation des connexions

BigQuery vous permet d'interroger des données stockées en dehors de BigQuery dans des services Google Cloud tels que Cloud Storage ou Spanner, ou dans des sources tierces telles qu'AWS ou Azure. Ces connexions externes utilisent l'API BigQuery Connection.

Par exemple, supposons que vous stockiez des détails sur les commandes client dans Cloud SQL et des données sur les ventes dans BigQuery, et que vous souhaitiez joindre les deux tables dans une même requête. Vous pouvez créer une connexion Cloud SQL à la base de données externe à l'aide de l'API BigQuery Connection. Avec les connexions, vous n'envoyez jamais d'identifiants de base de données sous forme de texte clair.

Une connexion est chiffrée et stockée de manière sécurisée dans le service de connexion BigQuery. Vous pouvez autoriser les utilisateurs à accéder aux connexions en leur attribuant des rôles IAM (Identity and Access Management) de connexion BigQuery.

Types de connexions

BigQuery fournit différents types de connexions pour les sources de données externes suivantes :

  • Amazon Simple Storage Service (Amazon S3)
  • Apache Spark
  • Azure Blob Storage
  • Ressources Google Cloud telles que les modèles distants Vertex AI, les fonctions à distance et BigLake
  • Spanner
  • Cloud SQL
  • AlloyDB for PostgreSQL (Preview)

Connexions Amazon S3

Pour créer une connexion Amazon S3 avec BigQuery Omni, consultez la section Se connecter à Amazon S3.

Une fois que vous disposez d'une connexion Amazon S3, vous pouvez effectuer les opérations suivantes:

Connexions Spark

Les procédures stockées pour Spark vous permettent d'exécuter des procédures stockées écrites en Python à l'aide de BigQuery. Une connexion Spark vous permet de vous connecter à Dataproc sans serveur et d'exécuter les procédures stockées pour Spark.

Pour créer cette connexion, consultez la section Créer des connexions.

Connexions Blob Storage

Pour créer une connexion Blob Storage avec BigQuery Omni, consultez la section Se connecter à Blob Storage.

Une fois que vous disposez d'une connexion Blob Storage existante, vous pouvez effectuer les opérations suivantes:

Connexions aux ressources Google Cloud

Une connexion de ressource Google Cloud est une connexion permettant d'autoriser l'accès à d'autres ressources Google Cloud, telles que les modèles distants Vertex AI, les fonctions distantes et BigLake. Pour en savoir plus sur la configuration d'une connexion de ressource Google Cloud, consultez la page Créer et configurer une connexion de ressource Cloud.

Une fois que vous disposez d'une connexion à une ressource Google Cloud, vous pouvez l'utiliser pour créer les objets BigQuery suivants:

Connexions Spanner

Pour créer une connexion Spanner, consultez Se connecter à Spanner.

Une fois que vous disposez d'une connexion Spanner existante, vous pouvez créer des requêtes fédérées. Ces requêtes peuvent établir des connexions à Spanner avant d'envoyer une requête.

Connexions Cloud SQL

Pour créer une connexion Cloud SQL, consultez la page Se connecter à Cloud SQL.

Une fois que vous disposez d'une connexion Cloud SQL existante, vous pouvez créer des requêtes fédérées. Ces requêtes peuvent établir des connexions à Cloud SQL avant d'envoyer une requête.

Connexions AlloyDB

Pour créer une connexion AlloyDB, consultez la page Se connecter à AlloyDB pour PostgreSQL.

Une fois que vous disposez d'une connexion AlloyDB existante, vous pouvez créer des requêtes fédérées. Ces requêtes peuvent établir des connexions à AlloyDB avant d'envoyer une requête.

Journaux d'audit

BigQuery consigne les requêtes d'utilisation et de gestion concernant les connexions. Pour en savoir plus, consultez la présentation des journaux d'audit BigQuery.

Étapes suivantes