Se connecter à Spanner
En tant qu'administrateur BigQuery, vous pouvez créer une connexion permettant d'accéder aux données Spanner. Cette connexion permet aux analystes de données d'interroger des données dans Cloud Spanner.
Avant de commencer
- Activez l'API BigQuery Connection.
-
Pour obtenir les autorisations nécessaires pour vous connecter à Spanner, demandez à votre administrateur de vous accorder le rôle IAM Administrateur de connexion BigQuery (
roles/bigquery.connectionAdmin
) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Créer des connexions Spanner
Sélectionnez l'une des options suivantes :
Console
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur
Ajouter, puis sélectionnez Connexions à la source de données externe.Dans le volet Source de données externes, saisissez les informations suivantes :
- Dans le champ Type de connexion, sélectionnez Cloud Spanner.
- Dans le champ Connection ID (ID de connexion), saisissez un identifiant pour la ressource de connexion. Les lettres, les chiffres et les traits de soulignement sont autorisés.
- Pour Type d'emplacement, sélectionnez un emplacement (ou une région) BigQuery compatible avec votre région de source de données externe.
- (Facultatif) Dans le champ Nom descriptif, saisissez un nom clair pour identifier la connexion, tel que
My connection resource
. Le nom descriptif peut être n'importe quelle valeur permettant d'identifier la ressource de connexion si vous devez la modifier par la suite. - Facultatif : Dans le champ Description, saisissez une description pour la ressource de connexion.
- Dans le champ Nom de la base de données, saisissez le nom de la base de données Spanner au format suivant :
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
- Facultatif : Pour effectuer des lectures parallèles, sélectionnez Lire des données en parallèle. Spanner peut diviser certaines requêtes en fragments plus petits, ou partitions, et extraire les partitions en parallèle. Pour plus d'informations, consultez la section Lire des données en parallèle dans la documentation Spanner. Cette option est limitée aux requêtes dont le premier opérateur du plan d'exécution est un opérateur distributed union. Les autres requêtes renvoient une erreur. Pour afficher le plan d'exécution d'une requête Spanner, consultez la section Comprendre comment Spanner exécute les requêtes.
- Facultatif : Dans le champ Rôle de base de données, saisissez le nom d'un rôle de base de données Spanner. Si ce champ n'est pas vide, cette connexion interroge Spanner à l'aide de ce rôle de base de données par défaut. Les utilisateurs de Spanner disposant de contrôles d'accès ultraprécis qui envoient des requêtes via cette connexion doivent se voir accorder l'accès à ce rôle par leur administrateur, et le rôle de base de données doit disposer des droits
SELECT
sur tous les objets de schéma spécifiés dans les requêtes externes. Pour en savoir plus, consultez la page À propos du contrôle d'accès ultraprécis. - Facultatif : Pour activer Data Boost, sélectionnez Utiliser Spanner Data Boost. Data Boost vous permet d'exécuter des requêtes d'analyse et des exportations de données avec un impact quasiment nul sur les charges de travail existantes sur l'instance BigQuery provisionnée. Pour activer Data Boost, sélectionnez Data Boost et Lire les données en parallèle.
Cliquez sur Créer une connexion.
bq
Pour créer la connexion, exécutez la commande bq mk
avec l'option --connection
.
bq mk --connection \ --connection_type=CLOUD_SPANNER \ --properties='PROPERTIES' \ --location=LOCATION \ --display_name='FRIENDLY_NAME' \ --description 'DESCRIPTION' \ CONNECTION_ID
Remplacez les éléments suivants :
PROPERTIES
: objet JSON comportant les champs suivants :"database"
: base de données Spanner pour la connexion.À spécifier au format suivant :
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
."use_parallelism"
: si la valeur esttrue
, cette connexion effectue des lectures parallèles (facultatif).La valeur par défaut est
false
. Spanner peut diviser certaines requêtes en fragments plus petits, ou partitions, et extraire les partitions en parallèle. Pour plus d'informations, consultez la section Lire des données en parallèle dans la documentation Spanner. Cette option est limitée aux requêtes dont le premier opérateur du plan d'exécution est un opérateur distributed union. Les autres requêtes renvoient une erreur. Pour afficher le plan d'exécution d'une requête Spanner, consultez la section Comprendre comment Spanner exécute les requêtes."database_role"
(facultatif) : si elle n'est pas vide, cette connexion interroge Spanner à l'aide de ce rôle de base de données par défaut. Les utilisateurs de Spanner disposant de contrôles d'accès ultraprécis qui envoient des requêtes via cette connexion doivent se voir accorder l'accès à ce rôle par leur administrateur, et le rôle de base de données doit disposer des droitsSELECT
sur tous les objets de schéma spécifiés dans les requêtes externes.Si elle n'est pas spécifiée, la connexion s'authentifie avec des rôles IAM prédéfinis pour Spanner, et le compte principal exécutant des requêtes avec cette connexion doit avoir reçu le rôle IAM
roles/spanner.databaseReader
.Pour en savoir plus, consultez la page À propos du contrôle d'accès ultraprécis.
"useDataBoost"
: (facultatif) Si la connexion est définie surtrue
, les utilisateurs peuvent utiliser Data Boost. Data Boost permet aux utilisateurs d'exécuter des requêtes fédérées dans une capacité de calcul distincte, indépendante et distincte des instances provisionnées, afin d'éviter toute incidence sur les charges de travail existantes. Pour activer Data Boost, définissez"useDataBoost"
surtrue
et"use_parallelism"
surtrue
.Pour pouvoir utiliser Data Boost, le compte principal qui exécute des requêtes avec cette connexion doit disposer de l'autorisation
spanner.databases.useDataBoost
. Elle est incluse par défaut dans les rôlesroles/spanner.admin
etroles/spanner.databaseAdmin
.
LOCATION
: emplacement BigQuery compatible avec votre région de source de données externe.CONNECTION_ID
: identifiant de la ressource de connexion.L'ID de connexion peut contenir des lettres, des chiffres et des traits de soulignement. Si vous ne fournissez pas d'ID de connexion, BigQuery génère automatiquement un ID unique.
L'exemple suivant crée une ressource de connexion nommée
my_connection_id
.bq mk --connection \ --connection_type='CLOUD_SPANNER' \ --properties='{"database":"projects/my_project/instances/my_instance/databases/database1"}' \ --project_id=federation-test \ --location=us \ my_connection_id
API
Appelez la méthode CreateConnection
dans le service ConnectionService
.
Partager des connexions avec les utilisateurs
Vous pouvez attribuer les rôles suivants pour permettre aux utilisateurs d'interroger des données et de gérer les connexions :
roles/bigquery.connectionUser
permet aux utilisateurs de se connecter à des sources de données externes et d'y exécuter des requêtes.roles/bigquery.connectionAdmin
permet aux utilisateurs de gérer les connexions.
Pour en savoir plus sur les rôles et les autorisations IAM dans BigQuery, consultez la page Rôles prédéfinis et autorisations.
Sélectionnez l'une des options suivantes :
Console
Accédez à la page BigQuery.
Les connexions sont répertoriées dans votre projet, dans un groupe appelé Connexions externes.
Dans le volet Explorateur, cliquez sur votre nom de projet > Connexions externes > connexion.
Dans le volet Détails, cliquez sur Partager pour partager une connexion. Ensuite, procédez comme suit :
Dans la boîte de dialogue Autorisations de connexion, partagez la connexion avec d'autres comptes principaux en ajoutant ou en modifiant des comptes principaux.
Cliquez sur Enregistrer.
bq
Vous ne pouvez pas partager de connexion avec l'outil de ligne de commande bq. Pour partager une connexion, utilisez la console Google Cloud ou la méthode de l'API BigQuery Connections permettant le partage de connexion.
API
Utilisez la méthode projects.locations.connections.setIAM
dans la section de référence de l'API REST BigQuery Connections et fournissez une instance de la ressource policy
.
Java
Avant d'essayer cet exemple, suivez les instructions de configuration pour Java du guide de démarrage rapide de BigQuery : Utiliser les bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API BigQuery pour Java.
Pour vous authentifier auprès de BigQuery, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez la page Configurer l'authentification pour les bibliothèques clientes.
Étapes suivantes
- Découvrez les différents types de connexions.
- Découvrez comment gérer les connexions.
- En savoir plus sur les requêtes fédérées.
- Découvrez comment interroger des données Spanner.