Configurer et utiliser la résolution d'entités dans BigQuery
Ce document explique comment mettre en œuvre la résolution d'entités pour les utilisateurs finaux de cette dernière (nommés ci-après utilisateurs finaux) et les fournisseurs d'identité.
Les utilisateurs finaux peuvent utiliser ce document pour se connecter à un fournisseur d'identité et utiliser le service de ce fournisseur pour établir des correspondances entre enregistrements. Les fournisseurs d'identité peuvent utiliser ce document pour configurer des services à partager avec les utilisateurs finaux sur Google Cloud Marketplace.
Workflow pour les utilisateurs finaux
Les sections suivantes expliquent aux utilisateurs finaux comment configurer la résolution d'entités dans BigQuery. Pour obtenir une représentation visuelle de la configuration complète, consultez l'architecture de la résolution d'entités.
Avant de commencer
- Contactez un fournisseur d'identité et mettez-vous en relation avec celui-ci. BigQuery accepte la résolution d'entités avec le fournisseur LiveRamp.
- Obtenez les éléments suivants auprès du fournisseur d'identité :
- Identifiants du compte de service
- Signature de fonction distante
- Créez deux ensembles de données dans votre projet :
- Ensemble de données d'entrée
- Ensemble de données de sortie
Rôles requis
Pour obtenir les autorisations nécessaires pour exécuter des jobs de résolution d'entités, demandez à votre administrateur de vous accorder les rôles IAM suivants :
-
Pour que le compte de service du fournisseur d'identité puisse lire l'ensemble de données d'entrée et écrire dans l'ensemble de données de sortie :
-
Lecteur de données BigQuery (
roles/bigquery.dataViewer
) sur l'ensemble de données d'entrée -
Éditeur de données BigQuery (
roles/bigquery.dataEditor
) sur l'ensemble de données de sortie
-
Lecteur de données BigQuery (
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Traduire ou résoudre des entités
Consultez les sections suivantes pour obtenir des instructions spécifiques à un fournisseur d'identité.
LiveRamp
Prérequis
- Configurez l'identité intégrée LiveRamp dans BigQuery. Pour en savoir plus, consultez la section Activer l'identité intégrée LiveRamp dans BigQuery.
- Coordonnez les identifiants d'API avec LiveRamp pour les utiliser avec l'identité intégrée. Pour en savoir plus, consultez la section Authentification.
Configuration
Suivez la procédure ci-dessous lorsque vous utilisez l'identité intégrée LiveRamp pour la première fois. Une fois la configuration terminée, seules la table d'entrée et la table de métadonnées doivent être modifiées entre les exécutions.
Créer une table d'entrée
Créez une table dans l'ensemble de données d'entrée. Renseignez la table avec les RampID, les domaines cibles et les types cibles. Pour obtenir plus d'informations et des exemples, consultez la page Colonnes et descriptions des tables d'entrée.
Créer une table de métadonnées
La table de métadonnées permet de contrôler l'exécution de l'identité intégrée LiveRamp sur BigQuery. Créez une table de métadonnées dans l'ensemble de données d'entrée. Renseignez la table de métadonnées avec les ID client, les modes d'exécution, les domaines cibles et les types cibles. Pour obtenir plus d'informations et des exemples, consultez la page Colonnes et descriptions des tables de métadonnées.
Partager des tables avec LiveRamp
Accordez au compte de service Google Cloud LiveRamp un accès permettant d'afficher et de traiter les données de votre ensemble de données d'entrée. Pour obtenir plus d'informations et des exemples, consultez la page Partager des tables et des ensembles de données avec LiveRamp.
Exécuter un job d'identité intégré
Pour exécuter un job d'identité intégré avec LiveRamp dans BigQuery, procédez comme suit :
- Vérifiez que tous les RampID encodés dans votre domaine se trouvent dans la table d'entrée.
- Vérifiez que votre table de métadonnées est toujours exacte avant d'exécuter le job.
- Contactez LiveRampIdentitySupport@liveramp.com pour demander un processus de job. Incluez l'ID du projet, l'ID de l'ensemble de données et l'ID de la table (le cas échéant) pour votre table d'entrée, votre table de métadonnées et votre ensemble de données de sortie. Pour en savoir plus, consultez la page Notifier LiveRamp pour lancer le transcodage.
Les résultats sont généralement envoyés à votre ensemble de données de sortie dans un délai de trois jours ouvrés.
Compatibilité avec LiveRamp
En cas de problèmes de compatibilité, contactez l'assistance LiveRamp Identity.
Facturation LiveRamp
LiveRamp se charge de gérer la facturation pour ce qui concerne la résolution d'entités.
Workflow pour les fournisseurs d'identité
Les sections suivantes expliquent aux fournisseurs d'identité comment configurer la résolution d'entités dans BigQuery. Pour obtenir une représentation visuelle de la configuration complète, consultez l'architecture de la résolution d'entités.
Avant de commencer
- Créez un job Cloud Run ou une fonction Cloud Run Functions à intégrer à la fonction distante. L'une ou l'autre de ces options peut être utilisée indifféremment à cet effet.
Notez le nom du compte de service associé à Cloud Run ou Cloud Run Functions :
Dans la console Google Cloud, accédez à la page Cloud Functions.
Cliquez sur le nom de la fonction, puis sur l'onglet Détails.
Dans le volet Informations générales, recherchez et notez le nom du compte de service pour la fonction distante.
Créez une fonction distante.
Collectez les comptes principaux des utilisateurs finaux auprès de l'utilisateur final.
Rôles requis
Pour obtenir les autorisations nécessaires pour exécuter des jobs de résolution d'entités, demandez à votre administrateur de vous accorder les rôles IAM suivants :
-
Pour le compte de service associé à votre fonction pour lire et écrire sur les ensembles de données associés, et lancer des tâches :
-
Éditeur de données BigQuery (
roles/bigquery.dataEditor
) sur le projet -
Utilisateur de job BigQuery (
roles/bigquery.jobUser
) sur le projet
-
Éditeur de données BigQuery (
-
Pour que le compte principal de l'utilisateur final puisse voir la fonction distante et s'y connecter :
-
Utilisateur de connexion BigQuery (
roles/bigquery.connectionUser
) sur la connexion -
Lecteur de données BigQuery (
roles/bigquery.dataViewer
) sur l'ensemble de données du plan de contrôle avec la fonction distante
-
Utilisateur de connexion BigQuery (
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Partager la fonction distante de résolution d'entités
Modifiez le code d'interface distante suivant et partagez-le avec l'utilisateur final. L'utilisateur final doit disposer de ce code pour lancer le job de résolution d'entités.
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
Remplacez LIST_OF_PARAMETERS par la liste des paramètres transmis à la fonction distante.
Facultatif : Fournir les métadonnées de la tâche
Vous pouvez éventuellement fournir des métadonnées de job à l'aide d'une fonction distante indépendante, ou en écrivant une nouvelle table d'état dans l'ensemble de données de sortie de l'utilisateur. Les métriques et les états des jobs constituent des exemples de métadonnées.
Gestion de la facturation par les fournisseurs d'identité
Pour simplifier la facturation et l'intégration des clients, nous vous recommandons d'intégrer votre service de résolution d'entités à Google Cloud Marketplace. Vous pouvez ainsi configurer un modèle de tarification en fonction de l'utilisation du job de résolution d'entités, et Google va alors s'occuper de la facturation. Pour en savoir plus, consultez la section Proposer des produits SaaS (Software as a Service).