Configurer et utiliser la résolution d'entités dans BigQuery

Ce document explique comment mettre en œuvre la résolution d'entités pour les utilisateurs finaux de cette dernière (nommés ci-après utilisateurs finaux) et les fournisseurs d'identité.

Les utilisateurs finaux peuvent utiliser ce document pour se connecter à un fournisseur d'identité et utiliser le service de ce fournisseur pour établir des correspondances entre enregistrements. Les fournisseurs d'identité peuvent utiliser ce document pour configurer des services à partager avec les utilisateurs finaux sur Google Cloud Marketplace.

Workflow pour les utilisateurs finaux

Les sections suivantes expliquent aux utilisateurs finaux comment configurer la résolution d'entités dans BigQuery. Pour obtenir une représentation visuelle de la configuration complète, consultez l'architecture de la résolution d'entités.

Avant de commencer

  1. Contactez un fournisseur d'identité et mettez-vous en relation avec celui-ci. BigQuery accepte la résolution d'entités avec le fournisseur LiveRamp.
  2. Obtenez les éléments suivants auprès du fournisseur d'identité :
    • Identifiants du compte de service
    • Signature de fonction distante
  3. Créez deux ensembles de données dans votre projet :
    • Ensemble de données d'entrée
    • Ensemble de données de sortie

Rôles requis

Pour obtenir les autorisations nécessaires pour exécuter des jobs de résolution d'entités, demandez à votre administrateur de vous accorder les rôles IAM suivants :

  • Pour que le compte de service du fournisseur d'identité puisse lire l'ensemble de données d'entrée et écrire dans l'ensemble de données de sortie :

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Traduire ou résoudre des entités

Consultez les sections suivantes pour obtenir des instructions spécifiques à un fournisseur d'identité.

LiveRamp

Prérequis

Configuration

Suivez la procédure ci-dessous lorsque vous utilisez l'identité intégrée LiveRamp pour la première fois. Une fois la configuration terminée, seules la table d'entrée et la table de métadonnées doivent être modifiées entre les exécutions.

Créer une table d'entrée

Créez une table dans l'ensemble de données d'entrée. Renseignez la table avec les RampID, les domaines cibles et les types cibles. Pour obtenir plus d'informations et des exemples, consultez la page Colonnes et descriptions des tables d'entrée.

Créer une table de métadonnées

La table de métadonnées permet de contrôler l'exécution de l'identité intégrée LiveRamp sur BigQuery. Créez une table de métadonnées dans l'ensemble de données d'entrée. Renseignez la table de métadonnées avec les ID client, les modes d'exécution, les domaines cibles et les types cibles. Pour obtenir plus d'informations et des exemples, consultez la page Colonnes et descriptions des tables de métadonnées.

Partager des tables avec LiveRamp

Accordez au compte de service Google Cloud LiveRamp un accès permettant d'afficher et de traiter les données de votre ensemble de données d'entrée. Pour obtenir plus d'informations et des exemples, consultez la page Partager des tables et des ensembles de données avec LiveRamp.

Exécuter un job d'identité intégré

Pour exécuter un job d'identité intégré avec LiveRamp dans BigQuery, procédez comme suit :

  1. Vérifiez que tous les RampID encodés dans votre domaine se trouvent dans la table d'entrée.
  2. Vérifiez que votre table de métadonnées est toujours exacte avant d'exécuter le job.
  3. Contactez LiveRampIdentitySupport@liveramp.com pour demander un processus de job. Incluez l'ID du projet, l'ID de l'ensemble de données et l'ID de la table (le cas échéant) pour votre table d'entrée, votre table de métadonnées et votre ensemble de données de sortie. Pour en savoir plus, consultez la page Notifier LiveRamp pour lancer le transcodage.

Les résultats sont généralement envoyés à votre ensemble de données de sortie dans un délai de trois jours ouvrés.

Compatibilité avec LiveRamp

En cas de problèmes de compatibilité, contactez l'assistance LiveRamp Identity.

Facturation LiveRamp

LiveRamp se charge de gérer la facturation pour ce qui concerne la résolution d'entités.

Workflow pour les fournisseurs d'identité

Les sections suivantes expliquent aux fournisseurs d'identité comment configurer la résolution d'entités dans BigQuery. Pour obtenir une représentation visuelle de la configuration complète, consultez l'architecture de la résolution d'entités.

Avant de commencer

  1. Créez un job Cloud Run ou une fonction Cloud Run Functions à intégrer à la fonction distante. L'une ou l'autre de ces options peut être utilisée indifféremment à cet effet.
  2. Notez le nom du compte de service associé à Cloud Run ou Cloud Run Functions :

    1. Dans la console Google Cloud, accédez à la page Cloud Functions.

      Accéder à Cloud Functions

    2. Cliquez sur le nom de la fonction, puis sur l'onglet Détails.

    3. Dans le volet Informations générales, recherchez et notez le nom du compte de service pour la fonction distante.

  3. Créez une fonction distante.

  4. Collectez les comptes principaux des utilisateurs finaux auprès de l'utilisateur final.

Rôles requis

Pour obtenir les autorisations nécessaires pour exécuter des jobs de résolution d'entités, demandez à votre administrateur de vous accorder les rôles IAM suivants :

  • Pour le compte de service associé à votre fonction pour lire et écrire sur les ensembles de données associés, et lancer des tâches :
  • Pour que le compte principal de l'utilisateur final puisse voir la fonction distante et s'y connecter :

Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Partager la fonction distante de résolution d'entités

Modifiez le code d'interface distante suivant et partagez-le avec l'utilisateur final. L'utilisateur final doit disposer de ce code pour lancer le job de résolution d'entités.

`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)

Remplacez LIST_OF_PARAMETERS par la liste des paramètres transmis à la fonction distante.

Facultatif : Fournir les métadonnées de la tâche

Vous pouvez éventuellement fournir des métadonnées de job à l'aide d'une fonction distante indépendante, ou en écrivant une nouvelle table d'état dans l'ensemble de données de sortie de l'utilisateur. Les métriques et les états des jobs constituent des exemples de métadonnées.

Gestion de la facturation par les fournisseurs d'identité

Pour simplifier la facturation et l'intégration des clients, nous vous recommandons d'intégrer votre service de résolution d'entités à Google Cloud Marketplace. Vous pouvez ainsi configurer un modèle de tarification en fonction de l'utilisation du job de résolution d'entités, et Google va alors s'occuper de la facturation. Pour en savoir plus, consultez la section Proposer des produits SaaS (Software as a Service).