Créer et gérer des glossaires d'entreprise Dataplex

Ce document explique comment créer et utiliser du contenu de glossaire d'entreprise dans le glossaire d'entreprise Dataplex.

Le glossaire d'entreprise offre un emplacement unique pour maintenir et gérer la terminologie et les définitions liées à l'activité dans l'ensemble de l'organisation. Il vous permet d'associer les termes aux colonnes des entrées de données cataloguées.

Le glossaire d'entreprise Dataplex vous permet d'effectuer les opérations suivantes:

  • Créer et gérer des glossaires, des catégories et des termes commerciaux
  • Les catégories permettent de représenter les structures hiérarchiques de catégories et de termes.
  • Établissez des relations entre des termes sous forme de synonymes ou de termes associés.
  • Associez des termes aux colonnes de saisie de données.
  • Parcourez et filtrez les termes du glossaire d'entreprise.
  • Permet d'afficher les termes et entrées de données associés à un terme donné.
  • Permet de rechercher des entrées de données taguées par un terme particulier.
  • Permet d'afficher les termes associés à une entrée de données donnée.

Terminologie

La terminologie suivante est utilisée dans ce document:

Glossaire d'entreprise

Le glossaire d'entreprise est un dépôt qui fournit des vocabulaires appropriés et régit les termes commerciaux d'une entreprise, ainsi que les définitions des termes associés et les relations entre ces termes. Elle permet de gérer et de gérer de manière centralisée les termes commerciaux et leurs définitions. La propriété suivante s'affiche dans la console d'un glossaire d'entreprise:

  • Présentation: description libre en texte enrichi de l'objectif et du contenu d'un glossaire commercial.

Catégorie

Une catégorie est définie dans un glossaire commercial. Il vous permet d'organiser et de structurer divers catégories et termes. Vous pouvez imbriquer des catégories jusqu'à trois niveaux. Voici les propriétés d'une catégorie:

  • Catégorie: relation utilisée pour établir le conteneur de la catégorie actuelle, le cas échéant.
  • Description: définition de la catégorie sous forme de texte enrichi au format libre.
  • Responsable des données: spécifie la personne responsable de la gestion de la catégorie. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations sur la catégorie.

Terme

Un terme est défini dans un glossaire d'entreprise soit directement dans le glossaire, soit dans une catégorie qui y figure. Il décrit un concept utilisé dans un secteur particulier de l'entreprise. Un terme possède les propriétés suivantes qui s'affichent dans la console:

  • Catégorie: relation utilisée pour établir le conteneur du terme actuel, le cas échéant.
  • Description: définition libre du terme de l'entreprise, au format texte enrichi.
  • Responsable des données: spécifie la personne responsable de la maintenance du terme. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations sur le terme.

Vous pouvez associer des termes à des colonnes de saisie de données pour indiquer que les colonnes sont décrites par les termes respectifs.

Synonyme

Un synonyme est une relation utilisée pour indiquer la similarité ou l'équivalence sémantique entre deux termes différents. Il est utilisé lorsque deux termes similaires sont définis par différentes équipes dans des glossaires différents. Par exemple, earnings et income.

Un terme lié est une relation utilisée pour indiquer que deux termes sont sémantiquement liés, mais différents. Par exemple, profit et income.

Avant de commencer

Limites

  • L'importation groupée de termes dans un glossaire d'entreprise n'est pas disponible.
  • La fonctionnalité de glossaire d'entreprise n'est disponible que dans la console Google Cloud.
  • Lorsque vous recherchez des entrées de données sur la page de recherche de Dataplex, le résultat de recherche inclut les entrées de données dont l'un des termes associés correspond au terme utilisé pour la recherche. Toutefois, la référence au terme correspondant n'est pas affichée dans le résultat de recherche.
  • Les régions BigQuery Omni ne sont pas acceptées. Vous ne pouvez pas créer de glossaire d'entreprise ni associer de termes aux entrées de données dans ces régions.

Rôles et autorisations requis

Pour obtenir les autorisations nécessaires pour créer et gérer des glossaires, demandez à votre administrateur de vous attribuer les rôles IAM suivants sur le projet:

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Ces rôles prédéfinis contiennent les autorisations requises pour créer et gérer des glossaires. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour créer et gérer des glossaires:

  • Accès complet aux glossaires, aux catégories et aux termes :
    • datacatalog.entries.*
    • datacatalog.relationships.*
  • Lisez des glossaires, des catégories et des termes, créez des pièces jointes entre des termes, et créez des rattachements entre des termes et des entrées de données :
    • datacatalog.entries.get
    • datacatalog.entries.list
    • datacatalog.relationships.*
  • Accès en lecture seule aux glossaires, aux catégories et aux termes :
    • datacatalog.entries.get
    • datacatalog.entries.list
    • datacatalog.entryGroups.get
    • datacatalog.relationships.list
    • resourcemanager.projects.list
    • resourcemanager.projects.get
  • Créez ou supprimez des glossaires : datacatalog.entryGroups.create

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus sur les rôles et les autorisations de Data Catalog, consultez la page Rôles prédéfinis pour Data Catalog.

Créer et gérer des glossaires commerciaux

Créer un glossaire d'entreprise

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Cliquez sur Créer un glossaire d'entreprise.

  3. Sur la page Créer un glossaire d'entreprise, indiquez un nom, un emplacement et une description pour le glossaire d'entreprise.

    Les champs de nom et d'emplacement sont obligatoires. Une fois le glossaire créé, vous ne pouvez plus modifier l'emplacement.

  4. Cliquez sur Créer.

    Le glossaire est créé sous le projet en cours et la page de glossaire s'affiche.

Afficher la liste des glossaires disponibles

  • Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

    Le volet My glossaries (Mes glossaires) affiche tous les glossaires de l'organisation pour lesquels vous disposez d'une autorisation view. Les glossaires s'affichent avec leur description et l'heure de la dernière modification.

Modifier un glossaire

Vous pouvez modifier le nom et la description d'un glossaire.

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Cliquez sur le glossaire que vous souhaitez modifier.

    • Pour modifier le nom, cliquez sur , saisissez un nouveau nom, puis cliquez sur Enregistrer.

    • Pour modifier la description, cliquez sur Edit description (Modifier la description), saisissez une nouvelle description, puis cliquez sur Save (Enregistrer).

Supprimer un glossaire

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Cliquez sur le glossaire que vous souhaitez supprimer.

  3. Cliquez sur Supprimer.

    Pour confirmer votre choix, saisissez le nom du glossaire, puis cliquez sur Confirmer.

Créer et gérer des catégories

Créer une catégorie sous un glossaire

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Sélectionnez un glossaire dans lequel vous souhaitez créer une catégorie, puis cliquez sur Créer une catégorie.

  3. Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.

  4. Cliquez sur Créer.

    La page des détails de la catégorie s'ouvre.

Créer une catégorie dans une catégorie

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire dans lequel vous souhaitez créer une catégorie.

  3. Sélectionnez la catégorie parente dans laquelle vous souhaitez créer une autre catégorie, puis cliquez sur Créer une catégorie. Vous pouvez imbriquer une catégorie jusqu'à trois niveaux.

  4. Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.

  5. Cliquez sur Créer.

    La page des détails de la catégorie s'ouvre.

Afficher la liste des catégories disponibles

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez un glossaire pour afficher la liste des catégories disponibles.

  3. Développez la catégorie pour afficher la liste des catégories imbriquées disponibles.

Mettre à jour une catégorie

Vous pouvez modifier le nom, la description, le responsable des données et la catégorie parente de la catégorie actuelle.

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur la catégorie que vous souhaitez modifier.

    1. Pour modifier le nom, cliquez sur et saisissez-en un nouveau.

    2. Pour modifier la description, cliquez sur Edit description (Modifier la description), puis saisissez une nouvelle description.

    3. Pour modifier la liste des responsables des données, cliquez sur à côté de Steward, fournissez la liste des adresses e-mail des responsables des données, puis cliquez sur Enregistrer.

    4. Pour modifier la catégorie, cliquez sur à côté de Catégorie.

      • Pour modifier la catégorie parente, dans le champ Sélectionner une catégorie, saisissez le nom d'une nouvelle catégorie parente du glossaire actuel, puis sélectionnez-la.

      • Pour supprimer la catégorie actuelle, dans le champ Sélectionner une catégorie, sélectionnez ---None--- (Aucune).

      Cliquez sur Enregistrer.

Supprimer une catégorie

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur la catégorie que vous souhaitez supprimer définitivement.

    Un avertissement s'affiche, indiquant que la suppression est irréversible et que tous les termes et toutes les catégories de la catégorie actuelle passeront au niveau suivant.

    Pour confirmer la suppression, saisissez le nom de la catégorie, puis cliquez sur Confirmer.

Créer et gérer des conditions

Créer un terme

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Sélectionnez un glossaire dans lequel vous souhaitez créer un terme, puis cliquez sur Créer un terme.

  3. Sur la page Créer un terme, saisissez un nom et une description pour le terme.

  4. Cliquez sur Créer.

    La page d'informations sur le terme s'affiche.

Afficher la liste des termes disponibles

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez un glossaire pour afficher la liste des termes disponibles.

Accéder aux détails d'un terme

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez un glossaire pour afficher la liste des termes disponibles.

  3. Cliquez sur un terme.

    La page des détails du terme affiche le nom, la description, les termes associés, les synonymes et les entrées associées.

Mettre à jour un terme

Vous pouvez modifier le nom, la description et le responsable des données d'un terme.

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur le terme que vous souhaitez modifier.

    1. Pour modifier le nom, cliquez sur et saisissez-en un nouveau.

    2. Pour modifier la description, cliquez sur Edit description (Modifier la description), puis saisissez une nouvelle description.

    3. Pour modifier la liste des responsables des données, cliquez sur à côté de Steward, fournissez la liste des adresses e-mail des responsables des données, puis cliquez sur Enregistrer.

    4. Pour modifier la catégorie, cliquez sur à côté de Catégorie.

      • Pour modifier la catégorie parente, dans le champ Sélectionner une catégorie, saisissez le nom d'une nouvelle catégorie parente du glossaire actuel, puis sélectionnez-la.

      • Pour supprimer la catégorie actuelle, dans le champ Sélectionner une catégorie, sélectionnez ---None--- (Aucune).

      Cliquez sur Enregistrer.

Supprimer un terme

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur le terme que vous souhaitez supprimer définitivement.

    Un avertissement s'affiche, indiquant que la suppression est irréversible et que toutes les relations associées au terme seront supprimées.

    Pour confirmer la suppression, saisissez le nom du terme, puis cliquez sur Confirmer.

Vous pouvez ajouter des relations entre des termes en les marquant comme étant des termes associés ou des synonymes. Les listes de termes associés et de synonymes s'affichent sur la page d'informations du terme.

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur le terme auquel vous souhaitez associer un synonyme ou un terme connexe.

  3. Cliquez sur pour Termes associés ou Synonymes.

  4. Dans le champ Rechercher des termes de glossaire, saisissez le terme que vous souhaitez joindre, puis sélectionnez-le dans le résultat de recherche.

    Le terme est immédiatement associé lorsque vous le sélectionnez.

  5. Cliquez sur OK.

  1. Dans la console Google Cloud, accédez à la page Glossaires Dataplex.

    Accéder aux glossaires

  2. Développez le glossaire et cliquez sur le terme pour lequel vous souhaitez supprimer un synonyme ou un terme connexe.

  3. Pour supprimer un terme associé, procédez comme suit:

    1. Cliquez sur à côté de Conditions associées.

    2. Cliquez sur pour le terme associé que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.

    3. Cliquez sur OK.

  4. Pour supprimer un synonyme, procédez comme suit:

    1. Cliquez sur à côté de Synonymes.

    2. Cliquez sur pour le synonyme que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.

    3. Cliquez sur OK.

Gérer les termes au niveau des colonnes

Vous pouvez associer des termes aux colonnes des entrées Data Catalog ayant des schémas (par exemple, des tables et des ensembles de fichiers) pour fournir plus de contexte sur les données de colonne.

Associer des termes à des colonnes

  1. Accédez à une entrée Data Catalog dotée d'un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Termes commerciaux, cliquez sur pour le champ auquel vous souhaitez associer des termes.

  4. Dans le champ Recherche de terme, saisissez le nom du terme, puis sélectionnez-le dans le résultat de recherche. Vous pouvez sélectionner plusieurs termes.

  5. Cliquez sur Joindre les conditions.

Afficher le détail des termes associés aux colonnes

  1. Accédez à une entrée Data Catalog dotée d'un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Termes commerciaux, cliquez sur le terme pour en afficher la description. Vous pouvez également supprimer le terme ou accéder à sa page d'informations à l'aide des options de cette fenêtre.

Supprimer les termes associés aux colonnes

  1. Accédez à une entrée Data Catalog dotée d'un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Termes commerciaux, cliquez sur pour le terme que vous souhaitez supprimer.

    Vous pouvez également supprimer la condition associée en cliquant dessus, puis sur Supprimer la condition commerciale > Confirmer.

Rechercher des glossaires et des termes

Pour parcourir le contenu de votre glossaire d'entreprise, utilisez l'arborescence du glossaire et des termes sur la page Glossaires Dataplex.

Vous pouvez utiliser la barre de filtre de la page Glossaires Dataplex pour localiser les catégories par nom à afficher ou par termes en fonction d'un critère. Le filtre renvoie les éléments avec des attributs correspondant à la requête de filtre. Vous pouvez également utiliser les qualificatifs suivants:

  • parent:VALUE

    Met en surbrillance les termes dont le nom ou la description du glossaire parent correspond à VALUE.

    Par exemple, parent:Finance met en surbrillance les termes associés au nom ou à la description du glossaire parent contenant l'expression Finance.

  • contact:VALUE

    Met en surbrillance les termes pour lesquels le responsable des données est VALUE.

    Par exemple, contact:johndoe@company.org met en évidence les entrées associées aux termes dont le responsable des données correspond à johndoe@company.org.

  • synonym:VALUE

    Met en surbrillance les termes qui ont au moins un synonyme dont le nom ou la description correspond à VALUE.

    Par exemple, synonym:interest met en surbrillance les termes qui ont des termes associés dont le nom ou la description contient l'expression interest.

  • related_to:VALUE

    Met en surbrillance les termes qui comportent au moins un terme associé dont le nom ou la description correspond à VALUE.

    Par exemple, related_to:discounting met en surbrillance les termes qui ont des termes associés dont le nom ou la description contient l'expression discounting.

Rechercher des entrées de données à l'aide de termes

Vous pouvez utiliser le contenu du glossaire d'entreprise Dataplex lorsque vous recherchez des entrées sur la page Search de Dataplex.

Les scénarios de recherche suivants sont acceptés:

  • Recherche simple: la requête de recherche est spécifiée sous forme de texte au format libre qui capture le nom ou la description du terme. Les résultats de recherche incluent les entrées associées à un terme dont le nom ou la description correspond à la requête de recherche. Ces résultats s'affichent à côté des résultats extraits par d'autres méthodes de mise en correspondance sans rapport avec le contenu du glossaire d'entreprise.

  • Effectuer une recherche à l'aide de qualificatifs: la requête de recherche est spécifiée en tant que term:VALUE. Le résultat de la recherche inclut les entrées associées à un terme dont une sous-chaîne de nom, de description ou de responsable des données correspond à VALUE.

Étapes suivantes