Ce document explique comment créer et utiliser le contenu d'un glossaire d'entreprise Dataplex.
Le glossaire d'entreprise permet de gérer et de gérer de façon centralisée la terminologie et les définitions liées à l'entreprise dans toute l'organisation. Elle vous permet d'associer les termes aux colonnes d'entrées de données catalogueées.
Le glossaire d'entreprise Dataplex vous permet d'effectuer les opérations suivantes:
- Créer et tenir à jour des glossaires, des catégories et des termes métier
- Utilisez les catégories pour représenter des structures hiérarchiques de catégories et de termes.
- Établir des relations entre des termes comme synonymes ou termes associés.
- Associez des termes aux colonnes de saisie de données.
- Parcourez et filtrez des termes dans le glossaire d'entreprise.
- Afficher les termes associés et les entrées de données pour un terme donné.
- Permet de rechercher des entrées de données taguées par un terme particulier.
- Afficher les termes associés à une entrée de données donnée.
Terminologie
La terminologie suivante est utilisée dans ce document:
Glossaire d'entreprise
Le glossaire d'entreprise est un dépôt qui fournit les vocabulaires appropriés. Il régit les termes métier d'une entreprise, ainsi que les définitions des termes associés et les relations entre ces termes. Elle fournit un emplacement unique pour gérer et gérer les termes métier et leurs définitions. La propriété suivante est affichée dans la console pour un glossaire d'entreprise:
- Présentation: description en texte enrichi au format libre de l'objectif et du contenu d'un glossaire d'entreprise.
Catégorie
Une catégorie est définie dans un glossaire d'entreprise. Il vous permet d'organiser et de structurer divers termes et catégories. Vous pouvez imbriquer jusqu'à trois niveaux. Voici les propriétés d'une catégorie:
- Catégorie: relation utilisée pour établir le conteneur de la catégorie actuelle, le cas échéant.
- Description: définition d'un établissement en texte enrichi au format libre de la catégorie.
- Responsable des données: spécifie la personne responsable de la gestion de la catégorie. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations de la catégorie.
Terme
Un terme est défini dans un glossaire d'entreprise, directement dans le glossaire ou dans n'importe quelle catégorie du glossaire. Il décrit un concept utilisé dans un secteur d'activité particulier au sein d'une entreprise. Un terme présente les propriétés suivantes dans la console:
- Catégorie: relation utilisée pour établir le conteneur du terme actuel, le cas échéant.
- Description: définition du terme en texte enrichi au format libre pour une entreprise.
- Responsable des données: désigne la personne responsable de la gestion de l'engagement. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations sur le terme.
Vous pouvez associer des termes avec des colonnes de saisie de données pour indiquer que les colonnes sont décrites par les termes respectifs.
Synonyme
Un synonyme est une relation utilisée pour indiquer une similarité ou une équivalence sémantique entre deux termes différents. Elle est utilisée lorsque deux termes similaires sont définis par des équipes différentes dans des glossaires différents. Par exemple, earnings
et income
.
Terme associé
Un terme lié est une relation utilisée pour indiquer que deux termes sont sémantiquement liés, mais différents. Par exemple, profit
et income
.
Avant de commencer
Limites
- L'importation groupée de termes dans un glossaire d'entreprise n'est pas acceptée.
- Le glossaire d'entreprise n'est compatible qu'avec la console Google Cloud.
- Lorsque vous recherchez des entrées de données sur la page de recherche dans Dataplex, le résultat de recherche inclut les entrées de données pour lesquelles l'un des termes qui leur sont associés correspond au terme utilisé pour la recherche. Toutefois, la référence au terme correspondant n'apparaît pas dans le résultat de recherche.
- Les régions BigQuery Omni ne sont pas acceptées. Vous ne pouvez pas créer de contenu de glossaire d'entreprise ni associer de termes aux entrées de données dans ces régions.
Rôles et autorisations requis
Afin d'obtenir les autorisations nécessaires pour créer et gérer des glossaires, demandez à votre administrateur de vous attribuer les rôles IAM suivants sur le projet:
-
Accès complet aux glossaires, aux catégories et aux termes : Propriétaire du glossaire Data Catalog (
roles/datacatalog.glossaryOwner
) -
Lisez des glossaires, des catégories et des termes, créez des pièces jointes entre des termes et créez des pièces jointes entre des termes et des entrées de données :
Utilisateur du glossaire Data Catalog (
roles/datacatalog.glossaryUser
) -
Accès en lecture seule aux glossaires, aux catégories et aux termes : Lecteur d'entrées Data Catalog (
roles/datacatalog.entryViewer
)
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.
Ces rôles prédéfinis contiennent les autorisations requises pour créer et gérer des glossaires. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer et gérer des glossaires:
-
Accès complet aux glossaires, aux catégories et aux termes :
-
datacatalog.entries.*
-
datacatalog.relationships.*
-
-
Lisez des glossaires, des catégories et des termes, créez des pièces jointes entre des termes et créez des pièces jointes entre les termes et les entrées de données :
-
datacatalog.entries.get
-
datacatalog.entries.list
-
datacatalog.relationships.*
-
-
Accès en lecture seule aux glossaires, aux catégories et aux termes :
-
datacatalog.entries.get
-
datacatalog.entries.list
-
datacatalog.entryGroups.get
-
datacatalog.relationships.list
-
resourcemanager.projects.list
-
resourcemanager.projects.get
-
-
Créer ou supprimer des glossaires :
datacatalog.entryGroups.create
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur les rôles et les autorisations associés à Data Catalog, consultez la page Rôles prédéfinis pour Data Catalog.
Créer et gérer des glossaires d'entreprise
Créer un glossaire d'entreprise
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur Créer un glossaire d'entreprise.
Sur la page Créer un glossaire d'entreprise, indiquez un nom, un lieu et une description pour ce glossaire.
Les champs "Nom" et "Lieu" sont obligatoires. Une fois le glossaire créé, vous ne pouvez plus modifier l'emplacement.
Cliquez sur Créer.
Le glossaire est créé dans le projet en cours, et la page de glossaire s'affiche.
Afficher la liste des glossaires disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Le volet Mes glossaires affiche tous les glossaires de l'organisation pour lesquels vous disposez de l'autorisation
view
. Les glossaires s'affichent avec leur description et la date de leur dernière modification.
Modifier un glossaire
Vous pouvez modifier le nom et la description d'un glossaire.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur le glossaire que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
, saisissez un nouveau nom, puis cliquez sur Enregistrer.Pour modifier la description, cliquez sur Modifier la description, saisissez une nouvelle description, puis cliquez sur Enregistrer.
Supprimer un glossaire
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur le glossaire que vous souhaitez supprimer.
Cliquez sur Supprimer.
Pour confirmer votre choix, saisissez le nom du glossaire, puis cliquez sur Confirmer.
Créer et gérer des catégories
Créer une catégorie dans un glossaire
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Sélectionnez un glossaire dans lequel vous souhaitez créer une catégorie, puis cliquez sur Créer une catégorie.
Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.
Cliquez sur Créer.
La page des détails de la catégorie s'affiche.
Créer une catégorie dans une catégorie
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire dans lequel vous souhaitez créer une catégorie.
Sélectionnez la catégorie parente dans laquelle vous souhaitez créer une autre catégorie, puis cliquez sur Créer une catégorie. Vous pouvez imbriquer jusqu'à trois niveaux de catégorie.
Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.
Cliquez sur Créer.
La page des détails de la catégorie s'affiche.
Afficher la liste des catégories disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des catégories disponibles.
Développez la catégorie pour afficher la liste des catégories imbriquées disponibles.
Mettre à jour une catégorie
Vous pouvez modifier le nom, la description, le responsable des données et la catégorie parente de la catégorie actuelle.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur la catégorie que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
et saisissez un nouveau nom.Pour modifier la description, cliquez sur Modifier la description et saisissez une nouvelle description.
Pour modifier la liste des responsables des données, cliquez sur
à côté de Steward (Responsable), fournissez la liste des adresses e-mail des responsables des données, puis cliquez sur Save (Enregistrer).Pour modifier la catégorie, cliquez sur
à côté de Catégorie.Pour modifier la catégorie parente, dans le champ Sélectionner une catégorie, saisissez le nom d'une nouvelle catégorie parente dans le glossaire actuel, puis sélectionnez-la.
Pour supprimer la catégorie actuelle, sélectionnez ---None--- dans le champ Sélectionner une catégorie.
Cliquez sur Enregistrer.
Supprimer une catégorie
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur la catégorie que vous souhaitez supprimer définitivement.
Un avertissement indique que la suppression est irréversible, et que tous les termes et catégories de la catégorie actuelle seront déplacés vers le niveau suivant.
Pour confirmer la suppression, saisissez le nom de la catégorie, puis cliquez sur Confirmer.
Créer et gérer des conditions d'utilisation
Créer un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Sélectionnez un glossaire dans lequel vous souhaitez créer un terme, puis cliquez sur Créer un terme.
Sur la page Créer un terme, saisissez un nom et une description pour le terme.
Cliquez sur Créer.
La page d'informations du terme s'affiche.
Afficher la liste des conditions disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des termes disponibles.
Accéder aux détails d'un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des termes disponibles.
Cliquez sur un terme.
La page d'informations du terme affiche le nom du terme, sa description, les termes associés, les synonymes et les entrées associées.
Mettre à jour un terme
Vous pouvez modifier le nom, la description et le responsable des données d'un terme.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur le terme que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
et saisissez un nouveau nom.Pour modifier la description, cliquez sur Modifier la description et saisissez une nouvelle description.
Pour modifier la liste des responsables des données, cliquez sur
à côté de Steward (Responsable), fournissez la liste des adresses e-mail des responsables des données, puis cliquez sur Save (Enregistrer).Pour modifier la catégorie, cliquez sur
à côté de Catégorie.Pour modifier la catégorie parente, dans le champ Sélectionner une catégorie, saisissez le nom d'une nouvelle catégorie parente dans le glossaire actuel, puis sélectionnez-la.
Pour supprimer la catégorie actuelle, dans le champ Sélectionner un champ de catégorie, sélectionnez ---None---.
Cliquez sur Enregistrer.
Supprimer un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur le terme que vous souhaitez supprimer définitivement.
Un avertissement s'affiche, indiquant que la suppression est irréversible et que toutes les relations associées au terme seront supprimées.
Pour confirmer la suppression, saisissez le nom du terme et cliquez sur Confirmer.
Gérer les synonymes et les termes associés
Vous pouvez ajouter des relations entre les termes en les marquant comme termes associés ou synonymes. La liste des termes associés et des synonymes s'affiche sur la page de détails des termes.
Ajouter des synonymes et des termes associés
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire, puis cliquez sur le terme auquel vous souhaitez associer un synonyme ou un terme associé.
Cliquez sur
pour afficher les Termes associés ou les Synonymes.Dans le champ Rechercher des termes du glossaire, saisissez le terme que vous souhaitez joindre, puis sélectionnez-le dans le résultat de recherche.
Le terme est immédiatement associé lorsque vous le sélectionnez.
Cliquez sur OK.
Supprimer des synonymes et des termes associés
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire, puis cliquez sur le terme pour lequel vous souhaitez supprimer un synonymes ou un terme associé.
Pour supprimer un terme associé, procédez comme suit:
Cliquez sur
à côté de Termes associésCliquez sur
à côté du terme que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.Cliquez sur OK.
Pour supprimer un synonyme, procédez comme suit:
Cliquez sur
à côté de Synonymes.Cliquez sur le signe
correspondant au synonyme que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.Cliquez sur OK.
Gérer les termes au niveau des colonnes
Vous pouvez associer des termes aux colonnes des entrées de catalogue qui comportent des schémas (par exemple, des tables et des ensembles de fichiers) pour fournir plus de contexte sur les données des colonnes.
Associer des termes aux colonnes
Accédez à une entrée de catalogue associée à un schéma.
Cliquez sur l'onglet Schema (Schéma).
Dans la colonne Termes métier, cliquez sur
dans le champ auquel vous souhaitez associer des conditions.Dans le champ Recherche de termes, saisissez le nom du terme et sélectionnez-le dans le résultat de recherche. Vous pouvez sélectionner plusieurs termes.
Cliquez sur Joindre des termes.
Afficher le détail des conditions associées aux colonnes
Accédez à une entrée de catalogue associée à un schéma.
Cliquez sur l'onglet Schema (Schéma).
Dans la colonne Conditions commerciales, cliquez sur un terme pour afficher sa description. Vous pouvez également supprimer le terme ou accéder à sa page d'informations à l'aide des options de cette fenêtre.
Supprimer les termes associés aux colonnes
Accédez à une entrée de catalogue associée à un schéma.
Cliquez sur l'onglet Schema (Schéma).
Dans la colonne Conditions commerciales, cliquez sur
pour le terme que vous souhaitez supprimer.Vous pouvez également supprimer le terme associé en cliquant sur le terme, puis sur Supprimer le terme métier > Confirmer.
Trouver des glossaires et des termes
Pour parcourir le contenu de votre glossaire d'entreprise, utilisez le glossaire et l'arborescence de termes de la page Glossaires de Dataplex.
Vous pouvez utiliser la barre de filtre de la page Glossaires Dataplex pour localiser les catégories par nom à afficher ou par termes en fonction d'un critère. Le filtre renvoie les éléments dont les attributs correspondent à la requête du filtre. Vous pouvez également utiliser les qualificatifs suivants:
parent:VALUE
Met en surbrillance les termes dont le nom ou la description du glossaire parent correspond à
VALUE
.Par exemple,
parent:Finance
met en évidence les termes associés au nom ou à la description du glossaire parent contenant l'expressionFinance
.contact:VALUE
Met en évidence les termes pour lesquels le responsable des données est
VALUE
.Par exemple,
contact:johndoe@company.org
met en évidence les entrées associées aux termes avec la correspondancejohndoe@company.org
du responsable des données.synonym:VALUE
Met en surbrillance les termes ayant au moins un synonyme de nom ou de description correspondant à
VALUE
.Par exemple,
synonym:interest
met en évidence les termes associés à des termes dont le nom ou la description contient l'expressioninterest
.related_to:VALUE
Met en surbrillance les termes ayant au moins un terme associé dont le nom ou la description correspond à
VALUE
.Par exemple,
related_to:discounting
met en évidence les termes associés à des termes dont le nom ou la description contient l'expressiondiscounting
.
Rechercher des entrées de données à l'aide de termes
Vous pouvez exploiter le contenu du glossaire d'entreprise Dataplex lorsque vous recherchez des entrées sur la page Rechercher dans Dataplex.
Les scénarios de recherche suivants sont acceptés:
Recherche simple: la requête de recherche est spécifiée sous forme de texte libre qui capture le nom ou la description du terme. Les résultats de recherche incluent les entrées associées à un terme dont le nom ou la description correspond à la requête de recherche. Ces résultats s'affichent à côté des résultats extraits des autres méthodes de correspondance sans rapport avec le contenu du glossaire d'entreprise.
Rechercher à l'aide de qualificatifs: la requête de recherche est spécifiée en tant que
term:VALUE
. Le résultat de recherche inclut les entrées associées à un terme dont une sous-chaîne de nom, de description ou de responsable des données correspond àVALUE
.
Étapes suivantes
- Créez le contenu d'un glossaire d'entreprise.
- Découvrez des entrées de données à l'aide des termes du glossaire.