Ce document explique comment créer et utiliser du contenu de glossaire d'entreprise dans le glossaire d'entreprise Dataplex.
Le glossaire d'entreprise fournit un emplacement unique pour maintenir et gérer les activités liées à la terminologie et les définitions dans l'ensemble de l'organisation. Il vous permet d'associer les termes aux colonnes des entrées de données cataloguées.
Vous pouvez utiliser le glossaire d'entreprise Dataplex pour effectuer les opérations suivantes :
- Créer et gérer des glossaires, des catégories et des termes commerciaux
- Utilisez des catégories pour représenter des structures hiérarchiques de catégories et de termes.
- Établissez des relations entre les termes en tant que synonymes ou termes associés.
- Associez des termes aux colonnes de saisie de données.
- Parcourez et filtrez les termes du glossaire d'entreprise.
- Permet d'afficher les termes et entrées de données associés à un terme donné.
- Permet de rechercher des entrées de données taguées par un terme particulier.
- Affiche les termes associés à une entrée de données donnée.
Terminologie
La terminologie suivante est utilisée dans ce document :
Glossaire d'entreprise
Le glossaire d’entreprise est un référentiel qui fournit les vocabulaires appropriés, et régit les conditions commerciales d'une entreprise, ainsi que les définitions des termes associés et les relations entre ces termes. Il fournit un emplacement unique pour gérer et gérer les termes métier et leurs définitions. Un glossaire d’entreprise contient la propriété suivante affichée dans la console:
- Présentation: description libre en texte enrichi de l'objectif du glossaire d'entreprise et des contenus.
Catégorie
Une catégorie est définie dans un glossaire commercial. Il vous permet d'organiser et structurer divers catégories et termes. Vous pouvez imbriquer des catégories jusqu'à trois niveaux. Voici les propriétés d'une catégorie:
- Catégorie: relation utilisée pour établir le conteneur des catégorie actuelle, le cas échéant.
- Description: définition de la catégorie sous forme de texte enrichi au format libre.
- Administrateur des données : indique la personne chargée de la gestion de la catégorie. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations catégorie.
Terme
Un terme est défini dans un glossaire commercial, soit directement dans le glossaire, soit dans n'importe quelle catégorie trouvée dans le glossaire. Il décrit un concept utilisé dans un branche particulière de l'entreprise au sein d'une entreprise. Les propriétés suivantes d'un terme sont affichées dans la console :
- Catégorie: relation utilisée pour établir le conteneur des la période en cours, le cas échéant.
- Description : définition professionnelle du terme au format texte enrichi, au format libre.
- Responsable des données: spécifie la personne responsable de la maintenance du terme. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations de mots clés.
Vous pouvez associer des termes aux colonnes de saisie de données pour indiquer que les colonnes sont décrites par les termes respectifs.
Synonyme
Un synonyme est une relation utilisée pour indiquer une similarité ou une équivalence sémantique.
entre deux termes différents. Il est utilisé lorsque deux termes
similaires sont définis par
différentes équipes dans
différents glossaires. Par exemple, earnings
et income
.
Terme associé
Un terme associé est une relation utilisée pour indiquer que deux termes sont sémantiquement liés, mais différents. Par exemple, profit
et income
.
Avant de commencer
Limites
- L'importation groupée de termes dans un glossaire d'entreprise n'est pas disponible.
- La fonctionnalité de glossaire professionnel n'est disponible que dans la console Google Cloud.
- Lorsque vous recherchez des entrées de données sur la page Recherche de Dataplex, les résultats de recherche incluent les entrées de données pour lesquelles l'un des termes associés correspond au terme utilisé pour la recherche. Toutefois, la référence au terme correspondant n'est pas affiché dans les résultats de recherche.
- Régions BigQuery Omni ne sont pas acceptés. Vous ne pouvez pas créer de glossaire d'entreprise ni joindre de termes aux entrées de données dans ces régions.
Rôles et autorisations requis
Pour obtenir les autorisations dont vous avez besoin pour créer et gérer des glossaires, demandez à votre administrateur de vous accorder le les rôles IAM suivants sur le projet:
-
Accès complet aux glossaires, catégories et termes:
Propriétaire du glossaire DataCatalog (
roles/datacatalog.glossaryOwner
) -
Lisez des glossaires, des catégories et des termes, créez des pièces jointes entre des termes, et créez des pièces jointes entre des termes et des entrées de données:
Utilisateur de glossaire Data Catalog (
roles/datacatalog.glossaryUser
) -
Accès en lecture seule aux glossaires, aux catégories et aux termes:
Lecteur d'entrées Data Catalog (
roles/datacatalog.entryViewer
)
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Ces rôles prédéfinis contiennent les autorisations requises pour créer et gérer des glossaires. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour créer et gérer des glossaires :
-
Accès complet aux glossaires, aux catégories et aux termes :
-
datacatalog.entries.*
-
datacatalog.relationships.*
-
-
Lisez des glossaires, des catégories et des termes, créez des pièces jointes entre des termes, et créez des pièces jointes entre des termes et des entrées de données:
-
datacatalog.entries.get
-
datacatalog.entries.list
-
datacatalog.relationships.*
-
-
Accès en lecture seule aux glossaires, aux catégories et aux termes :
-
datacatalog.entries.get
-
datacatalog.entries.list
-
datacatalog.entryGroups.get
-
datacatalog.relationships.list
-
resourcemanager.projects.list
-
resourcemanager.projects.get
-
-
Créer ou supprimer des glossaires :
datacatalog.entryGroups.create
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Pour en savoir plus sur les rôles et les autorisations de Data Catalog, consultez la section Rôles prédéfinis pour Data Catalog.
Créer et gérer des glossaires d'entreprise
Créer un glossaire d'entreprise
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur Créer un glossaire d'entreprise.
Sur la page Créer un glossaire d'entreprise, indiquez un nom, un lieu et du glossaire d'entreprise.
Les champs "Nom" et "Emplacement" sont obligatoires. Vous ne pouvez pas modifier l'emplacement après avoir créé le glossaire.
Cliquez sur Créer.
Le glossaire est créé sous le projet actuel et la page de glossaire est affiché.
Afficher la liste des glossaires disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Le volet Mes glossaires affiche tous les glossaires de l'organisation pour lesquels vous disposez de l'autorisation
view
. Les glossaires sont affichés avec leur et la date et l'heure de la dernière modification.
Modifier un glossaire
Vous pouvez modifier le nom et la description d'un glossaire.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur le glossaire que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
, saisissez un nouveau nom, puis cliquez sur Enregistrer.Pour modifier la description, cliquez sur Modifier la description, saisissez une nouvelle description, puis cliquez sur Enregistrer.
Supprimer un glossaire
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Cliquez sur le glossaire que vous souhaitez supprimer.
Cliquez sur Supprimer.
Pour confirmer votre choix, saisissez le nom du glossaire, puis cliquez sur Confirmer.
Créer et gérer des catégories
Créer une catégorie dans un glossaire
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Sélectionnez un glossaire dans lequel vous souhaitez créer une catégorie, puis cliquez sur Créer une catégorie.
Sur la page Créer une catégorie, saisissez le nom et la description de la catégorie.
Cliquez sur Créer.
La page des détails de la catégorie s'ouvre.
Créer une catégorie sous une catégorie
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire dans lequel vous souhaitez créer une catégorie.
Sélectionnez la catégorie parente dans laquelle vous souhaitez créer une autre catégorie, puis cliquez sur Créer une catégorie. Vous pouvez imbriquer une catégorie jusqu'à trois niveaux.
Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.
Cliquez sur Créer.
La page des détails de la catégorie s'ouvre.
Afficher la liste des catégories disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des catégories disponibles.
Développez la catégorie pour afficher la liste des catégories imbriquées disponibles.
Mettre à jour une catégorie
Vous pouvez modifier le nom, la description, le responsable des données et la catégorie parente de la catégorie actuelle.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur la catégorie que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
et saisissez un nouveau nom.Pour modifier la description, cliquez sur Modifier la description, puis saisissez une nouvelle description.
Pour modifier la liste des responsables des données, cliquez sur
À côté de Steward, fournissez la liste des adresses e-mail du responsable des données, puis cliquez sur Enregistrer.Pour modifier la catégorie, cliquez sur
à côté à Category.Pour modifier la catégorie parente, saisissez le nom d'une nouvelle catégorie parente dans le champ Sélectionner une catégorie, puis sélectionnez-la.
Pour supprimer la catégorie actuelle, dans le champ Sélectionnez une catégorie : sélectionnez ---None---.
Cliquez sur Enregistrer.
Supprimer une catégorie
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur la catégorie que vous souhaitez supprimer définitivement.
Un avertissement s'affiche, indiquant que la suppression est irréversible et que tous les termes et catégories sous la catégorie actuelle seront déplacés au niveau supérieur.
Pour confirmer la suppression, saisissez le nom de la catégorie, puis cliquez sur Confirmer.
Créer et gérer des conditions
Créer un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Sélectionnez le glossaire dans lequel vous souhaitez créer un terme, puis cliquez sur Créer un terme :
Sur la page Créer un terme, saisissez un nom et une description pour le terme.
Cliquez sur Créer.
La page d'informations sur le terme s'affiche.
Afficher la liste des termes disponibles
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des termes disponibles.
Accéder aux détails d'un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez un glossaire pour afficher la liste des termes disponibles.
Cliquez sur un terme.
La page d'informations sur le terme affiche le nom, la description, les termes associés, les synonymes et les entrées associées.
Mettre à jour un terme
Vous pouvez modifier le nom, la description et le responsable des données d'un terme.
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur le terme que vous souhaitez modifier.
Pour modifier le nom, cliquez sur
, puis saisissez un nouveau nom.Pour modifier la description, cliquez sur Modifier la description, puis saisissez une nouvelle description.
Pour modifier la liste des responsables des données, cliquez sur
À côté de Steward, fournissez la liste des adresses e-mail du responsable des données, puis cliquez sur Enregistrer.Pour modifier la catégorie, cliquez sur
à côté à Category.Pour modifier la catégorie parente, saisissez le nom d'une nouvelle catégorie parente du glossaire actuel et sélectionner
Pour supprimer la catégorie actuelle, dans le champ Sélectionnez une catégorie : sélectionnez ---None---.
Cliquez sur Enregistrer.
Supprimer un terme
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire et cliquez sur le terme que vous souhaitez supprimer définitivement.
Un avertissement s'affiche, indiquant que la suppression est irréversible et que toutes les relations associées au terme seront supprimées.
Pour confirmer la suppression, saisissez le nom du terme, puis cliquez sur Confirmer.
Gérer les synonymes et les termes associés
Vous pouvez ajouter des relations entre des termes en les marquant comme termes associés ou synonymes. Les listes de termes associés et de synonymes s'affichent sur la page d'informations sur le terme.
Ajouter des synonymes et des termes associés
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire, puis cliquez sur le terme auquel vous souhaitez associer un synonyme ou un terme associé.
Cliquez sur
pour accéder aux Conditions d'utilisation associées. ou Synonymes.Dans le champ Rechercher des termes du glossaire, saisissez le terme à rechercher joindre et sélectionnez le terme dans le résultat de la recherche.
Le terme est associé immédiatement lorsque vous le sélectionnez.
Cliquez sur OK.
Supprimer des synonymes et des termes associés
Dans la console Google Cloud, accédez à la page Glossaires Dataplex.
Développez le glossaire, puis cliquez sur le terme pour lequel vous souhaitez supprimer un synonyme ou un terme associé.
Pour supprimer un terme associé, procédez comme suit :
Cliquez sur
à côté de Termes associés.Cliquez sur
pour le terme associé que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.Cliquez sur OK.
Pour supprimer un synonyme, procédez comme suit:
Cliquez sur
à côté de Synonymes.Cliquez sur
pour le synonyme que vous souhaitez supprimer. La pièce jointe est immédiatement supprimée.Cliquez sur OK.
Gérer les termes au niveau des colonnes
Vous pouvez associer des termes aux colonnes des entrées du catalogue de données qui comportent des schémas (par exemple, des tables et des ensembles de fichiers) pour fournir plus de contexte sur les données de colonne.
Associer des termes à des colonnes
Accédez à une entrée Data Catalog contenant un schéma.
Cliquez sur l'onglet Schéma.
Dans la colonne Conditions commerciales, cliquez sur
pour le champ auquel vous souhaitez associer des conditions.Dans le champ Recherche de terme, saisissez le nom du terme, puis sélectionnez-le dans le dans les résultats de recherche. Vous pouvez sélectionner plusieurs termes.
Cliquez sur Joindre les conditions.
Afficher les détails des termes associés aux colonnes
Accédez à une entrée Data Catalog dotée d'un schéma.
Cliquez sur l'onglet Schéma.
Dans la colonne Termes commerciaux, cliquez sur le terme pour en afficher la description. Vous pouvez également supprimer le terme ou accéder à la page d'informations sur le terme à l'aide des options de cette fenêtre.
Supprimer les termes associés aux colonnes
Accédez à une entrée Data Catalog dotée d'un schéma.
Cliquez sur l'onglet Schéma.
Dans la colonne Conditions d'utilisation, cliquez sur
pour le terme que vous souhaitez supprimer.Vous pouvez également supprimer le terme associé en cliquant dessus, puis sur Supprimer le terme commercial > Confirmer.
Rechercher des glossaires et des termes
Pour parcourir le contenu du glossaire de votre entreprise, utilisez le glossaire et les termes dans les glossaires Dataplex .
Vous pouvez utiliser la barre de filtre de la page Glossaires de Dataplex pour rechercher des catégories par nom à afficher ou par termes en fonction d'un critère. Le filtre renvoie les éléments dont les attributs correspondent à la requête de filtre. Vous pouvez également utiliser les qualificatifs suivants:
parent:VALUE
Met en surbrillance les termes dont le nom ou la description du glossaire parent correspond
VALUE
Par exemple,
parent:Finance
met en évidence les termes liés au parent nom ou description du glossaire contenant l'expressionFinance
.contact:VALUE
Met en évidence les termes pour lesquels le responsable des données est
VALUE
.Par exemple,
contact:johndoe@company.org
met en surbrillance les entrées associées aux termes avec un responsable des données correspondant àjohndoe@company.org
.synonym:VALUE
Met en surbrillance les termes qui ont au moins un synonyme avec le nom ou description correspondant à
VALUE
.Par exemple,
synonym:interest
met en évidence les termes ayant des termes dont le nom ou la description contient l'expressioninterest
.related_to:VALUE
Met en surbrillance les termes qui ont au moins un terme associé avec le nom ou description correspondant à
VALUE
.Par exemple,
related_to:discounting
met en évidence les termes ayant des termes dont le nom ou la description contient l'expressiondiscounting
.
Rechercher des entrées de données à l'aide de termes
Vous pouvez utiliser le contenu du glossaire d'entreprise Dataplex lorsque vous recherchez des entrées Page de recherche Dataplex.
Les scénarios de recherche suivants sont acceptés:
Recherche simple : la requête de recherche est spécifiée sous forme de texte libre qui capture le nom ou la description du terme. Les résultats de recherche incluent les entrées associées à un terme dont le nom ou la description correspondent à la requête de recherche. Ces résultats s'affichent à côté des résultats récupérés par les autres méthodes de mise en correspondance sans rapport avec le contenu du glossaire d'entreprise.
Effectuer une recherche à l'aide de qualificatifs: la requête de recherche est spécifiée en tant que
term:VALUE
. Le résultat de la recherche comprend des entrées liées à un terme où une sous-chaîne de le nom, la description ou le responsable des données correspond àVALUE
.
Étape suivante
- Créez du contenu pour le glossaire d'entreprise.
- Découvrez les entrées de données à l'aide des termes de glossaire joints.