Agrega metadatos a una tabla de BigQuery

Aprende sobre la administración de metadatos en Dataplex Universal Catalog.

En esta guía de inicio rápido, se muestra cómo agregar metadatos a una tabla de BigQuery. En esta guía de inicio rápido, harás lo siguiente:

  1. Crea un conjunto de datos y una tabla de BigQuery basados en un conjunto de datos públicos.

  2. Crea una plantilla que defina un conjunto de campos de metadatos relacionados.

    La plantilla se denomina tipo de aspecto. El conjunto de campos de metadatos relacionados, que describen los metadatos técnicos y empresariales de tus recursos de datos, se denomina aspecto.

  3. Agrega metadatos a la tabla.

    En Dataplex Universal Catalog, cada recurso de datos se representa como una entrada. Para adjuntar metadatos a un recurso de datos, agrega aspectos a la entrada.

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Otorgar acceso.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige uno.
    6. Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
    7. Haz clic en Guardar.
  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Verify that billing is enabled for your Google Cloud project.

  8. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  9. Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Otorgar acceso.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige uno.
    6. Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
    7. Haz clic en Guardar.
  10. Crea un conjunto de datos y una tabla

    1. En la consola de Google Cloud , ve a la página BigQuery Studio.

      Ir a BigQuery Studio

    2. Crea un conjunto de datos:

      1. En el panel Explorador, busca tu proyecto. Haz clic en Ver acciones y, luego, en Crear conjunto de datos.

      2. En el campo ID de conjunto de datos, ingresa catalog_demo_dataset.

        Mantén los valores predeterminados en los otros campos.

      3. Haz clic en Crear conjunto de datos.

    3. Copia una tabla pública en tu conjunto de datos:

      1. En el panel Explorador, busca la tabla llamada bigquery-public-data.new_york_citibike.citibike_stations. Es posible que debas configurar el alcance de la búsqueda para incluir el proyecto bigquery-public-data.

        Esta tabla forma parte del conjunto de datos de viajes de Citi Bike de la ciudad de Nueva York, un conjunto de datos públicos que contiene información sobre un programa de bicicletas compartidas.

      2. Selecciona la tabla citibike_stations.

      3. Haz clic en Copiar. Ingresa la siguiente información:

        • Proyecto: Selecciona tu proyecto.
        • Conjunto de datos: Selecciona catalog_demo_dataset.
        • Tabla: Ingresa bike_stations.
      4. Haz clic en Copiar.

    4. En el panel Explorador, busca el conjunto de datos catalog_demo_dataset y confirma que la tabla bike_stations aparezca en él.

    Define una plantilla de metadatos: crea un tipo de aspecto

    1. En la consola de Google Cloud , ve a la página Catálogo de Dataplex Universal Catalog.

      Ir al catálogo

    2. Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, luego, en la pestaña Personalizado.

    3. Haz clic en Crear tipo de aspecto.

    4. En el campo ID de tipo de aspecto, ingresa data-governance-demo.

    5. En Ubicación selecciona global.

    6. En la sección Plantilla, haz clic en Agregar campo. Usa la información de la siguiente tabla para agregar varios campos al tipo de aspecto:

      Nombre Tipo Es obligatorio Descripción
      source-of-data-asset Texto No -
      retention-date Fecha y hora No -
      data-classification

      Enum

      Agrega los valores Public, Sensitive y Confidential.

      -
      has-pii Booleano Whether the data asset has personally identifiable information
    7. Haz clic en Guardar.

    Agrega metadatos a la tabla: agrega un aspecto a la entrada

    1. En la consola de Google Cloud , ve a la página Búsqueda de Dataplex Universal Catalog.

      Ir a Búsqueda

    2. En el cuadro de búsqueda, ingresa catalog_demo_dataset.

    3. Selecciona la tabla bike_stations.

    4. Agrega un aspecto personalizado a la entrada:

      1. En la sección Aspectos y etiquetas, junto a Aspectos y etiquetas opcionales, haz clic en Agregar.

      2. Selecciona el tipo de aspecto data-governance-demo.

        Esto crea un aspecto que usa tu tipo de aspecto como plantilla.

      3. Ingresa los siguientes valores:

        • Fuente del recurso de datos: Copied from NYC Citi Bike Trips public dataset
        • Fecha de retención: Ingresa una fecha.
        • Clasificación de datos: Public
        • Tiene información de identificación personal (IIP): False
      4. Haz clic en Guardar.

    5. Para ver los valores de metadatos que agregaste, en la sección Etiquetas y aspectos, selecciona el aspecto data-governance-demo.

    Limpia

    Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

    Borra el proyecto

    La manera más fácil de detener la facturación es borrar el proyecto que creaste para esta guía de inicio rápido.

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Borra los recursos individuales

    Si deseas volver a usar tu proyecto, borra los recursos que creaste.

    1. Borra el conjunto de datos:

      1. En la consola de Google Cloud , ve a la página BigQuery Studio.

        Ir a BigQuery Studio

      2. En el panel Explorador, busca el conjunto de datos catalog_demo_dataset.

      3. Haz clic en Ver acciones y, luego, en Borrar. Confirma cuando se te solicite.

    2. Borra el tipo de aspecto:

      1. En la consola de Google Cloud , ve a la página Catálogo de Dataplex Universal Catalog.

        Ir al catálogo

      2. Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, luego, en la pestaña Personalizado.

      3. Haz clic en el tipo de aspecto data-governance-demo.

      4. Haz clic en Borrar. Confirma cuando se te solicite.

    ¿Qué sigue?