Guía de inicio rápido: Crea un lake

En este documento, se muestra cómo comenzar a usar Dataplex en la consola de Google Cloud. Para ello, se explica cómo crear un lake, agregar una zona y adjuntar un recurso.

Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Make sure that billing is enabled for your Google Cloud project.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: `roles/dataplex.admin`, `roles/dataplex.editor`

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Ir a IAM
      2. Selecciona el proyecto.
      3. Haz clic en Grant access.
      4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

      5. En la lista Seleccionar un rol, elige un rol.
      6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
      7. Haz clic en Guardar.
      8. Crea un bucket de Cloud Storage:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Crea un lake

Un lake es una construcción lógica que representa un dominio de datos o una unidad de negocios. Por ejemplo, si necesitas organizar los datos en función del uso de los grupos, crearías un lake para cada departamento (por ejemplo, venta minorista, ventas y finanzas).

En los siguientes pasos, se muestra cómo crear un lago con la consola de Google Cloud.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. Navega a la vista Administrar.

  3. Haz clic en Crear.

  4. Ingresa un Nombre visible.

  5. El ID del lago se genera automáticamente.

  6. Especifica la región en la que se creará el lake.

    En el caso de los lakes creados en una región determinada (por ejemplo, us-central1), se pueden adjuntar datos de una sola región (us-central1) y datos multirregionales (us multi-region) según la configuración de la zona.

  7. Haz clic en Crear.

Agrega una zona a tu lake

Después de crear tu lago, puedes agregarle zonas. Las zonas son agrupaciones lógicas dentro de un lake que son útiles para categorizar datos estructurados y no estructurados.

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas agregar una zona.

  2. Haz clic en Agregar zona.

  3. Ingresa un Nombre visible para tu zona.

  4. Haz clic en el menú desplegable Tipo. Elige Zona sin procesar o Zona seleccionada. Obtén más información sobre los tipos de zonas.

  5. En Data locations, selecciona Regional o Multi-regional. No podrás cambiar la opción que elijas más adelante. Los datos de una sola región y los multirregionales no se pueden combinar en la misma zona.

  6. Haz clic en Crear.

La zona puede tardar unos minutos en crearse.

Cómo adjuntar un recurso

Los datos se pueden almacenar en buckets de Cloud Storage o conjuntos de datos de BigQuery, y se pueden conectar como recursos a zonas de datos dentro de un lake de Dataplex.

Para conectar tu bucket de Cloud Storage como un recurso, sigue estos pasos:

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas vincular un bucket de Cloud Storage.

  2. En la pestaña Zonas, haz clic en la zona a la que deseas agregar el recurso.

  3. En la pestaña Recursos, haz clic en Agregar recursos.

  4. Haz clic en Agregar elemento.

  5. En Tipo, selecciona Bucket de almacenamiento.

  6. En Nombre visible, ingresa un nombre para el activo.

  7. En el campo Bucket, haz clic en Explorar. Si tienes un bucket de Cloud Storage, búscalo y haz clic en Seleccionar. Si no tienes un bucket de Cloud Storage, puedes crear uno haciendo clic en el botón .

    1. Ingresa un nombre único para el bucket. Haz clic en Continuar.

    2. Elige un Tipo de ubicación. Haga clic en Continuar.

    3. Elige una clase de almacenamiento predeterminada para tus datos. Haz clic en Continuar.

    4. Elige un nivel de control de acceso. Haz clic en Continuar.

    5. Elige una opción de protección de datos o Ninguna. Haga clic en Continuar.

    6. Haz clic en Crear.

    7. Haga clic en Seleccionar.

  8. Haz clic en Listo.

  9. Haz clic en Continuar.

  10. En Configuración de detección, selecciona Heredar para heredar la configuración de detección del nivel de la zona.

  11. Haz clic en Continuar.

  12. En Agregar recursos, haz clic en Enviar.

Espera a que finalice la creación del recurso.

Para usar tu lago, consulta la sección Próximos pasos. De lo contrario, borra los recursos que creaste siguiendo los pasos de la sección Limpieza.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

Como alternativa, puedes borrar los recursos que se usan en este instructivo. Un lago no se borrará hasta que borres todos los recursos de su zona de datos. Del mismo modo, una zona de datos no se borra, a menos que borres todos sus recursos de activos.

Desconecta el bucket de almacenamiento

Para desvincular el recurso de Dataplex que creaste, sigue estos pasos:

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el nombre del lake que creaste.

  3. En la pestaña Zonas, haz clic en el nombre de la zona que creaste.

  4. En la pestaña Recursos, selecciona el recurso que deseas desvincular marcando la casilla a la izquierda del nombre del bucket.

  5. Haz clic en Borrar recurso.

  6. Haz clic en Borrar para confirmar la desvinculación.

Borra la zona

Para borrar la zona de Dataplex que creaste, sigue estos pasos:

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. En la pestaña Zonas, marca la casilla que está a la izquierda del nombre de la zona de datos para seleccionarla.

  4. Haz clic en Borrar zona.

  5. Haz clic en Borrar para confirmar esta acción.

Cómo borrar el lake

En los siguientes pasos, se muestra cómo borrar el lago de Dataplex que creaste.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. Haz clic en Borrar en la parte superior de la página.

  4. Para confirmar la eliminación, escribe "borrar" en el campo.

  5. Haz clic en Borrar lago para confirmar la eliminación.

¿Qué sigue?