Guía de inicio rápido: Crea un lake

En esta página, se muestra cómo comenzar a usar Dataplex en la consola de Google Cloud. Para ello, se explica cómo crear un lake, agregar una zona y conectar un recurso.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

    10. Enable the Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, and Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Ir a IAM
      2. Selecciona el proyecto.
      3. Haz clic en Grant access.
      4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

      5. En la lista Seleccionar un rol, elige un rol.
      6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
      7. Haz clic en Guardar.
      8. Crea un bucket de Cloud Storage:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Crea un lake

En los siguientes pasos, se muestra cómo crear un lago con la consola de Google Cloud.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. Navega a la vista Administrar.

  3. Haz clic en Crear.

  4. Ingresa un Nombre visible.

  5. El ID del lake se genera automáticamente.

  6. Especifica la región en la que se creará el lake.

    En el caso de los lakes creados en una región determinada (por ejemplo, us-central1), se pueden adjuntar datos de una sola región (us-central1) y datos multirregionales (us multi-region) según la configuración de la zona.

  7. Haz clic en Crear.

Agrega una zona a tu lake

Después de crear tu lago, puedes agregarle zonas. Las zonas son agrupaciones lógicas de datos estructurados y no estructurados.

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas agregar una zona.

  2. Haz clic en Agregar zona.

  3. Ingresa un Nombre visible para tu zona.

  4. Haz clic en el menú desplegable Tipo. Elige Zona sin procesar o Zona seleccionada. Aprendizaje Obtén más información sobre los tipos de zonas.

  5. En Data locations, selecciona Regional o Multi-regional. Lo que elijas no se podrá cambiar más adelante. Datos de una sola región y multirregionales no puede combinarse en la misma zona.

  6. Haz clic en Crear.

Es posible que la zona tarde unos minutos en crearse.

Adjuntar un recurso

Los datos se pueden almacenar en buckets de Cloud Storage o en BigQuery conjuntos de datos y se pueden adjuntar como recursos a zonas de datos dentro de Lake de Dataplex.

Sigue estos pasos para conectar el bucket de Cloud Storage que creaste antes como un activo.

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas vincular un bucket de Cloud Storage.

  2. En la pestaña Zonas, haz clic en la zona a la que deseas agregar el recurso.

  3. En la pestaña Recursos, haz clic en Agregar recursos.

  4. Haz clic en Agregar elemento.

  5. En Tipo, selecciona Bucket de almacenamiento.

  6. En Nombre visible, ingresa un nombre para el recurso.

  7. En el campo Bucket, haz clic en Explorar. Si tienes un Cloud Storage bucket, búscalo y haz clic en Seleccionar. Si no tienes un Cloud Storage bucket, puedes crear uno haciendo clic en el botón .

    1. Ingresa un nombre único para el bucket. Haga clic en Continuar.

    2. Elige un Tipo de ubicación. Haga clic en Continuar.

    3. Elige una clase de almacenamiento predeterminada para tus datos. Haga clic en Continuar.

    4. Elige un nivel de control de acceso. Haga clic en Continuar.

    5. Elige una opción de protección de datos o Ninguna. Haga clic en Continuar.

    6. Haz clic en Crear.

    7. Haga clic en Seleccionar.

  8. Haz clic en Listo.

  9. Haga clic en Continuar.

  10. En Configuración de descubrimiento, selecciona Heredar para heredar la configuración Detección en la configuración a nivel de la zona.

  11. Haga clic en Continuar.

  12. En Agregar recursos, haz clic en Enviar.

Espera a que termine de crearse el recurso.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

  1. En la consola de Google Cloud, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. Si el proyecto que deseas borrar está vinculado con una organización, expande la lista Organización en la columna Nombre.
  3. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  4. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Como alternativa, puedes borrar los recursos que se usan en este instructivo. Los lakes no pueden a menos que se borren todos sus recursos de la zona de datos. Del mismo modo, las zonas de datos no se pueden borrar, a menos que se hayan borrado todos los recursos de activos que se encuentran debajo de ellas:

Desconecta el bucket de almacenamiento

En los siguientes pasos, se muestra cómo desconectar el recurso de Dataplex crear.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el nombre del lake que creaste.

  3. En la pestaña Zonas, haz clic en el nombre de la zona que creaste.

  4. En la pestaña Recursos, selecciona el recurso que deseas desvincular marcando la casilla a la izquierda del nombre del bucket.

  5. Haz clic en Borrar activo.

  6. Haz clic en Borrar para confirmar la desconexión.

Borra la zona

En los siguientes pasos, se muestra cómo borrar la zona de Dataplex que creaste.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. En la pestaña Zonas, marca la casilla a la izquierda del nombre de la zona de datos para seleccionarla y borrarla.

  4. Haz clic en Borrar zona.

  5. Haz clic en Borrar para confirmar esta acción.

Cómo borrar el lake

En los siguientes pasos, se muestra cómo borrar el lake de Dataplex crear.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. Haz clic en Borrar en la parte superior de la página.

  4. Escribe “delete” para confirmar la eliminación en el cuadro de texto.

  5. Haz clic en Borrar lake para confirmar esta acción.

¿Qué sigue?

Después de crear tu lake, tus zonas y tus recursos, puedes hacer lo siguiente: