Guía de inicio rápido: Crea un lake

En esta página, se muestra cómo comenzar a usar Dataplex en la consola de Google Cloud. Para ello, te guía cómo crear un lake, agregar una zona y adjuntar un recurso.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. Habilita las API de Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery y Cloud Storage .

    Habilita las API

  5. Asegúrate de tener los siguientes roles en el proyecto: roles/dataplex.admin, roles/dataplex.editor

    Verifica los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. En la columna Principal, busca la fila que tiene tu dirección de correo electrónico.

      Si tu dirección de correo electrónico no está en esa columna, no tienes ningún rol.

    4. En la columna Función de la fila con la dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.

    Otorga los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu dirección de correo electrónico.
    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
  6. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  7. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  8. Habilita las API de Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery y Cloud Storage .

    Habilita las API

  9. Asegúrate de tener los siguientes roles en el proyecto: roles/dataplex.admin, roles/dataplex.editor

    Verifica los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. En la columna Principal, busca la fila que tiene tu dirección de correo electrónico.

      Si tu dirección de correo electrónico no está en esa columna, no tienes ningún rol.

    4. En la columna Función de la fila con la dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.

    Otorga los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu dirección de correo electrónico.
    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
  10. Crea un bucket de Cloud Storage:
    1. En la consola de Google Cloud, ve a la página Buckets de Cloud Storage.

      Ir a la página Buckets

    2. Haga clic en Crear bucket.
    3. En la página Crear un bucket, ingresa la información de tu bucket. Para ir al paso siguiente, haz clic en Continuar.
      • En Nombre del bucket, ingresa un nombre de bucket único. No incluyas información sensible en el nombre del bucket porque su espacio de nombres es global y públicamente visible.
      • En Elige dónde almacenar tus datos, haz lo siguiente:
        • Selecciona una opción de Tipo de ubicación.
        • Selecciona una opción de Ubicación.
      • Para Elegir una clase de almacenamiento predeterminado para tus datos, selecciona lo siguiente:Estándar.
      • En Elige cómo controlar el acceso a los objetos, selecciona una opción de Control de acceso.
      • Para la Configuración avanzada (opcional), especifica un método de encriptación, una política de retención o etiquetas de bucket.
    4. Haga clic en Crear.

Crea un lake

En los siguientes pasos, se muestra cómo crear un lake con la consola de Google Cloud.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. Navega hasta la vista Administrar.

  3. Haz clic en Crear.

  4. Ingresa un Nombre visible.

  5. El ID del lake se genera automáticamente.

  6. Especifica la región en la que se creará el lake.

    En el caso de los lakes creados en una región determinada (por ejemplo, us-central1), se pueden adjuntar los datos de una sola región (us-central1) y los de varias regiones (us multi-region), según la configuración de la zona.

  7. Haz clic en Crear.

Agrega una zona a tu lake

Después de crear tu lake, puedes agregarle zonas. Las zonas son agrupaciones lógicas de datos estructurados y no estructurados.

  1. En la vista Manage, haz clic en el nombre del lake al que deseas agregar una zona.

  2. Haz clic en Agregar zona.

  3. Ingresa un Nombre visible para tu zona.

  4. Haga clic en el menú desplegable Tipo. Elige Zona sin procesar o Zona seleccionada. Obtén más información sobre los tipos de zonas.

  5. En Ubicaciones de datos, selecciona Regional o Multirregional. La opción que elijas no se podrá cambiar más adelante. Los datos de una sola región y los multirregionales no se pueden mezclar en la misma zona.

  6. Haz clic en Crear.

Es posible que la zona tarde algunos minutos en crearse.

Adjuntar un recurso

Los datos se pueden almacenar en buckets de Cloud Storage o conjuntos de datos de BigQuery, y se pueden adjuntar como recursos a zonas de datos dentro de un lake de Dataplex.

Sigue estos pasos para adjuntar el bucket de Cloud Storage que creaste anteriormente como un recurso.

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas adjuntar un bucket de Cloud Storage.

  2. En la pestaña Zonas, haz clic en la zona en la que deseas agregar el recurso.

  3. En la pestaña Assets, haz clic en Add Assets.

  4. Haz clic en Agregar un activo.

  5. En Tipo, selecciona Bucket de almacenamiento.

  6. En Nombre visible, ingresa un nombre para el recurso.

  7. En el campo Bucket, haz clic en Explorar. Si tienes un bucket de Cloud Storage, búscalo y haz clic en Seleccionar. Si no tienes un bucket de Cloud Storage, puedes crear uno con un clic en el botón .

    1. Ingresa un nombre único para el bucket. Haz clic en Continuar.

    2. Elige un Tipo de ubicación. Haz clic en Continuar.

    3. Elige una clase de almacenamiento predeterminada para tus datos. Haz clic en Continuar.

    4. Elige un nivel de control de acceso. Haz clic en Continuar.

    5. Elige una opción de protección de datos o Ninguna. Haz clic en Continuar.

    6. Haz clic en Crear.

    7. Haga clic en Seleccionar.

  8. Haz clic en Listo.

  9. Haz clic en Continuar.

  10. En Configuración de detección, selecciona Heredar para heredar la configuración de detección del nivel de zona.

  11. Haz clic en Continuar.

  12. En Agregar recursos, haz clic en Enviar.

Espera a que finalice la creación del recurso.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que se usaron en esta página.

  1. En la consola de Google Cloud, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. Si el proyecto que deseas borrar está vinculado con una organización, expande la lista Organización en la columna Nombre.
  3. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  4. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Como alternativa, puedes borrar los recursos que se usaron en este instructivo. No se pueden borrar los lakes, a menos que se hayan borrado todos los recursos de la zona de datos que contiene. Del mismo modo, las zonas de datos no se pueden borrar, a menos que se hayan borrado todos sus recursos:

Desconecta el bucket de almacenamiento

En los siguientes pasos, se muestra cómo desvincular el recurso de Dataplex que creaste.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el nombre del lake que creaste.

  3. En la pestaña Zonas, haz clic en el nombre de la zona que creaste.

  4. En la pestaña Assets, marca la casilla a la izquierda del nombre del bucket para seleccionar el recurso que quieres desvincular.

  5. Haz clic en Borrar recurso.

  6. Haz clic en Borrar para confirmar la desconexión.

Borra la zona

En los siguientes pasos, se muestra cómo borrar la zona de Dataplex que creaste.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Manage, haz clic en el lake que creaste.

  3. En la pestaña Zonas, marca la casilla a la izquierda del nombre de la zona de datos para seleccionar la zona que deseas borrar.

  4. Haz clic en Borrar zona.

  5. Haz clic en Borrar para confirmar esta acción.

Borra el lake

En los siguientes pasos, se muestra cómo borrar el lake de Dataplex que creaste.

  1. Ve a Dataplex en la consola de Google Cloud.

    Ir a Dataplex

  2. En la vista Manage, haz clic en el lake que creaste.

  3. Haz clic en Borrar en la parte superior de la página.

  4. Para confirmar la eliminación, escribe "delete" en el cuadro de texto.

  5. Haz clic en Borrar lake para confirmar esta acción.

¿Qué sigue?

Después de crear el lake, las zonas y los recursos, puedes hacer lo siguiente: