Guía de inicio rápido: Crea un lake

En esta página, se muestra cómo comenzar a usar Dataplex en Google Cloud Console, se explica cómo crear un lake, agregar una zona y adjuntar un recurso.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. Habilita las API de Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery y Cloud Storage .

    Habilita las API

  5. Asegúrate de tener los siguientes roles en el proyecto: roles/dataplex.admin, roles/dataplex.editor

    Verifica los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. En la columna Principal, busca la fila que tiene tu dirección de correo electrónico.

      Si tu dirección de correo electrónico no está en esa columna, no tienes ningún rol.

    4. En la columna Función de la fila con la dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.

    Otorga los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu dirección de correo electrónico.
    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
  6. En la página del selector de proyectos de la consola de Google Cloud, selecciona o crea un proyecto de Google Cloud.

    Ir al selector de proyectos

  7. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  8. Habilita las API de Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery y Cloud Storage .

    Habilita las API

  9. Asegúrate de tener los siguientes roles en el proyecto: roles/dataplex.admin, roles/dataplex.editor

    Verifica los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. En la columna Principal, busca la fila que tiene tu dirección de correo electrónico.

      Si tu dirección de correo electrónico no está en esa columna, no tienes ningún rol.

    4. En la columna Función de la fila con la dirección de correo electrónico, verifica si la lista de roles incluye los roles necesarios.

    Otorga los roles

    1. En la consola de Google Cloud, ve a la página IAM.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Grant access.
    4. En el campo Principales nuevas, ingresa tu dirección de correo electrónico.
    5. En la lista Seleccionar un rol, elige un rol.
    6. Para otorgar funciones adicionales, haz clic en Agregar otro rol y agrega cada rol adicional.
    7. Haz clic en Guardar.
  10. Crea un bucket de Cloud Storage:
    1. En la consola de Google Cloud, ve a la página Buckets de Cloud Storage.

      Ir a la página Buckets

    2. Haga clic en Crear bucket.
    3. En la página Crear un bucket, ingresa la información de tu bucket. Para ir al paso siguiente, haz clic en Continuar.
      • En Nombre del bucket, ingresa un nombre de bucket único. No incluyas información sensible en el nombre del bucket porque su espacio de nombres es global y públicamente visible.
      • En Elige dónde almacenar tus datos, haz lo siguiente:
        • Selecciona una opción de Tipo de ubicación.
        • Selecciona una opción de Ubicación.
      • Para Elegir una clase de almacenamiento predeterminado para tus datos, selecciona lo siguiente:Estándar.
      • En Elige cómo controlar el acceso a los objetos, selecciona una opción de Control de acceso.
      • Para la Configuración avanzada (opcional), especifica un método de encriptación, una política de retención o etiquetas de bucket.
    4. Haga clic en Crear.

Crea un lake

En los siguientes pasos, se muestra cómo crear un lake con la consola de Google Cloud.

  1. Ve a Dataplex en Google Cloud Console.

    Ir a Dataplex

  2. Navega a la vista Administrar.

  3. Haz clic en Crear.

  4. Ingresa un nombre visible.

  5. El ID del lake se genera automáticamente.

  6. Especifica la región en la que se creará el lake.

    En el caso de los lakes creados en una región determinada (por ejemplo, us-central1), se pueden conectar datos de una sola región (us-central1) y multirregionales (us multi-region) según la configuración de la zona.

  7. Haz clic en Crear.

Agrega una zona a tu lake

Después de crear el lake, puedes agregarle zonas. Las zonas son grupos lógicos de datos no estructurados y estructurados.

  1. En la vista Administrar, haz clic en el nombre del lake al que deseas agregar una zona.

  2. Haz clic en Agregar zona.

  3. Ingresa un Nombre visible para tu zona.

  4. Haga clic en el menú desplegable Tipo. Elige Zona sin procesar o Zona seleccionada. Obtén más información sobre los tipos de zonas.

  5. En Ubicaciones de datos, selecciona Regional o Multirregional. Lo que elijas no se podrá cambiar más adelante. Los datos de una sola región y multirregionales no se pueden combinar en la misma zona.

  6. Haz clic en Crear.

Es posible que la zona tarde algunos minutos en crearse.

Adjuntar un elemento

Los datos pueden almacenarse en buckets de Cloud Storage o conjuntos de datos de BigQuery y se pueden adjuntar como recursos a las zonas de datos dentro de un lake de Dataplex.

Sigue estos pasos para adjuntar el bucket de Cloud Storage que creaste anteriormente como elemento.

  1. En la vista Administrar, haz clic en el nombre de tu lake al que deseas adjuntar un bucket de Cloud Storage.

  2. En la pestaña Zonas, haz clic en la zona en la que quieres agregar el recurso.

  3. En la pestaña Activos, haz clic en Agregar elementos.

  4. Haga clic en Agregar un elemento.

  5. En Tipo, selecciona Bucket de almacenamiento.

  6. En Nombre visible, ingresa un nombre para el recurso.

  7. En el campo Bucket , haz clic en Explorar. Si tienes un bucket de Cloud Storage, búscalo y haz clic en Seleccionar. Si no tienes un bucket de Cloud Storage, puedes crear uno haciendo clic en el botón .

    1. Ingresa un nombre único para el bucket. Haz clic en Continuar.

    2. Elige un Tipo de ubicación. Haz clic en Continuar.

    3. Elige una clase de almacenamiento predeterminada para tus datos. Haz clic en Continuar.

    4. Elige un nivel de control de acceso. Haz clic en Continuar.

    5. Elige una opción de protección de datos o Ninguna. Haz clic en Continuar.

    6. Haz clic en Crear.

    7. Haga clic en Seleccionar.

  8. Haz clic en Listo.

  9. Haz clic en Continuar.

  10. En Configuración de descubrimiento, selecciona Heredar para heredar la configuración de descubrimiento del nivel de la zona.

  11. Haz clic en Continuar.

  12. En Agregar elementos, haz clic en Enviar.

Espera a que finalice la creación del elemento.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que se usaron en esta página.

  1. En la consola de Google Cloud, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. Si el proyecto que deseas borrar está vinculado con una organización, expande la lista Organización en la columna Nombre.
  3. En la lista de proyectos, elige el proyecto que quieres borrar y haz clic en Borrar.
  4. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Como alternativa, puedes borrar los recursos que usaste en este instructivo. No se pueden borrar los lakes, a menos que se borren todos los recursos de las zonas de datos. Del mismo modo, las zonas de datos no se pueden borrar, a menos que se borren todos los recursos que contiene:

Desconecta el bucket de almacenamiento

En los siguientes pasos, se muestra cómo desconectar el recurso de Dataplex que creaste.

  1. Ve a Dataplex en Google Cloud Console.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el nombre del lake que creaste.

  3. En la pestaña Zonas, haz clic en el nombre de la zona que creaste.

  4. En la pestaña Recursos, marca la casilla a la izquierda del nombre del bucket para seleccionar el elemento que deseas desvincular.

  5. Haz clic en Borrar recurso.

  6. Haz clic en Borrar para confirmar la desconexión.

Borra la zona

En los siguientes pasos, se muestra cómo borrar la zona de Dataplex que creaste.

  1. Ve a Dataplex en Google Cloud Console.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. En la pestaña Zonas, marca la casilla a la izquierda del nombre de la zona de datos para seleccionar la que quieras borrar.

  4. Haz clic en Borrar zona.

  5. Haga clic en Borrar para confirmar esta acción.

Borrar el lake

En los siguientes pasos, se muestra cómo borrar el lake de Dataplex que creaste.

  1. Ve a Dataplex en Google Cloud Console.

    Ir a Dataplex

  2. En la vista Administrar, haz clic en el lake que creaste.

  3. Haz clic en Borrar en la parte superior de la página.

  4. Para confirmar la eliminación, escribe “delete” en el cuadro de texto.

  5. Haz clic en Borrar lake para confirmar la eliminación.

¿Qué sigue?

Después de crear el lake, las zonas y los recursos, puedes hacer lo siguiente: