Crear entornos de desarrollo

En esta guía de inicio rápido se explican los pasos para crear entornos de desarrollo individuales en Dataform, de modo que cada desarrollador pueda trabajar en su propio entorno:

Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Enable the APIs

  8. Roles obligatorios

    Para obtener los permisos que necesitas para realizar todas las tareas de este tutorial, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en tu proyecto:

    • Administrador de Dataform (roles/dataform.admin): repositorios
    • Editor de Dataform (roles/dataform.editor): espacios de trabajo e invocaciones de flujos de trabajo

    Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

    También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.

    Crear un repositorio de Dataform

    1. En la Google Cloud consola, ve a la página Dataform.

      Ir a Dataform

    2. Haz clic en Crear repositorio.

    3. En la página Crear repositorio, haz lo siguiente:

      1. En el campo Repository ID (ID de repositorio), introduce quickstart-dev.

      2. En la lista Región, selecciona europe-west4.

      3. Haz clic en Crear.

    4. Haz clic en Listo.

    Conceder acceso a Dataform a BigQuery

    Para ejecutar flujos de trabajo en BigQuery, la cuenta de servicio de Dataform o tu cuenta de Google (vista previa) deben tener los siguientes roles obligatorios:

    Para conceder estos roles, sigue estos pasos:

    1. En la consola, ve a la página IAM. Google Cloud

      Ir a la página de gestión de identidades y accesos

    2. Haz clic en Añadir.

    3. En el campo Nuevos principales, introduce el ID de tu cuenta de servicio de Dataform o tu dirección de correo de tu cuenta de Google (Vista previa).

    4. En el menú Seleccionar un rol, elija el rol Usuario de tareas de BigQuery.

    5. Haz clic en Añadir otro rol y, en el menú Seleccionar un rol, selecciona el rol Editor de datos de BigQuery.

    6. Haz clic en Añadir otro rol y, en el menú Seleccionar un rol, selecciona el rol Lector de datos de BigQuery.

    7. Haz clic en Guardar.

    Configurar anulaciones de compilación de espacios de trabajo

    Para crear entornos de desarrollo aislados con anulaciones de compilación del espacio de trabajo de Dataform, sigue estos pasos:

    1. En la Google Cloud consola, ve a la página Dataform.

      Ir a Dataform

    2. Haz clic en quickstart-dev.

    3. Haz clic en Configuración y, a continuación, en Editar.

    4. En el panel Workspace compilation overrides (Sustituciones de compilación del espacio de trabajo), en el campo Schema suffix (Sufijo de esquema), introduce ${workspaceName}.

      Cuando activas la ejecución en un espacio de trabajo, Dataform añade el nombre del espacio de trabajo como sufijo al esquema predeterminado definido en los ajustes del flujo de trabajo. En esta guía de inicio rápido se usan los ajustes predeterminados de Dataform con el dataform esquema predeterminado.

    5. Haz clic en Guardar.

    Dataform aplica las anulaciones de compilación del área de trabajo a todas las áreas de trabajo de tu repositorio.

    Con esta configuración, cuando ejecutas manualmente un flujo de trabajo en un espacio de trabajo, Dataform lo ejecuta con las anulaciones de compilación del espacio de trabajo. Como resultado, Dataform ejecuta el flujo de trabajo en el esquema dataform_workspaceName de BigQuery, lo que convierte el espacio de trabajo en un entorno de desarrollo aislado.

    Por ejemplo, cuando activas manualmente la ejecución en un espacio de trabajo sasha, Dataform ejecuta tu flujo de trabajo en el esquema dataform_sasha de BigQuery.

    Para ejecutar flujos de trabajo sin anulaciones de compilación del espacio de trabajo, pero mantenerlas en los entornos de desarrollo, puedes crear configuraciones de lanzamiento para configurar otros entornos de ejecución, como staging y production.

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    Eliminar conjuntos de datos creados en BigQuery

    Para evitar que se te cobren los recursos de BigQuery, elimina los conjuntos de datos cuyos nombres empiecen por dataform, como dataform-sasha.

    1. En la Google Cloud consola, ve a la página BigQuery.

      Ir a BigQuery

    2. En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.

    3. Haz clic en el menú Acciones y, a continuación, selecciona Eliminar.

    4. En el cuadro de diálogo Eliminar conjunto de datos, introduce delete en el campo y, a continuación, haz clic en Eliminar.

    Eliminar el repositorio de Dataform

    La creación de repositorios de Dataform no conlleva ningún coste. Sin embargo, si quieres eliminar un repositorio y todo su contenido, sigue estos pasos:

    1. En la Google Cloud consola, ve a la página Dataform.

      Ir a Dataform

    2. En quickstart-dev, haz clic en el menú Más y, a continuación, selecciona Eliminar.

      1. En la ventana Eliminar repositorio, introduce el nombre del repositorio para confirmar la eliminación.
    3. Para confirmar la acción, haz clic en Eliminar.

    Siguientes pasos