Crear entornos de desarrollo

En esta guía de inicio rápido, se explican los pasos para crear desarrollos individuales entornos en Dataform, para que cada desarrollador pueda trabajar en su propio de entorno de desarrollo:

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  4. Habilita las API de BigQuery and Dataform.

    Habilita las API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Asegúrate de que la facturación esté habilitada para tu proyecto de Google Cloud.

  7. Habilita las API de BigQuery and Dataform.

    Habilita las API

Roles obligatorios

A fin de obtener los permisos que necesitas para realizar todas las tareas de este instructivo, solicita a tu administrador que te otorgue el los siguientes roles de IAM en tu proyecto:

  • Administrador de Dataform (roles/dataform.admin): Repositorios
  • Editor de Dataform (roles/dataform.editor): invocaciones del flujo de trabajo y lugares de trabajo

Si quieres obtener más información para otorgar roles, consulta Administra el acceso.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Crea un repositorio de Dataform

  1. En la consola de Google Cloud, ve a la página Dataform.

    Ir a Dataform

  2. Haz clic en Crear repositorio.

  3. En la página Crear repositorio, haz lo siguiente:

    1. En el campo ID del repositorio, ingresa quickstart-dev.

    2. En la lista Región, selecciona europe-west4.

    3. Haz clic en Crear.

  4. Haz clic en Listo.

Otorga acceso de Dataform a BigQuery

Para ejecutar flujos de trabajo en BigQuery, la API de Dataform la cuenta de servicio debe tener los siguientes roles obligatorios:

Para otorgar estos roles, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página IAM.

    Ve a la página IAM

  2. Haz clic en Agregar.

  3. En el campo Principales nuevas, ingresa tu servicio de Dataform. ID de la cuenta.

  4. En la lista desplegable Seleccionar un rol, selecciona Rol Usuario del trabajo de BigQuery.

  5. Haz clic en Agregar otro rol y, luego, en el menú desplegable Selecciona un rol. selecciona el rol Editor de datos de BigQuery.

  6. Haz clic en Agregar otro rol y, luego, en el menú desplegable Selecciona un rol. selecciona el rol Visualizador de datos de BigQuery.

  7. Haz clic en Guardar.

Configura anulaciones de compilación de lugares de trabajo

Para crear entornos de desarrollo aislados con el lugar de trabajo de Dataform anulaciones de compilación, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página Dataform.

    Ir a Dataform

  2. Haz clic en quickstart-dev.

  3. Haz clic en Configuración y, luego, en Editar.

  4. En el panel Anulaciones de compilación de lugares de trabajo, en el campo Sufijo de esquema, ingresa ${workspaceName}.

    Cuando actives la ejecución en un lugar de trabajo, Dataform adjuntará el archivo nombre del lugar de trabajo como sufijo del esquema predeterminado establecido en configuración del flujo de trabajo. En esta guía de inicio rápido, se usa la configuración predeterminada de Dataform con el esquema predeterminado dataform.

  5. Haz clic en Guardar.

Dataform aplica anulaciones de compilación de lugares de trabajo a todos los lugares de trabajo de tu repositorio.

Con esta configuración, cuando ejecutas manualmente un flujo de trabajo de SQL en un , Dataform lo ejecuta con anulaciones de compilación del lugar de trabajo. Como resultado, Dataform ejecuta el flujo de trabajo de SQL en el esquema dataform_workspaceName en BigQuery y convierte el en un entorno de desarrollo aislado.

Por ejemplo, cuando activas de forma manual la ejecución en un lugar de trabajo sasha, Dataform ejecuta tu flujo de trabajo de SQL en el esquema dataform_sasha en en BigQuery.

Para ejecutar flujos de trabajo de SQL sin anulaciones de compilación de lugares de trabajo, pero mantén anulaciones de compilación de Workspace para entornos de desarrollo, puedes crear de lanzamiento para configurar otros entornos de ejecución, por ejemplo, staging y production.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

Borrar conjuntos de datos creados en BigQuery

Para evitar que se apliquen cargos por los recursos de BigQuery, borra los conjuntos de datos con nombres que comienzan con dataform, por ejemplo, dataform-sasha.

  1. En la consola de Google Cloud, ve a la página de BigQuery.

    Ir a BigQuery

  2. En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.

  3. Haz clic en el menú Acciones y, luego, selecciona Borrar.

  4. En el diálogo Borrar conjunto de datos, ingresa delete en el campo y, luego, Haz clic en Borrar.

Borra el repositorio de Dataform

Crear repositorios de Dataform no genera costos. Sin embargo, si deseas borrar un repositorio y todo su contenido, sigue estos pasos: pasos:

  1. En la consola de Google Cloud, ve a la página Dataform.

    Ir a Dataform

  2. Para quickstart-dev, haz clic en el menú Más . y, luego, selecciona Borrar.

    1. En la ventana Borrar repositorio, ingresa el nombre del repositorio para confirmar su eliminación.
  3. Para confirmar la acción, haz clic en Borrar.

¿Qué sigue?