Este documento te ayuda a comprender el concepto de lugares de trabajo en Dataform y sus capacidades.
En Dataform, interactúas con tu código del flujo de trabajo de SQL en un lugar de trabajo de desarrollo. Un lugar de trabajo de desarrollo es tu propia copia editable de un repositorio. En un lugar de trabajo, puedes crear, editar o borrar el contenido del repositorio sin afectar a otros que trabajan en el mismo repositorio y, luego, confirmar y enviar los cambios al repositorio.
Puedes desarrollar tu flujo de trabajo de SQL con Dataform core o JavaScript. Dataform compila tu código en consultas en SQL en tiempo real.
En un lugar de trabajo de desarrollo, puedes realizar las siguientes tareas:
- Cómo configurar los parámetros de Dataform
- Crea tablas de todos los tipos admitidos.
- Tablas de documento
- Tablas particionadas
- Agregar etiquetas de BigQuery y etiquetas de política a las tablas
- Define la configuración adicional de la tabla.
- Declara las fuentes de datos para tu flujo de trabajo de SQL
- Agrega operaciones de SQL personalizadas y etiquetas a tu flujo de trabajo de SQL.
- Ejecuta la ejecución del flujo de trabajo de SQL o sus acciones seleccionadas.
- Inspecciona los registros de ejecución
Componentes de un lugar de trabajo de desarrollo
Un lugar de trabajo de desarrollo de Dataform consta de las siguientes pestañas:
- Código
- Contiene un entorno de desarrollo en el que puedes desarrollar consultas, control de versión de los cambios y activar la ejecución en BigQuery.
- Gráfico compilado
- Muestra el flujo de trabajo de SQL compilado definido en tu lugar de trabajo como un grafo acíclico dirigido (DAG) interactivo. Si hay errores de compilación en el flujo de trabajo de SQL, la pestaña muestra un mensaje de error en lugar del gráfico.
- Ejecuciones
- Muestra registros de todas las ejecuciones activadas en el lugar de trabajo. También puedes ver las acciones y sus detalles para una ejecución seleccionada. Para obtener más información, consulta Inspecciona los registros de ejecución del lugar de trabajo.
Componentes de la pestaña Código
La pestaña Código de un lugar de trabajo de desarrollo contiene los siguientes componentes que te permiten desarrollar flujos de trabajo de SQL:
- Panel de archivos
- Muestra la estructura de archivos de tu lugar de trabajo. Guarda automáticamente los cambios en la estructura de archivos.
- Panel de control de la versión
- Muestra el estado del control de versión de tu lugar de trabajo y las opciones de control de versión.
- Panel de desarrollo
- Muestra el archivo editado actualmente. Guarda automáticamente los cambios en el archivo.
- Botón Run
- Ejecuta una vista previa de la consulta de SQL compilada.
- Estado de compilación
- Muestra el estado de compilación del código en tu lugar de trabajo.
- Panel de metadatos
- Muestra los metadatos del archivo editado actualmente.
- Panel de consultas compiladas
- Compila en SQL las consultas del archivo editado actualmente. Si la compilación de la consulta falla, muestra errores de compilación. Si la compilación de consultas es correcta, muestra las consultas compiladas y las valida a través de ejecuciones de prueba en BigQuery. Si la validación de la consulta falla, muestra errores de validación. Si la validación de la consulta es exitosa, muestra cuántos bytes usaría la ejecución de consultas en BigQuery.
- Menú desplegable para iniciar la ejecución
- Muestra opciones para activar la ejecución de todo el flujo de trabajo en el lugar de trabajo o los elementos seleccionados.
Componentes de la pestaña de gráfico Compilado
En la pestaña Gráfico compilado, se muestra un gráfico interactivo del flujo de trabajo de SQL compilado. El gráfico muestra todas las acciones en tu flujo de trabajo de SQL y las relaciones entre ellas.
Puedes acercar y alejar la imagen, y usar la función de arrastrar y soltar para navegar por el gráfico.
Puedes filtrar el gráfico según las siguientes propiedades:
- Nombre
- Etiqueta
- Tipo
- Aserción
- Declaración
- Tabla incremental
- Vista materializada
- Operations
- Tabla
- Estado desconocido
- Ver
Puedes seleccionar varios filtros a la vez.
Dataform los aplicará con la condición OR
.
Puedes hacer clic en una acción del gráfico para ver sus detalles en los siguientes paneles:
- Panel de metadatos
- Muestra el nombre completo, el tipo, las dependencias y los dependientes de la acción seleccionada.
- Panel de consulta
- Muestra la consulta en SQL compilada de la acción seleccionada.
Control de versión en un lugar de trabajo
En un lugar de trabajo, interactúas con el repositorio a través del control de versión basado en Git. Las ediciones que realices en los archivos en tu lugar de trabajo comienzan como cambios locales sin confirmar que puedes confirmar y, luego, envían a tu repositorio a fin de que estén disponibles para todos los usuarios del repositorio.
Si tu repositorio está conectado a un proveedor de Git remoto, envía los cambios de tu lugar de trabajo a la rama de desarrollo principal. Selecciona la rama principal cuando conectes el repositorio al proveedor de Git remoto. En un repositorio de Dataform no conectado, envía los cambios a la rama predeterminada.
También puedes extraer cualquier cambio del repositorio de Dataform o del repositorio remoto y combinarlos con cambios locales en tu lugar de trabajo de desarrollo. Para obtener más información sobre el control de versión en Dataform, consulta Cómo controlar el código de la versión.
¿Qué sigue?
- Si deseas obtener información sobre cómo crear e inicializar un lugar de trabajo, consulta Crea un lugar de trabajo.
- Si quieres aprender a control de versión de los códigos de Dataform, consulta Cómo controlar versiones de tu código.
- Si deseas obtener información sobre cómo ejecutar una vista previa para probar una consulta en SQL, visita Cómo obtener una vista previa de consultas de SQL.