Administra un repositorio

En este documento, se muestra cómo hacer lo siguiente en Dataform:

Antes de comenzar

  1. Crea un repositorio.
  2. Opcional: Conecta tu repositorio a un repositorio de Git de terceros.
  3. Crea e inicializa un espacio de trabajo de desarrollo en tu repositorio.

Roles requeridos

Para obtener los permisos que necesitas para completar las tareas de este documento, pídele a tu administrador que te otorgue los siguientes roles de IAM:

  • Configura los parámetros de Dataform y administra la ubicación del paquete principal de Dataform: Administrador de Dataform (roles/dataform.admin) en repositorios.
  • Actualiza el paquete principal de Dataform y usa el control de versión en Dataform: Editor de Dataform (roles/dataform.editor) en espacios de trabajo

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Configura los parámetros del flujo de trabajo de Dataform

En esta sección, se muestra cómo editar la configuración de procesamiento del flujo de trabajo de Dataform para un repositorio específico.

Es posible que desees editar el archivo de configuración para cambiar el nombre de los esquemas o agregar variables de compilación personalizadas a tu repositorio.

Acerca de la configuración del repositorio

Cada repositorio de Dataform contiene un archivo de configuración de flujo de trabajo único. El archivo contiene el ID del proyecto y el esquema en el que Dataform publica recursos en BigQuery. Google Cloud Dataform usa la configuración predeterminada que puedes anular para que se adapte mejor a tus necesidades. Para ello, edita el archivo de configuración.

A partir de Dataform Core 3.0.0, la configuración del flujo de trabajo se almacena en el archivo workflow_settings.yaml de forma predeterminada. En versiones anteriores de Dataform Core, la configuración del flujo de trabajo se almacena en el archivo dataform.json. El archivo workflow_settings.yaml de Dataform Core 3.0 es retrocompatible con el archivo dataform.json. Puedes seguir usando el archivo dataform.json para almacenar la configuración del flujo de trabajo. Como práctica recomendada, debes migrar la configuración del flujo de trabajo de tu repositorio al formato workflow_settings.yaml para garantizar la compatibilidad en el futuro.

Acerca de workflow_settings.yaml

El archivo workflow_settings.yaml, que se introdujo en Dataform Core 3.0, almacena la configuración del flujo de trabajo de Dataform en formato YAML.

En el siguiente muestra de código, se muestra un archivo workflow_settings.yaml de muestra:

  defaultProject: my-gcp-project-id
  defaultDataset: dataform
  defaultLocation: australia-southeast2
  defaultAssertionDataset: dataform_assertions

En la muestra de código anterior, los pares clave-valor se describen de la siguiente manera:

  • defaultProject: Es el ID de tu proyecto de BigQuery Google Cloud .
  • defaultDataset: Es el conjunto de datos de BigQuery en el que Dataform crea recursos, llamado dataform de forma predeterminada.
  • defaultLocation (opcional): Es la ubicación predeterminada de tu conjunto de datos de BigQuery. Dataform usa esta ubicación para procesar tu código y almacenar los resultados. Esta ubicación de procesamiento debe coincidir con la ubicación de tus conjuntos de datos de BigQuery. Sin embargo, no es necesario que coincida con la ubicación del repositorio de Dataform.

    Si no configuras el parámetro defaultLocation, Dataform determinará la ubicación en función de los conjuntos de datos a los que hace referencia tu consulta en SQL. Esto funciona de la siguiente manera:

    • Si tu consulta hace referencia a conjuntos de datos de la misma ubicación, Dataform usa esa ubicación.
    • Si tu consulta hace referencia a conjuntos de datos de dos o más ubicaciones diferentes, se producirá un error. Para obtener detalles sobre esta limitación, consulta Replicación de conjuntos de datos entre regiones.
    • Si tu consulta no hace referencia a ningún conjunto de datos, la ubicación predeterminada para Dataform es la multirregión US. Para elegir otra ubicación, establece la ubicación predeterminada. Como alternativa, usa la variable del sistema @@location en tu consulta. Para obtener más información, consulta Cómo especificar ubicaciones.
  • defaultAssertionDataset: Es el conjunto de datos de BigQuery en el que Dataform crea vistas con resultados de aserción, llamado dataform_assertions de forma predeterminada.

Para obtener más información sobre las propiedades de workflow_settings.yaml, consulta WorkflowSettings en GitHub.

Puedes acceder a las propiedades definidas en workflow_settings.yaml en tu código de Dataform como propiedades del objeto dataform.projectConfig.

Se aplican las siguientes asignaciones de las opciones de workflow_settings.yaml a las opciones de dataform.projectConfig accesibles por código:

  • defaultProject => defaultDatabase
  • defaultDataset => defaultSchema
  • defaultAssertionDataset => assertionSchema
  • projectSuffix => databaseSuffix
  • datasetSuffix => schemaSuffix
  • namePrefix => tablePrefix

En el siguiente muestra de código, se muestra el objeto dataform.projectConfig al que se hace referencia en una instrucción SELECT en una vista:

  config { type: "view" }
  SELECT ${when(
    !dataform.projectConfig.tablePrefix,
    "table prefix is set!",
    "table prefix is not set!"
  )}

Acerca de dataform.json

El archivo dataform.json almacena la configuración del flujo de trabajo de Dataform en formato JSON.

En el siguiente muestra de código, se muestra un archivo dataform.json de muestra:

  {
    "warehouse": "bigquery",
    "defaultDatabase": "my-gcp-project-id",
    "defaultSchema": "dataform",
    "defaultLocation": "australia-southeast2",
    "assertionSchema": "dataform_assertions"
  }

En la muestra de código anterior, los pares clave-valor se describen de la siguiente manera:

  • warehouse: Es un puntero a BigQuery, donde Dataform crea recursos.
  • defaultDatabase: Es el ID de tu proyecto de BigQuery Google Cloud .
  • defaultSchema: Es el conjunto de datos de BigQuery en el que Dataform crea recursos.
  • defaultLocation (opcional): Es la ubicación predeterminada de tu conjunto de datos de BigQuery. Dataform usa esta ubicación para procesar tu código y almacenar los resultados. Esta ubicación de procesamiento debe coincidir con la ubicación de tus conjuntos de datos de BigQuery. Sin embargo, no es necesario que coincida con la ubicación del repositorio de Dataform.

    Si no configuras el parámetro defaultLocation, Dataform determinará la ubicación en función de los conjuntos de datos a los que hace referencia tu consulta en SQL. Esto funciona de la siguiente manera:

    • Si tu consulta hace referencia a conjuntos de datos de la misma ubicación, Dataform usa esa ubicación.
    • Si tu consulta hace referencia a conjuntos de datos de dos o más ubicaciones diferentes, se producirá un error. Para obtener detalles sobre esta limitación, consulta Replicación de conjuntos de datos entre regiones.
    • Si tu consulta no hace referencia a ningún conjunto de datos, la ubicación predeterminada para Dataform es la multirregión US. Para elegir otra ubicación, establece la ubicación predeterminada. Como alternativa, usa la variable del sistema @@location en tu consulta. Para obtener más información, consulta Cómo especificar ubicaciones.
  • assertionSchema: Es el conjunto de datos de BigQuery en el que Dataform crea vistas con resultados de aserción, llamado dataform_assertions de forma predeterminada.

Puedes acceder a las propiedades definidas en el archivo dataform.json en el código de tu proyecto como propiedades del objeto dataform.projectConfig.

Configura nombres de esquemas

Para configurar los nombres de esquema, debes editar las propiedades defaultDataset y defaultAssertionSchema en el archivo workflow_settings.yaml, o bien las propiedades defaultSchema y assertionSchema en el archivo dataform.json.

Para configurar el nombre de un esquema, sigue estos pasos:

workflow_settings.yaml

  1. En el panel Archivos de tu espacio de trabajo de desarrollo, haz clic en el archivo workflow_settings.yaml.

  2. Edita el valor de defaultDataset, defaultAssertionSchema o ambos.

En la siguiente muestra de código, se muestra un nombre de defaultDataset personalizado definido en el archivo workflow_settings.yaml:

  ...
  defaultDataset: mytables
  ...

dataform.json

  1. En el panel Archivos de tu espacio de trabajo de desarrollo, haz clic en el archivo dataform.json.

  2. Edita el valor de defaultSchema, assertionSchema o ambos.

En la siguiente muestra de código, se muestra un nombre de defaultSchema personalizado definido en el archivo dataform.json:

{
  ...
  "defaultSchema": "mytables",
  ...
}

Crea variables de compilación personalizadas

Las variables de compilación contienen valores que puedes modificar con anulaciones de compilación en una configuración de versión o en una solicitud de la API de Dataform.

Después de definir una variable de compilación en workflow_settings.yaml y agregarla a las tablas seleccionadas, puedes modificar su valor en una configuración de versión o en las anulaciones de compilación de la API de Dataform para ejecutar tablas de forma condicional.

Para obtener más información sobre cómo ejecutar tablas de forma condicional con variables de compilación, consulta Introducción al ciclo de vida del código en Dataform.

Para crear una variable de compilación que puedas usar en todo un repositorio, sigue estos pasos:

workflow_settings.yaml

  1. Ve a tu espacio de trabajo de desarrollo de Dataform.
  2. En el panel Archivos, selecciona el archivo workflow_settings.yaml.
  3. Ingresa el siguiente fragmento de código:

    "vars": {
      "VARIABLE":"VALUE"
    }
    

    Reemplaza lo siguiente:

    • VARIABLE: Un nombre para la variable
    • VALUE: Es el valor predeterminado de la variable de compilación.

En la siguiente muestra de código, se observa la variable de compilación myVariableName establecida en myVariableValue en el archivo workflow_settings.yaml:

...
vars:
  myVariableName: myVariableValue
...

En el siguiente muestra de código, se muestra el archivo workflow_settings.yaml con la variable de compilación executionSetting establecida en dev:

defaultProject: default_bigquery_database
defaultLocation: us-west1
defaultDataset: dataform_data,
vars:
executionSetting: dev

dataform.json

  1. Ve a tu espacio de trabajo de desarrollo de Dataform.
  2. En el panel Archivos, selecciona el archivo dataform.json.
  3. Ingresa el siguiente fragmento de código:

    "vars": {
      "VARIABLE":"VALUE"
    }
    

    Reemplaza lo siguiente:

    • VARIABLE: Un nombre para la variable
    • VALUE: Es el valor predeterminado de la variable de compilación.

En la siguiente muestra de código, se observa la variable de compilación myVariableName establecida en myVariableValue en el archivo dataform.json:

{
  ...
  "vars": {
    "myVariableName": "myVariableValue"
  },
  ...
}

En el siguiente muestra de código, se muestra el archivo dataform.json con la variable de compilación executionSetting establecida en dev:

{
"warehouse": "bigquery",
"defaultSchema": "dataform_data",
"defaultDatabase": "default_bigquery_database".
"defaultLocation":"us-west-1",
"vars": {
"executionSetting":"dev"
}
}
Agrega una variable de compilación a una tabla

Para agregar una variable de compilación a un archivo de definición de tabla SQLX, sigue estos pasos:

  1. Ve a tu espacio de trabajo de desarrollo de Dataform.
  2. En el panel Archivos, selecciona un archivo de definición de tabla SQLX.
  3. En el archivo, ingresa una cláusula when con el siguiente formato:

    ${when(dataform.projectConfig.vars.VARIABLE === "SET_VALUE", "CONDITION")}
    

    Reemplaza lo siguiente:

    • VARIABLE: El nombre de tu variable, por ejemplo, executionSetting
    • SET_VALUE: Un valor para la variable, por ejemplo, staging
    • CONDITION: Una condición para la ejecución de la tabla

En el siguiente muestra de código, se muestra un archivo SQLX de definición de tabla con una cláusula when y la variable executionSetting que ejecuta el 10% de los datos en el parámetro de configuración de ejecución de la etapa de pruebas:

  select
    *
  from ${ref("data")}
  ${when(
    dataform.projectConfig.vars.executionSetting === "staging",
    "where mod(farm_fingerprint(id) / 10) = 0",
  )}

En el siguiente muestra de código, se muestra un archivo SQLX de definición de vista con una cláusula when y la variable myVariableName:

  config { type: "view" }
  SELECT ${when(
    dataform.projectConfig.vars.myVariableName === "myVariableValue",
    "myVariableName is set to myVariableValue!",
    "myVariableName is not set to myVariableValue!"
  )}

Migra la configuración del flujo de trabajo a workflow_settings.yaml

Para garantizar que tu archivo de configuración del flujo de trabajo sea compatible con las versiones futuras del framework principal de Dataform, debes migrar la configuración del flujo de trabajo del archivo dataform.json al archivo workflow_settings.yaml.

El archivo workflow_settings.yaml reemplaza al archivo dataform.json.

Si Dataform Core es el único paquete de dependencia en tu repositorio, el archivo workflow_settings.yaml también reemplaza al archivo package.json. Para obtener más información sobre cómo reemplazar el archivo package.json por el archivo workflow_settings.yaml, consulta Administra el paquete principal de Dataform.

En la siguiente tabla, se muestra la asignación de las propiedades de configuración del flujo de trabajo del archivo dataform.json al archivo workflow_settings.yaml:

Propiedad en dataform.json Propiedad en workflow_settings.yaml Descripción
assertionSchema defaultAssertionDataset Obligatorio. Es el conjunto de datos predeterminado para las aserciones.
defaultDatabase defaultProject Obligatorio. Es el nombre del proyecto Google Cloud predeterminado.
defaultLocation defaultLocation Opcional. Es la ubicación predeterminada de BigQuery en la que Dataform crea tablas. Si no se configura, Dataform determina la ubicación en función de los conjuntos de datos a los que hace referencia tu consulta en SQL. Para obtener más información, consulta Cómo especificar ubicaciones.
defaultSchema defaultDataset Obligatorio. Es el conjunto de datos predeterminado.
databaseSuffix projectSuffix Opcional. Es el sufijo que se agrega a todas las referencias del proyecto Google Cloud .
schemaSuffix datasetSuffix Opcional. Es el sufijo que se agrega a todos los conjuntos de datos de acción.
tablePrefix namePrefix Opcional. Es el prefijo que se antepone a todos los nombres de las acciones.
vars vars Opcional. Son variables definidas por el usuario que están disponibles para el código del proyecto durante la compilación. Un objeto que contiene una lista de pares key: value.
warehouse - Se requiere en dataform.json. Debe establecerse en bigquery. No disponible en workflow_settings.yaml.
- dataformCoreVersion No disponible en dataform.json. Se instala en workflow_settings.yaml de forma predeterminada para los repositorios nuevos. Para obtener más información, consulta Administra el paquete principal de Dataform.

Para migrar la configuración del flujo de trabajo a workflow_settings.yaml, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página Dataform.

    Ir a Dataform

  2. Selecciona un repositorio y, luego, un espacio de trabajo.

  3. En el panel Archivos, haz clic en addAgregar y, luego, en Crear archivo.

  4. En el campo Agregar una ruta de acceso al archivo, ingresa workflow_settings.yaml.

  5. Haz clic en Crear archivo.

  6. En el archivo workflow_settings.yaml, agrega la configuración de tu archivo dataform.json, asignada al formato YAML.

  7. En el panel Archivos, haz clic en el menú Más junto a dataform.json y, luego, en Borrar.

  8. Para confirmar la eliminación de dataform.json, haz clic en Borrar.

En la siguiente muestra de código, se muestran los parámetros de configuración del flujo de trabajo definidos en un archivo dataform.json:

{
  "warehouse": "bigquery",
  "defaultDatabase": "dataform-demos",
  "defaultLocation": "US",
  "defaultSchema": "dataform",
  "assertionSchema": "dataform_assertions"
  "vars": {
    "environmentName": "development"
  }
}

En la siguiente muestra de código, se muestra el archivo dataform.json anterior convertido a workflow_settings.yaml:

defaultProject: dataform-demos
defaultLocation: US
defaultDataset: dataform
defaultAssertionDataset: dataform_assertions
vars:
    environmentName: "development"

Administra el paquete principal de Dataform

En esta sección, se muestra cómo administrar el paquete de dependencia del framework principal de Dataform y actualizarlo a la versión más reciente.

Dataform Core es el framework de Dataform de código abierto para desarrollar flujos de trabajo con SQL, SQLX y JavaScript. Como práctica recomendada, siempre usa la versión más reciente disponible del framework principal de Dataform. Para obtener información sobre las versiones del framework principal de Dataform, consulta Versiones de Dataform en GitHub.

Administra la ubicación del paquete principal de Dataform

Cuando inicializas el primer espacio de trabajo en un repositorio, Dataform establece automáticamente Dataform Core como paquete de dependencia. A partir de Dataform Core 3.0.0, Dataform instala el paquete de Dataform Core en el archivo workflow_settings.yaml de forma predeterminada. En versiones anteriores de Dataform Core, Dataform Core se configuraba en el archivo package.json.

En Dataform Core 3.0.0 y versiones posteriores, si Dataform Core es el único paquete en tu repositorio, debes configurarlo en el archivo workflow_settings.yaml. En el caso de los repositorios creados con versiones anteriores de Dataform Core, mueve el paquete de Dataform Core a workflow_settings.yaml.

El archivo package.json es necesario para instalar paquetes adicionales en Dataform. Si tu repositorio usa paquetes adicionales, configura el paquete principal de Dataform en package.json para que todos los paquetes se configuren en un solo lugar. Si tu repositorio no tiene el archivo package.json, créalo y mueve el paquete principal de Dataform para instalar paquetes adicionales.package.json

Mover Dataform core a workflow_settings.yaml

En el caso de los repositorios creados con versiones de Dataform Core anteriores a 3.0.0, si no tienes paquetes de dependencia que no sean Dataform Core, debes mover el paquete de Dataform Core del archivo package.json al archivo workflow_settings.yaml y borrar el archivo package.json redundante.

Para migrar el paquete principal de Dataform del archivo package.json al archivo workflow_settings.yaml, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Dataform.

    Ir a Dataform

  2. Selecciona un repositorio y, luego, un espacio de trabajo.

  3. En el panel Archivos, selecciona el archivo workflow_settings.yaml.

  4. En el archivo workflow_settings.yaml, agrega el paquete principal de Dataform con el siguiente formato:

    dataformCoreVersion: "VERSION"
    
    

    Reemplaza VERSION por la versión más reciente de Dataform, por ejemplo, 3.0.0.

  5. En el panel Archivos, haz clic en el menú Más junto al archivo package.json y, luego, en Borrar.

  6. Para confirmar la eliminación del archivo dataform.json, haz clic en Borrar.

  7. Haz clic en Instalar paquetes.

Mover Dataform core a package.json

El archivo package.json es necesario para instalar paquetes adicionales en un repositorio. Si tu repositorio usa paquetes adicionales, debes almacenar todos los paquetes, incluido el paquete principal de Dataform, en el archivo package.json.

Si tu repositorio no contiene el archivo package.json porque el paquete principal de Dataform está configurado en el archivo workflow_settings.yaml, debes crear el archivo package.json para instalar paquetes adicionales y, luego, mover el paquete principal de Dataform del archivo workflow_settings.yaml al archivo package.json recién creado.

Para crear el archivo package.json y mover el paquete principal de Dataform, sigue estos pasos:

  1. En la consola de Google Cloud , ve a la página Dataform.

    Ir a Dataform

  2. Selecciona un repositorio y, luego, un espacio de trabajo.

  3. En el panel Archivos, haz clic en agregarAgregar y, luego, en Crear archivo.

  4. En el campo Agregar una ruta de acceso al archivo, ingresa package.json.

  5. Haz clic en Crear archivo.

  6. En el archivo package.json, agrega el paquete principal de Dataform con el siguiente formato:

    {
        "dependencies": {
            "@dataform/core": "VERSION"
        }
    }
    

    Reemplaza VERSION por la versión más reciente de Dataform, por ejemplo, 3.0.0.

  7. Haz clic en Instalar paquetes.

  8. En el panel Archivos, selecciona workflow_settings.yaml.

  9. En el archivo workflow_settings.yaml, borra la propiedad dataformCoreVersion.

Actualiza Dataform Core

Siempre prueba las versiones nuevas de los paquetes en un entorno que no sea de producción antes de implementarlas en tu entorno de producción.

Para actualizar el paquete de dependencia principal de Dataform, sigue estos pasos:

  1. Busca la versión más reciente de @dataform/core en la página de lanzamientos de Dataform en GitHub.

  2. En la consola de Google Cloud , ve a la página Dataform.

    Ir a Dataform

  3. Selecciona un repositorio y, luego, un espacio de trabajo.

  4. En el panel Files, selecciona el archivo package.json o el archivo workflow_settings.yaml.

    La ubicación en la que se establece el paquete de dependencia principal de Dataform depende de tu versión de Dataform Core y de tu uso de paquetes. Para obtener más información, consulta Administra la ubicación del paquete principal de Dataform.

  5. Actualiza el paquete de dependencia principal de Dataform con la versión más reciente:

    package.json

    {
        "dependencies": {
            "@dataform/core": "VERSION"
        }
    }
    

    Reemplaza VERSION por la versión más reciente de Dataform, por ejemplo, 3.0.0. Para evitar problemas con la instalación de paquetes, especifica de forma explícita la versión del paquete principal de Dataform. No uses otras opciones de dependencies del archivo package.json, por ejemplo, >version.

    workflow_settings.yaml

    dataformCoreVersion: "VERSION"
    

    Reemplaza VERSION por la versión más reciente de Dataform, por ejemplo, 3.0.0.

  6. Haz clic en Instalar paquetes.

  7. Confirma los cambios.

  8. Envía los cambios a tu repositorio.

En el siguiente muestra de código, se muestra la dependencia de @dataform/core actualizada a la versión 3.0.0 en el archivo package.json:

{
    "dependencies": {
        "@dataform/core": "3.0.0"
    }
}

Aplica el control de versiones en tu código

En esta sección, se muestra cómo usar el control de versión en Dataform para realizar un seguimiento del desarrollo.

Dataform usa Git para realizar un seguimiento de cada cambio que se realiza en los archivos dentro de un repositorio.

En un repositorio de Dataform, interactúas directamente con el repositorio de Git.

En un repositorio conectado, interactúas con la rama de seguimiento del repositorio remoto que configuraste mientras conectabas el repositorio.

Dataform muestra opciones de control de versión según el estado de los cambios en tu espacio de trabajo de desarrollo. Por ejemplo, Dataform muestra la opción de confirmación solo cuando hay cambios locales sin confirmar en tu lugar de trabajo. Cuando los archivos de tu espacio de trabajo son una copia exacta de tu rama predeterminada o de seguimiento, Dataform muestra el estado El espacio de trabajo está actualizado.

Dataform muestra las siguientes opciones de control de versión:

Confirma los cambios de X
Confirma la cantidad de cambios locales X en tu espacio de trabajo o en los archivos modificados seleccionados. Dataform muestra los cambios sin confirmar.
Enviar a la rama predeterminada
Envía los cambios confirmados a tu rama predeterminada. Esta opción está disponible en un repositorio de Dataform si no tienes cambios sin confirmar en tu lugar de trabajo.
Enviar a your-branch-name
Envía los cambios confirmados a your-branch-name. Esta opción está disponible en un repositorio conectado a un repositorio de Git de terceros si no tienes cambios sin confirmar en tu espacio de trabajo.
Extraer de la rama predeterminada
Actualiza tus espacios de trabajo con los cambios recientes de tu rama predeterminada. Esta opción está disponible en un repositorio de Dataform si no tienes cambios confirmados o sin confirmar en tu espacio de trabajo.
Extraer de your-branch-name
Actualiza tu espacio de trabajo con los cambios recientes de your-branch-name. Esta opción está disponible en un repositorio conectado a un repositorio de Git de terceros si no tienes cambios confirmados o sin confirmar en tu espacio de trabajo.
Volver a la última confirmación
Restablece los archivos de tu espacio de trabajo a su estado del último envío.

Extraer cambios

Si tu lugar de trabajo de desarrollo no está sincronizado con tu repositorio, Dataform mostrará la opción Pull. Para extraer los cambios de tu repositorio a tu espacio de trabajo de desarrollo, sigue estos pasos:

  1. En la página Dataform, selecciona un repositorio.
  2. En la pestaña Lugares de trabajo de desarrollo, selecciona un lugar de trabajo de desarrollo.
  3. En la página del espacio de trabajo de desarrollo, haz lo siguiente:
    1. Si estás en un repositorio de Dataform, haz clic en Extraer de la rama predeterminada.
    2. Si estás en un repositorio conectado a un repositorio de Git externo, haz clic en Extraer de your-branch-name.

Confirmar cambios

Después de realizar un cambio en un espacio de trabajo de desarrollo, Dataform muestra la opción Commit. Puedes confirmar todos los cambios locales o los archivos seleccionados.

En el diálogo New commit, Dataform muestra los cambios no confirmados.

Para confirmar los cambios de tu lugar de trabajo de desarrollo en tu repositorio, sigue estos pasos:

  1. En la página Dataform, selecciona un repositorio.
  2. En la página del repositorio, selecciona un espacio de trabajo de desarrollo.
  3. En la página del espacio de trabajo de desarrollo, haz clic en Confirmar.
  4. En el panel Confirmación nueva, haz lo siguiente:

    1. En el campo Agrega un mensaje de confirmación, ingresa una descripción para tu confirmación.
    2. Selecciona los archivos modificados que deseas confirmar.

      Si no seleccionas ningún archivo, Dataform confirmará todos los cambios locales. Puedes filtrar los archivos modificados por estado, nombre y ruta de acceso.

    3. Haz clic en Confirmar todos los cambios o en Confirmar X cambios.

      El nombre del botón depende de los archivos que selecciones para confirmar.

Envía los cambios

Dataform muestra la opción Push después de que confirmes los cambios. Para enviar los cambios desde tu espacio de trabajo de desarrollo al repositorio, sigue estos pasos:

  1. En la página Dataform, selecciona un repositorio.
  2. En la página del repositorio, selecciona un espacio de trabajo de desarrollo.
  3. Confirma los cambios.
  4. En la página del espacio de trabajo de desarrollo, haz lo siguiente:
    1. Si estás en un repositorio de Dataform, haz clic en Enviar a la rama predeterminada.
    2. Si estás en un repositorio conectado a un repositorio de Git externo, haz clic en Enviar a your-branch-name.

Revertir los cambios no confirmados

Para revertir los cambios no confirmados, sigue estos pasos:

  1. En la página Dataform, selecciona un repositorio.
  2. En la página del repositorio, selecciona un espacio de trabajo de desarrollo.
  3. Sobre el panel Archivos, haz clic en el menú Más y, luego, selecciona Revert to last commit.

Cómo resolver conflictos de combinación

Puede ocurrir un conflicto de combinación cuando un cambio local en tu lugar de trabajo de desarrollo no es compatible con un cambio que se realizó en la rama de seguimiento predeterminada de tu repositorio. Los conflictos de combinación suelen ocurrir cuando varios usuarios editan el mismo archivo de forma simultánea.

Por lo general, se produce un conflicto de combinación cuando extraes datos de una rama después de que otro usuario envió un cambio conflictivo a la misma rama. Debes resolver un conflicto de combinación de forma manual editando el archivo afectado.

En la siguiente muestra de código, se muestra un conflicto de combinación en un archivo SQLX:

    <<<<<<< HEAD
    SELECT 1 as CustomerOrders
    =======
    SELECT 1 as Orders
    >>>>>>> refs/heads/main

Para resolver un conflicto de combinación, sigue estos pasos:

  1. En el panel Archivos de tu espacio de trabajo de desarrollo, selecciona un archivo afectado.
  2. Edita el archivo con los cambios que elijas.
  3. Confirma los cambios.
  4. Opcional: Envía los cambios.

¿Qué sigue?