Comparar el DML y las mutaciones

El lenguaje de manipulación de datos (DML) y las mutaciones son dos APIs de Spanner que puedes usar para modificar datos. Cada uno ofrece funciones similares de manipulación de datos. En esta página, se comparan ambos enfoques.

¿Qué es el lenguaje de manipulación de datos (DML)?

El lenguaje de manipulación de datos (DML) en Spanner te permite manipular los datos en las tablas de la base de datos mediante declaraciones INSERT, UPDATE y DELETE. Puedes ejecutar declaraciones DML mediante las bibliotecas cliente, la consola de Google Cloud y gcloud spanner.

Spanner ofrece las siguientes dos implementaciones de ejecución de DML, cada una con propiedades diferentes.

  • DML estándar: adecuado para cargas de trabajo de procesamiento de transacciones en línea (OLTP) estándar.

    Para obtener más información, incluidas muestras de código, consulta Cómo usar DML

  • DML particionado: diseñado para actualizaciones y eliminaciones masivas, como en los siguientes ejemplos.

    • Recolección de elementos no usados y limpieza periódicos. Por ejemplo, la eliminación de filas antiguas o la configuración de columnas como NULL.

    • El restablecimiento de columnas nuevas con valores predeterminados. Un ejemplo es usar una declaración UPDATE para establecer el valor de una columna nueva como Falso cuando sea NULL.

    Para obtener más información, incluidas muestras de código, consulta Usa DML particionado.

    Puedes usar escrituras por lotes para una gran cantidad de operaciones de escritura sin operaciones de lectura que no requieran transacciones atómicas. Para obtener más información, consulta Modifica datos con escrituras por lotes.

¿Qué son las mutaciones?

Una mutación representa una secuencia de inserciones, actualizaciones y eliminaciones que Spanner aplica de forma atómica a diferentes filas y tablas de una base de datos. Puedes incluir operaciones que se apliquen a diferentes filas o tablas en una mutación. Después de definir una o más mutaciones que contienen una o más escrituras, debes aplicarla para confirmarlas. Cada cambio se aplica en el orden en que se agregó a la mutación.

Para obtener más información, incluidas muestras de código, consulta Inserta, actualiza y borra datos mediante mutaciones.

Comparación de atributos entre DML y mutaciones

En la siguiente tabla, se resume la compatibilidad con el DML y la mutación de las operaciones y las características comunes de las bases de datos.

Operaciones DML Mutaciones
Inserta datos Admitido Admitido
Borrar datos Admitido Admitido
Actualizar datos Admitido Admitido
Insertar o ignorar datos Admitido No compatible
Lee tus escrituras (RYW) Admitido No compatible
Cómo insertar o actualizar datos (Upsert) Admitido Admitido
Sintaxis de SQL Admitido No compatible
Comprobación de restricciones Después de cada declaración En el momento de la confirmación

El DML y las mutaciones difieren en su compatibilidad con las siguientes funciones:

  • Lee tus escrituras: Lee los resultados sin confirmar dentro de una transacción activa. Los cambios que realices con las declaraciones DML serán visibles para las declaraciones posteriores de la misma transacción. Esto es diferente a usar mutaciones, en las que los cambios no son visibles en ninguna lectura (incluidas las lecturas realizadas en la misma transacción) hasta que se confirme la transacción. Esto se debe a que las mutaciones en una transacción se almacenan en el búfer del lado del cliente (de forma local) y se envían al servidor como parte de la operación de confirmación. Como resultado, las mutaciones de la solicitud de confirmación no son visibles para las declaraciones DML o SQL dentro de la misma transacción.

  • Verificación de restricciones: Spanner verifica las restricciones después de cada declaración DML. Esto es diferente del uso de mutaciones, en el que Spanner almacena en el búfer las mutaciones del cliente hasta la confirmación y verifica las restricciones en el momento de la confirmación. La evaluación de las restricciones después de cada declaración DML le permite a Spanner garantizar que los datos que muestra una consulta posterior en la misma transacción muestren datos coherentes con el esquema.

  • Sintaxis de SQL: El DML proporciona una forma convencional de manipular datos. Puedes reutilizar las habilidades de SQL para modificar los datos mediante la API de DML.

Práctica recomendada: Evita mezclar el DML y la mutación en la misma transacción

Si una transacción contiene mutaciones y declaraciones DML en la solicitud de confirmación, Spanner ejecuta las declaraciones DML antes de las mutaciones. Para evitar tener que dar cuenta del orden de ejecución en el código de tu biblioteca cliente, debes usar las declaraciones DML o las mutaciones en una sola transacción, pero no en ambas.

En el siguiente ejemplo de Java, se ilustra un comportamiento potencialmente sorprendente. El código inserta dos filas en álbumes mediante la API de mutación. Luego, el fragmento llama a executeUpdate() para actualizar las filas recién insertadas y llama a executeQuery() para leer los álbumes actualizados.

static void updateMarketingBudget(DatabaseClient dbClient) {
  dbClient
      .readWriteTransaction()
      .run(
          new TransactionCallable<Void>() {
            @Override
            public Void run(TransactionContext transaction) throws Exception {
               transaction.buffer(
                    Mutation.newInsertBuilder("Albums")
                        .set("SingerId")
                        .to(1)
                        .set("AlbumId")
                        .to(1)
                        .set("AlbumTitle")
                        .to("Total Junk")
                        .set("MarketingBudget")
                        .to(800)
                        .build());
               transaction.buffer(
                    Mutation.newInsertBuilder("Albums")
                        .set("SingerId")
                        .to(1)
                        .set("AlbumId")
                        .to(2)
                        .set("AlbumTitle")
                        .to("Go Go Go")
                        .set("MarketingBudget")
                        .to(200)
                        .build());

                // This UPDATE will not include the Albums inserted above.
                String sql =
                  "UPDATE Albums SET MarketingBudget = MarketingBudget * 2"
                      + " WHERE SingerId = 1";
                long rowCount = transaction.executeUpdate(Statement.of(sql));
                System.out.printf("%d records updated.\n", rowCount);

                // Read a newly updated record.
                sql =
                  "SELECT SingerId, AlbumId, AlbumTitle FROM Albums"
                      + " WHERE SingerId = 1 AND MarketingBudget < 1000";
                ResultSet resultSet =
                                 transaction.executeQuery(Statement.of(sql));
                while (resultSet.next()) {
                   System.out.printf(
                        "%s %s\n",
                        resultSet.getString("FirstName"),
                        resultSet.getString("LastName"));
                }
                return null;
              }
            });
}

Si ejecutaras este código, verías 0 registros actualizados. ¿Por qué? Esto sucede porque los cambios que realizamos con las mutaciones no son visibles para las declaraciones posteriores hasta que se confirme la transacción. Lo ideal sería que las escrituras se almacenaran en búfer solo al final de la transacción.

Próximos pasos