Compara DML y mutaciones

El lenguaje de manipulación de datos (DML) y las mutaciones son dos API en Cloud Spanner que puedes usar para modificar datos. Cada una ofrece características similares de manipulación de datos. En esta página, se comparan ambos enfoques.

¿Qué es el lenguaje de manipulación de datos (DML)?

El lenguaje de manipulación de datos (DML) en Cloud Spanner te permite manipular los datos de las tablas de tu base de datos mediante las instrucciones INSERT, UPDATE y DELETE. Puedes ejecutar declaraciones DML con las bibliotecas cliente, Cloud Console y gcloud spanner.

Cloud Spanner ofrece las siguientes dos implementaciones de ejecución de DML, cada una con propiedades diferentes.

  • DML estándar: Apto para cargas de trabajo estándar de procesamiento de transacciones en línea (OLTP)

    Para obtener más información, incluidas muestras de código, consulta Usa DML.

  • DML particionado: está diseñado para actualizaciones y eliminaciones masivas, como en los siguientes ejemplos.

    • Recolección de elementos no usados y limpieza periódicos. Por ejemplo, la eliminación de filas antiguas o la configuración de columnas como NULL.

    • El restablecimiento de columnas nuevas con valores predeterminados. Un ejemplo usa una declaración UPDATE para establecer el valor de una columna nueva como falso, donde ahora es NULL.

    Para obtener más información, incluidas las muestras de código, consulta Usa DML particionado.

¿Qué son las mutaciones?

Una mutación representa una secuencia de inserciones, actualizaciones y eliminaciones que Cloud Spanner aplica de forma atómica a diferentes filas y tablas en una base de datos. Puedes incluir operaciones que se apliquen a diferentes filas o a diferentes tablas en una mutación. Después de definir una o más mutaciones que contengan una o más escrituras, debes aplicarlas para confirmar las escrituras. Cada cambio se aplica en el orden en que se agregaron a la mutación.

Para obtener más información, incluidas las muestras de código, consulta Cómo insertar, actualizar y borrar datos mediante mutaciones.

Comparación de atributos entre DML y mutaciones

En la siguiente tabla, se resume la compatibilidad con DML y mutación de las operaciones y funciones comunes de la base de datos.

Operaciones DML Mutaciones
Inserta datos Admitido Admitido
Borrar datos Admitido Admitido
Actualizar datos Admitido Admitido
Lectura de tus escrituras (RYW) Admitido No compatible
Upsert (insertar o actualizar) No compatible Admitido
Sintaxis de SQL Admitido No compatible
Verificación de restricciones Después de cada instrucción En el momento de la confirmación

El DML y las mutaciones difieren en la compatibilidad con las siguientes funciones.

  • Semántica de lectura de tus escrituras: La lectura de tus escrituras se refiere a la lectura de resultados no confirmados dentro de una transacción activa. Los cambios que realices mediante declaraciones DML serán visibles para las declaraciones posteriores en la misma transacción. Esto es diferente de usar mutaciones, donde los cambios no son visibles en ninguna lectura (incluidas las lecturas realizadas en la misma transacción) hasta que la transacción se confirma. Esto se debe a que las mutaciones de una transacción se almacenan en el búfer del lado del cliente (de forma local) y se envían al servidor como parte de la operación de confirmación. Como resultado, las mutaciones de la solicitud de confirmación no son visibles para las declaraciones de SQL o DML dentro de la misma transacción.

  • Upsert: DML no admite una operación upsert nativa, una operación que inserta filas en una tabla de la base de datos si aún no existen, o las actualiza si lo hacen. Sin embargo, existe una operación insert_or_update en el mundo de las mutaciones. Las aplicaciones que usan DML pueden evitar esta limitación si leen primero la fila y, luego, usan la declaración DML adecuada.

  • Verificación de restricciones: Cloud Spanner verifica las restricciones después de cada declaración DML. Esto es diferente del uso de mutaciones, en las que Cloud Spanner almacena en búfer las mutaciones en el cliente hasta la confirmación y verifica las restricciones en el momento de la confirmación. La evaluación de las restricciones después de cada declaración DML permite que Cloud Spanner garantice que los datos que muestra una consulta posterior en la misma transacción muestren datos coherentes con el esquema.

  • Sintaxis de SQL: El DML proporciona una manera convencional de manipular datos. Puedes reutilizar las habilidades de SQL para alterar los datos mediante la API de DML.

Práctica recomendada: evita mezclar DML y mutaciones en la misma transacción

Si una transacción contiene mutaciones y declaraciones DML en la solicitud de confirmación, Cloud Spanner ejecuta las declaraciones DML antes de las mutaciones. Para evitar tener que dar cuenta del orden de ejecución en el código de tu biblioteca cliente, debes usar las declaraciones DML o las mutaciones en una sola transacción, pero no en ambas.

En el siguiente ejemplo de Java, se ilustra un comportamiento potencialmente sorprendente. El código inserta dos filas en los álbumes mediante la API de mutación. Luego, el fragmento llama a executeUpdate() para actualizar las filas nuevas insertadas y llama a executeQuery() para leer los álbumes actualizados.

static void updateMarketingBudget(DatabaseClient dbClient) {
  dbClient
      .readWriteTransaction()
      .run(
          new TransactionCallable<Void>() {
            @Override
            public Void run(TransactionContext transaction) throws Exception {
               transaction.buffer(
                    Mutation.newInsertBuilder("Albums")
                        .set("SingerId")
                        .to(1)
                        .set("AlbumId")
                        .to(1)
                        .set("AlbumTitle")
                        .to("Total Junk")
                        .set("MarketingBudget")
                        .to(800)
                        .build());
               transaction.buffer(
                    Mutation.newInsertBuilder("Albums")
                        .set("SingerId")
                        .to(1)
                        .set("AlbumId")
                        .to(2)
                        .set("AlbumTitle")
                        .to("Go Go Go")
                        .set("MarketingBudget")
                        .to(200)
                        .build());

                // This UPDATE will not include the Albums inserted above.
                String sql =
                  "UPDATE Albums SET MarketingBudget = MarketingBudget * 2"
                      + " WHERE SingerId = 1";
                long rowCount = transaction.executeUpdate(Statement.of(sql));
                System.out.printf("%d records updated.\n", rowCount);

                // Read a newly updated record.
                sql =
                  "SELECT SingerId, AlbumId, AlbumTitle FROM Albums"
                      + " WHERE SingerId = 1 AND MarketingBudget < 1000";
                ResultSet resultSet =
                                 transaction.executeQuery(Statement.of(sql));
                while (resultSet.next()) {
                   System.out.printf(
                        "%s %s\n",
                        resultSet.getString("FirstName"),
                        resultSet.getString("LastName"));
                }
                return null;
              }
            });
}

Si ejecutara este código, verá 0 logs updated. ¿Por qué? Esto sucede porque los cambios que realizamos mediante mutaciones no son visibles en las declaraciones posteriores hasta que se confirma la transacción. Idealmente, deberíamos haber almacenado en búfer las escrituras solo al final de la transacción.

Próximos pasos