Operaciones de escritura optimizadas para la capacidad de procesamiento

En esta página, se describe cómo configurar el tiempo de demora máximo de confirmación (escritura) para optimizar la capacidad de procesamiento de escritura en Spanner.

Descripción general

Para garantizar la coherencia de los datos, Spanner envía solicitudes de escritura a todas las réplicas de votación de la base de datos. Este proceso de replicación puede tener una sobrecarga computacional. Para obtener más información, consulta Replicación.

Las operaciones de escritura optimizadas para la capacidad de procesamiento ofrecen la opción de amortizar estos costos de procesamiento mediante la ejecución de un grupo de operaciones de escritura en conjunto. Para ello, Spanner introduce una pequeña demora y recopila un grupo de operaciones de escritura que se deben enviar a los mismos participantes de la votación. Ejecutar operaciones de escritura de esta manera puede proporcionar mejoras sustanciales en la capacidad de procesamiento a costa de una latencia ligeramente mayor.

Comportamiento predeterminado

Si no estableces un tiempo de demora de confirmación, Spanner podría establecer una demora pequeña por ti si considera que eso amortizará el costo de tus operaciones de escritura.

Casos de uso habituales

Puedes configurar manualmente el tiempo de demora de tus solicitudes de escritura según las necesidades de tu aplicación. También puedes inhabilitar las demoras de confirmación para las aplicaciones que son muy sensibles a la latencia si estableces el tiempo máximo de demora de confirmación en 0 ms.

Si tienes una aplicación tolerante a la latencia y deseas optimizar la capacidad de procesamiento, establecer un tiempo de demora de confirmación más largo mejora significativamente la capacidad de procesamiento, a la vez que genera una latencia más alta para cada operación de escritura. Por ejemplo, si cargas de forma masiva una gran cantidad de datos y a la aplicación no le importa la rapidez con la que Spanner escribe datos individuales, puedes establecer el tiempo de demora de confirmación en un valor más largo, como 100 ms. Te recomendamos que comiences con un valor de 100 ms y, luego, lo ajustes hacia arriba y hacia abajo hasta que las compensaciones de latencia y rendimiento satisfagan tus necesidades. En la mayoría de las aplicaciones, un valor entre 20 ms y 100 ms funciona mejor.

Si tienes una aplicación sensible a la latencia, Spanner también lo será de forma predeterminada. Si tienes una carga de trabajo con picos, es posible que Spanner establezca una pequeña demora. Puedes experimentar con la configuración de un valor de 0 ms para determinar si la reducción de la latencia a costa de un aumento de la capacidad de procesamiento es razonable para tu aplicación.

Establece tiempos de demora de confirmación mixtos

Puedes configurar diferentes tiempos de demora de confirmación máxima en subconjuntos de tus operaciones de escritura. Si lo haces, Spanner usa el tiempo de demora más corto configurado para el conjunto de operaciones de escritura. Sin embargo, te recomendamos que elijas un solo valor para la mayoría de los casos de uso, ya que esto genera un comportamiento más predecible.

Limitaciones

Puedes establecer un tiempo de demora de confirmación entre 0 y 500 ms. Si configuras demoras de confirmación superiores a 500 ms, se produce un error.

Establece la demora máxima de confirmación en las solicitudes de confirmación

El parámetro de demora de confirmación máxima forma parte del método CommitRequest. Puedes acceder a este método con la API de RPC, la API de REST o la biblioteca cliente de Cloud Spanner.

Go


import (
	"context"
	"fmt"
	"io"
	"time"

	"cloud.google.com/go/spanner"
)

// maxCommitDelay sets the maximum commit delay for a transaction.
func maxCommitDelay(w io.Writer, db string) error {
	// db = `projects/<project>/instances/<instance-id>/database/<database-id>`
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return fmt.Errorf("maxCommitDelay.NewClient: %w", err)
	}
	defer client.Close()

	// Set the maximum commit delay to 100ms.
	// This is the amount of latency this request is willing to incur in order
	// to improve throughput. If this field is not set, Spanner assumes requests
	// are relatively latency sensitive and automatically determines an
	// appropriate delay time. You can specify a batching delay value between 0 and 500 ms.
	// The transaction will also return the commit statistics.
	commitDelay := 100 * time.Millisecond
	resp, err := client.ReadWriteTransactionWithOptions(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		stmt := spanner.Statement{
			SQL: `INSERT Singers (SingerId, FirstName, LastName)
					VALUES (111, 'Virginia', 'Watson')`,
		}
		rowCount, err := txn.Update(ctx, stmt)
		if err != nil {
			return err
		}
		fmt.Fprintf(w, "%d record(s) inserted.\n", rowCount)
		return nil
	}, spanner.TransactionOptions{CommitOptions: spanner.CommitOptions{MaxCommitDelay: &commitDelay, ReturnCommitStats: true}})
	if err != nil {
		return fmt.Errorf("maxCommitDelay.ReadWriteTransactionWithOptions: %w", err)
	}
	fmt.Fprintf(w, "%d mutations in transaction\n", resp.CommitStats.MutationCount)
	return nil
}

Node.js

// Imports the Google Cloud client library.
const {Spanner, protos} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client.
const spanner = new Spanner({
  projectId: projectId,
});

async function spannerSetMaxCommitDelay() {
  // Gets a reference to a Cloud Spanner instance and database.
  const instance = spanner.instance(instanceId);
  const database = instance.database(databaseId);

  database.runTransaction(async (err, transaction) => {
    if (err) {
      console.error(err);
      return;
    }
    try {
      const [rowCount] = await transaction.runUpdate({
        sql: 'INSERT Singers (SingerId, FirstName, LastName) VALUES (111, @firstName, @lastName)',
        params: {
          firstName: 'Virginia',
          lastName: 'Watson',
        },
      });

      console.log(
        `Successfully inserted ${rowCount} record into the Singers table.`
      );

      await transaction.commit({
        // The maximum amount of time to delay the transaction to improve
        // throughput.
        maxCommitDelay: protos.google.protobuf.Duration({
          seconds: 0, // 0 seconds
          nanos: 100000000, // 100,000,000 nanoseconds = 100 milliseconds
        }),
      });
    } catch (err) {
      console.error('ERROR:', err);
    } finally {
      // Close the database when finished.
      database.close();
    }
  });
}
spannerSetMaxCommitDelay();

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

def insert_singers(transaction):
    row_ct = transaction.execute_update(
        "INSERT Singers (SingerId, FirstName, LastName) "
        " VALUES (111, 'Grace', 'Bennis')"
    )

    print("{} record(s) inserted.".format(row_ct))

database.run_in_transaction(
    insert_singers, max_commit_delay=datetime.timedelta(milliseconds=100)
)

Ruby

require "google/cloud/spanner"

##
# This is a snippet for showcasing how to pass max_commit_delay in  commit_options.
#
# @param project_id  [String] The ID of the Google Cloud project.
# @param instance_id [String] The ID of the spanner instance.
# @param database_id [String] The ID of the database.
#
def spanner_set_max_commit_delay project_id:, instance_id:, database_id:
  # Instantiates a client
  spanner = Google::Cloud::Spanner.new project: project_id
  client  = spanner.client instance_id, database_id

  records = [
    { SingerId: 1, AlbumId: 1, MarketingBudget: 200_000 },
    { SingerId: 2, AlbumId: 2, MarketingBudget: 400_000 }
  ]
  # max_commit_delay is the amount of latency in millisecond, this request
  # is willing to incur in order to improve throughput.
  # The commit delay must be at least 0ms and at most 500ms.
  # Default value is nil.
  commit_options = {
    return_commit_stats: true,
    max_commit_delay: 100
  }
  resp = client.upsert "Albums", records, commit_options: commit_options
  puts "Updated data with #{resp.stats.mutation_count} mutations."
end

Supervisa la latencia de las solicitudes de escritura

Puedes supervisar la utilización y la latencia de la CPU de Spanner con la consola deGoogle Cloud . Cuando establezcas un tiempo de demora más largo para tus solicitudes de escritura, es posible que veas una disminución en el uso de la CPU, mientras que la latencia aumenta. Para obtener información sobre la latencia en las solicitudes de Spanner, consulta Cómo capturar y visualizar la latencia de las solicitudes de la API de Spanner.