Operaciones de escritura optimizadas para la capacidad de procesamiento

En esta página, se describe cómo configurar el tiempo de demora máximo de confirmación (escritura) para optimizar la capacidad de procesamiento de escritura en Spanner.

Descripción general

Para garantizar la coherencia de los datos, Spanner envía solicitudes de escritura a todas las réplicas de votación de la base de datos. Este proceso de replicación puede tener una sobrecarga computacional. Para obtener más información, consulta Replicación.

Las escrituras optimizadas para la capacidad de procesamiento proporcionan la opción de amortizar estos cálculos. de costos ejecutando un grupo de operaciones de escritura en conjunto. Para ello, Spanner introduce una pequeña demora y recopila un grupo de operaciones de escritura que se deben enviar a los mismos participantes de la votación. Ejecutar escrituras en este puede proporcionar mejoras sustanciales en la capacidad de procesamiento a costa de de aumento en la latencia.

Comportamiento predeterminado

Si no estableces un tiempo de demora de confirmación, Spanner podría establecer una demora pequeña por ti si considera que eso amortizará el costo de tus operaciones de escritura.

Casos de uso habituales

Puedes configurar manualmente el tiempo de retraso de las solicitudes de escritura según tu las necesidades de la aplicación. También puedes inhabilitar los retrasos en las confirmaciones altamente sensible a la latencia configurando el tiempo máximo de retraso de confirmación en 0 ms

Si tienes una aplicación tolerante a la latencia y deseas optimizar la capacidad de procesamiento, establecer un tiempo de demora de confirmación más largo mejora significativamente la capacidad de procesamiento, a la vez que genera una latencia más alta para cada operación de escritura. Por ejemplo, si cargas un una gran cantidad de datos y a la aplicación no le importa qué tan rápido Spanner escribe cualquier dato individual y, luego, puedes configurar la confirmación de retraso a un valor más largo, como 100 ms. Te recomendamos que comiences con de 100 ms y después ajustarlo hacia arriba y hacia abajo hasta que las compensaciones de latencia y capacidad de procesamiento satisfagan sus necesidades. Para la mayoría de las aplicaciones, un valor entre 20 ms y 100 ms funciona mejor.

Si tienes una aplicación sensible a la latencia, Spanner también es sensible a la latencia de forma predeterminada. Si tienes una carga de trabajo con picos, es posible que Spanner establezca una pequeña demora. Puedes experimentar con la configuración de un valor de 0 ms para determinar si la reducción de la latencia a costa de un aumento de la capacidad de procesamiento es razonable para tu aplicación.

Establece tiempos de demora de confirmación mixtos

Puedes configurar diferentes tiempos de retraso máximos de confirmación en subconjuntos de tus escrituras. Si lo haces, Spanner usa el tiempo de demora más corto configurado para el conjunto de operaciones de escritura. Sin embargo, te recomendamos que elijas un solo valor para la mayoría de los casos de uso, ya que esto genera un comportamiento más predecible.

Limitaciones

Puedes establecer un tiempo de demora de confirmación entre 0 y 500 ms. Si estableces demoras de confirmación superiores a 500 ms, se producirá un error.

Establece la demora máxima de confirmación en las solicitudes de confirmación

El parámetro de demora de confirmación máxima forma parte del método CommitRequest. Puedes acceder a este método con la API de RPC, la API de REST o la biblioteca cliente de Cloud Spanner.

Go


import (
	"context"
	"fmt"
	"io"
	"time"

	"cloud.google.com/go/spanner"
)

// maxCommitDelay sets the maximum commit delay for a transaction.
func maxCommitDelay(w io.Writer, db string) error {
	// db = `projects/<project>/instances/<instance-id>/database/<database-id>`
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return fmt.Errorf("maxCommitDelay.NewClient: %w", err)
	}
	defer client.Close()

	// Set the maximum commit delay to 100ms.
	// This is the amount of latency this request is willing to incur in order
	// to improve throughput. If this field is not set, Spanner assumes requests
	// are relatively latency sensitive and automatically determines an
	// appropriate delay time. You can specify a batching delay value between 0 and 500 ms.
	// The transaction will also return the commit statistics.
	commitDelay := 100 * time.Millisecond
	resp, err := client.ReadWriteTransactionWithOptions(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		stmt := spanner.Statement{
			SQL: `INSERT Singers (SingerId, FirstName, LastName)
					VALUES (111, 'Virginia', 'Watson')`,
		}
		rowCount, err := txn.Update(ctx, stmt)
		if err != nil {
			return err
		}
		fmt.Fprintf(w, "%d record(s) inserted.\n", rowCount)
		return nil
	}, spanner.TransactionOptions{CommitOptions: spanner.CommitOptions{MaxCommitDelay: &commitDelay, ReturnCommitStats: true}})
	if err != nil {
		return fmt.Errorf("maxCommitDelay.ReadWriteTransactionWithOptions: %w", err)
	}
	fmt.Fprintf(w, "%d mutations in transaction\n", resp.CommitStats.MutationCount)
	return nil
}

Node.js

// Imports the Google Cloud client library.
const {Spanner, protos} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client.
const spanner = new Spanner({
  projectId: projectId,
});

async function spannerSetMaxCommitDelay() {
  // Gets a reference to a Cloud Spanner instance and database.
  const instance = spanner.instance(instanceId);
  const database = instance.database(databaseId);

  database.runTransaction(async (err, transaction) => {
    if (err) {
      console.error(err);
      return;
    }
    try {
      const [rowCount] = await transaction.runUpdate({
        sql: 'INSERT Singers (SingerId, FirstName, LastName) VALUES (111, @firstName, @lastName)',
        params: {
          firstName: 'Virginia',
          lastName: 'Watson',
        },
      });

      console.log(
        `Successfully inserted ${rowCount} record into the Singers table.`
      );

      await transaction.commit({
        // The maximum amount of time to delay the transaction to improve
        // throughput.
        maxCommitDelay: protos.google.protobuf.Duration({
          seconds: 0, // 0 seconds
          nanos: 100000000, // 100,000,000 nanoseconds = 100 milliseconds
        }),
      });
    } catch (err) {
      console.error('ERROR:', err);
    } finally {
      // Close the database when finished.
      database.close();
    }
  });
}
spannerSetMaxCommitDelay();

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

def insert_singers(transaction):
    row_ct = transaction.execute_update(
        "INSERT Singers (SingerId, FirstName, LastName) "
        " VALUES (111, 'Grace', 'Bennis')"
    )

    print("{} record(s) inserted.".format(row_ct))

database.run_in_transaction(
    insert_singers, max_commit_delay=datetime.timedelta(milliseconds=100)
)

Ruby

require "google/cloud/spanner"

##
# This is a snippet for showcasing how to pass max_commit_delay in  commit_options.
#
# @param project_id  [String] The ID of the Google Cloud project.
# @param instance_id [String] The ID of the spanner instance.
# @param database_id [String] The ID of the database.
#
def spanner_set_max_commit_delay project_id:, instance_id:, database_id:
  # Instantiates a client
  spanner = Google::Cloud::Spanner.new project: project_id
  client  = spanner.client instance_id, database_id

  records = [
    { SingerId: 1, AlbumId: 1, MarketingBudget: 200_000 },
    { SingerId: 2, AlbumId: 2, MarketingBudget: 400_000 }
  ]
  # max_commit_delay is the amount of latency in millisecond, this request
  # is willing to incur in order to improve throughput.
  # The commit delay must be at least 0ms and at most 500ms.
  # Default value is nil.
  commit_options = {
    return_commit_stats: true,
    max_commit_delay: 100
  }
  resp = client.upsert "Albums", records, commit_options: commit_options
  puts "Updated data with #{resp.stats.mutation_count} mutations."
end

Supervisa la latencia de las solicitudes de escritura

Puedes supervisar la utilización y la latencia de la CPU de Spanner con la console de Google Cloud. Cuando estableces un tiempo de retraso mayor para las solicitudes de escritura, Es posible que observes el uso de CPU disminuyen, mientras que la latencia aumenta. Para aprender sobre la latencia en Solicitudes de Spanner, consulta Captura y visualiza la latencia de solicitud a la API de Spanner.