Escrituras con capacidad de procesamiento optimizada

En esta página, se describe cómo configurar el tiempo máximo de retraso de confirmación (escritura) para optimizar la capacidad de procesamiento de escritura en Spanner.

Descripción general

Para garantizar la coherencia de los datos, Spanner envía solicitudes de escritura a todas las réplicas de votación en la base de datos. Este proceso de replicación puede tener una sobrecarga computacional. Para obtener más información, consulta Replicación.

Las escrituras optimizadas para la capacidad de procesamiento proporcionan la opción de amortizar estos costos de procesamiento mediante la ejecución de un grupo de escrituras juntas. Para ello, Spanner introduce un pequeño retraso y recopila un grupo de operaciones de escritura que se deben enviar a los mismos participantes de la votación. Ejecutar escrituras de esta manera puede proporcionar mejoras sustanciales de capacidad de procesamiento a costa de un aumento ligeramente mayor.

Comportamiento predeterminado

Si no estableces un tiempo de retraso de confirmación, Spanner podría establecer un pequeño retraso por ti si considera que amortizará el costo de las operaciones de escritura.

Casos de uso habituales

Puedes configurar manualmente el tiempo de retraso de las solicitudes de escritura según las necesidades de tu aplicación. También puedes inhabilitar los retrasos de confirmación para aplicaciones que son muy sensibles a la latencia. Para ello, configura el tiempo máximo de retraso de confirmación en 0 ms.

Si tienes una aplicación tolerante a la latencia y deseas optimizar la capacidad de procesamiento, configurar un tiempo de retraso de confirmación más largo mejora de forma significativa la capacidad de procesamiento y, al mismo tiempo, aumenta la latencia para cada escritura. Por ejemplo, si cargas una gran cantidad de datos de forma masiva y a la aplicación no le interesa la rapidez con la que Spanner escribe datos individuales, puedes establecer el tiempo de retraso de confirmación en un valor más largo, como 100 ms. Te recomendamos que comiences con un valor de 100 ms y, luego, aumentes o disminuyas hasta que las compensaciones de latencia y capacidad de procesamiento satisfagan tus necesidades. Para la mayoría de las aplicaciones, un valor entre 20 ms y 100 ms funciona mejor.

Si tienes una aplicación sensible a la latencia, la de Spanner también es sensible a la latencia de forma predeterminada. Si tienes una carga de trabajo con aumento en la escala, Spanner puede establecer una pequeña demora. Puedes experimentar y establecer un valor de 0 ms para determinar si la latencia reducida a costa de una mayor capacidad de procesamiento es razonable para tu aplicación.

Configura tiempos de retraso de confirmación combinados

Puedes configurar diferentes tiempos de retraso de confirmación máximo en subconjuntos de tus escrituras. Si lo haces, Spanner usará el tiempo de retraso más corto configurado para el conjunto de escrituras. Sin embargo, recomendamos elegir un solo valor para la mayoría de los casos prácticos, ya que esto genera un comportamiento más predecible.

Limitaciones

Puedes establecer un tiempo de retraso de confirmación entre 0 y 500 ms. La configuración de retrasos de confirmación superiores a 500 ms genera un error.

Establece el retraso máximo de confirmación en las solicitudes de confirmación

El parámetro de retraso de confirmación máximo forma parte del método CommitRequest. Puedes acceder a este método con la API de RPC, la API de REST o la biblioteca cliente de Cloud Spanner.

Go


import (
	"context"
	"fmt"
	"io"
	"time"

	"cloud.google.com/go/spanner"
)

// maxCommitDelay sets the maximum commit delay for a transaction.
func maxCommitDelay(w io.Writer, db string) error {
	// db = `projects/<project>/instances/<instance-id>/database/<database-id>`
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return fmt.Errorf("maxCommitDelay.NewClient: %w", err)
	}
	defer client.Close()

	// Set the maximum commit delay to 100ms.
	// This is the amount of latency this request is willing to incur in order
	// to improve throughput. If this field is not set, Spanner assumes requests
	// are relatively latency sensitive and automatically determines an
	// appropriate delay time. You can specify a batching delay value between 0 and 500 ms.
	// The transaction will also return the commit statistics.
	commitDelay := 100 * time.Millisecond
	resp, err := client.ReadWriteTransactionWithOptions(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		stmt := spanner.Statement{
			SQL: `INSERT Singers (SingerId, FirstName, LastName)
					VALUES (111, 'Virginia', 'Watson')`,
		}
		rowCount, err := txn.Update(ctx, stmt)
		if err != nil {
			return err
		}
		fmt.Fprintf(w, "%d record(s) inserted.\n", rowCount)
		return nil
	}, spanner.TransactionOptions{CommitOptions: spanner.CommitOptions{MaxCommitDelay: &commitDelay, ReturnCommitStats: true}})
	if err != nil {
		return fmt.Errorf("maxCommitDelay.ReadWriteTransactionWithOptions: %w", err)
	}
	fmt.Fprintf(w, "%d mutations in transaction\n", resp.CommitStats.MutationCount)
	return nil
}

Node.js

// Imports the Google Cloud client library.
const {Spanner, protos} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client.
const spanner = new Spanner({
  projectId: projectId,
});

async function spannerSetMaxCommitDelay() {
  // Gets a reference to a Cloud Spanner instance and database.
  const instance = spanner.instance(instanceId);
  const database = instance.database(databaseId);

  database.runTransaction(async (err, transaction) => {
    if (err) {
      console.error(err);
      return;
    }
    try {
      const [rowCount] = await transaction.runUpdate({
        sql: 'INSERT Singers (SingerId, FirstName, LastName) VALUES (111, @firstName, @lastName)',
        params: {
          firstName: 'Virginia',
          lastName: 'Watson',
        },
      });

      console.log(
        `Successfully inserted ${rowCount} record into the Singers table.`
      );

      await transaction.commit({
        // The maximum amount of time to delay the transaction to improve
        // throughput.
        maxCommitDelay: protos.google.protobuf.Duration({
          seconds: 0, // 0 seconds
          nanos: 100000000, // 100,000,000 nanoseconds = 100 milliseconds
        }),
      });
    } catch (err) {
      console.error('ERROR:', err);
    } finally {
      // Close the database when finished.
      database.close();
    }
  });
}
spannerSetMaxCommitDelay();

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

def insert_singers(transaction):
    row_ct = transaction.execute_update(
        "INSERT Singers (SingerId, FirstName, LastName) "
        " VALUES (111, 'Grace', 'Bennis')"
    )

    print("{} record(s) inserted.".format(row_ct))

database.run_in_transaction(
    insert_singers, max_commit_delay=datetime.timedelta(milliseconds=100)
)

Rita

require "google/cloud/spanner"

##
# This is a snippet for showcasing how to pass max_commit_delay in  commit_options.
#
# @param project_id  [String] The ID of the Google Cloud project.
# @param instance_id [String] The ID of the spanner instance.
# @param database_id [String] The ID of the database.
#
def spanner_set_max_commit_delay project_id:, instance_id:, database_id:
  # Instantiates a client
  spanner = Google::Cloud::Spanner.new project: project_id
  client  = spanner.client instance_id, database_id

  records = [
    { SingerId: 1, AlbumId: 1, MarketingBudget: 200_000 },
    { SingerId: 2, AlbumId: 2, MarketingBudget: 400_000 }
  ]
  # max_commit_delay is the amount of latency in millisecond, this request
  # is willing to incur in order to improve throughput.
  # The commit delay must be at least 0ms and at most 500ms.
  # Default value is nil.
  commit_options = {
    return_commit_stats: true,
    max_commit_delay: 100
  }
  resp = client.upsert "Albums", records, commit_options: commit_options
  puts "Updated data with #{resp.stats.mutation_count} mutations."
end

Supervisa la latencia de las solicitudes de escritura

Puedes supervisar el uso de CPU y la latencia de Spanner con la consola de Google Cloud. Cuando configures un tiempo de retraso más largo para las solicitudes de escritura, es posible que disminuya el uso de CPU y la latencia aumente. Para obtener más información sobre la latencia en las solicitudes de Spanner, consulta Captura y visualiza la latencia de las solicitudes a la API de Spanner.