Escrituras con capacidad de procesamiento optimizada

En esta página, se describe cómo configurar el tiempo máximo de retraso de confirmación (escritura) para y optimizar la capacidad de procesamiento de escritura en Spanner.

Descripción general

Para garantizar la coherencia de los datos, Spanner envía solicitudes de escritura a y todas las réplicas de votación en la base de datos. Este proceso de replicación puede tener sobrecarga de procesamiento. Para obtener más información, consulta Replicación:

Las escrituras optimizadas para la capacidad de procesamiento ofrecen la opción de amortizar estos cálculos. de costos ejecutando un grupo de operaciones de escritura en conjunto. Para ello, Spanner introduce un pequeño retraso y recopila un grupo de operaciones de escritura que deben enviarse a los mismos participantes votantes. La ejecución de escrituras en este puede proporcionar mejoras sustanciales en la capacidad de procesamiento a costa de de aumento en la latencia.

Comportamiento predeterminado

Si no estableces un tiempo de retraso de confirmación, Spanner podría establecer un si considera que eso amortizará el costo de tus escrituras.

Casos de uso habituales

Puedes configurar manualmente el tiempo de retraso de las solicitudes de escritura según tu las necesidades de la aplicación. También puedes inhabilitar los retrasos en las confirmaciones altamente sensible a la latencia configurando el tiempo máximo de retraso de confirmación en 0 ms

Si tienes una aplicación tolerante a la latencia y deseas optimizar la capacidad de procesamiento configurar un tiempo de retraso de confirmación mayor mejora la capacidad de procesamiento lo que aumenta la latencia en cada escritura. Por ejemplo, si cargas un una gran cantidad de datos y a la aplicación no le importa qué tan rápido Spanner escribe cualquier dato individual y, luego, puedes configurar la confirmación de retraso a un valor más largo, como 100 ms. Te recomendamos que comiences con de 100 ms y ajustarlo hacia arriba y hacia abajo hasta que las compensaciones de latencia y capacidad de procesamiento satisfagan sus necesidades. Para la mayoría de las aplicaciones, un valor entre 20 ms y 100 ms funciona mejor.

Si tienes una aplicación sensible a la latencia, la de Spanner también son sensibles a la latencia de forma predeterminada. Si tienes una carga de trabajo creciente, Spanner puede establecer una pequeña demora. Puedes probar valor de 0 ms para determinar si la latencia reducida a costa de un aumento la capacidad de procesamiento es razonable para tu aplicación.

Configura tiempos de retraso de confirmación combinados

Puedes configurar diferentes tiempos de retraso de confirmación máximo en subconjuntos de tus escrituras. Si lo haces, Spanner usará el tiempo de retraso más corto configurado para el conjunto de escrituras. Sin embargo, recomendamos elegir un solo valor para la mayoría de los usos. ya que esto genera un comportamiento más predecible.

Limitaciones

Puedes configurar un tiempo de retraso de confirmación entre 0 ms y 500 ms. Configura retrasos en la confirmación mayor que 500 ms generará un error.

Establece el retraso máximo de confirmación en las solicitudes de confirmación

El parámetro de retraso de confirmación máximo forma parte del método CommitRequest. Puedes acceder este método con la API de RPC API de REST, o usar la biblioteca cliente de Cloud Spanner.

Go


import (
	"context"
	"fmt"
	"io"
	"time"

	"cloud.google.com/go/spanner"
)

// maxCommitDelay sets the maximum commit delay for a transaction.
func maxCommitDelay(w io.Writer, db string) error {
	// db = `projects/<project>/instances/<instance-id>/database/<database-id>`
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return fmt.Errorf("maxCommitDelay.NewClient: %w", err)
	}
	defer client.Close()

	// Set the maximum commit delay to 100ms.
	// This is the amount of latency this request is willing to incur in order
	// to improve throughput. If this field is not set, Spanner assumes requests
	// are relatively latency sensitive and automatically determines an
	// appropriate delay time. You can specify a batching delay value between 0 and 500 ms.
	// The transaction will also return the commit statistics.
	commitDelay := 100 * time.Millisecond
	resp, err := client.ReadWriteTransactionWithOptions(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		stmt := spanner.Statement{
			SQL: `INSERT Singers (SingerId, FirstName, LastName)
					VALUES (111, 'Virginia', 'Watson')`,
		}
		rowCount, err := txn.Update(ctx, stmt)
		if err != nil {
			return err
		}
		fmt.Fprintf(w, "%d record(s) inserted.\n", rowCount)
		return nil
	}, spanner.TransactionOptions{CommitOptions: spanner.CommitOptions{MaxCommitDelay: &commitDelay, ReturnCommitStats: true}})
	if err != nil {
		return fmt.Errorf("maxCommitDelay.ReadWriteTransactionWithOptions: %w", err)
	}
	fmt.Fprintf(w, "%d mutations in transaction\n", resp.CommitStats.MutationCount)
	return nil
}

Node.js

// Imports the Google Cloud client library.
const {Spanner, protos} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client.
const spanner = new Spanner({
  projectId: projectId,
});

async function spannerSetMaxCommitDelay() {
  // Gets a reference to a Cloud Spanner instance and database.
  const instance = spanner.instance(instanceId);
  const database = instance.database(databaseId);

  database.runTransaction(async (err, transaction) => {
    if (err) {
      console.error(err);
      return;
    }
    try {
      const [rowCount] = await transaction.runUpdate({
        sql: 'INSERT Singers (SingerId, FirstName, LastName) VALUES (111, @firstName, @lastName)',
        params: {
          firstName: 'Virginia',
          lastName: 'Watson',
        },
      });

      console.log(
        `Successfully inserted ${rowCount} record into the Singers table.`
      );

      await transaction.commit({
        // The maximum amount of time to delay the transaction to improve
        // throughput.
        maxCommitDelay: protos.google.protobuf.Duration({
          seconds: 0, // 0 seconds
          nanos: 100000000, // 100,000,000 nanoseconds = 100 milliseconds
        }),
      });
    } catch (err) {
      console.error('ERROR:', err);
    } finally {
      // Close the database when finished.
      database.close();
    }
  });
}
spannerSetMaxCommitDelay();

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

def insert_singers(transaction):
    row_ct = transaction.execute_update(
        "INSERT Singers (SingerId, FirstName, LastName) "
        " VALUES (111, 'Grace', 'Bennis')"
    )

    print("{} record(s) inserted.".format(row_ct))

database.run_in_transaction(
    insert_singers, max_commit_delay=datetime.timedelta(milliseconds=100)
)

Ruby

require "google/cloud/spanner"

##
# This is a snippet for showcasing how to pass max_commit_delay in  commit_options.
#
# @param project_id  [String] The ID of the Google Cloud project.
# @param instance_id [String] The ID of the spanner instance.
# @param database_id [String] The ID of the database.
#
def spanner_set_max_commit_delay project_id:, instance_id:, database_id:
  # Instantiates a client
  spanner = Google::Cloud::Spanner.new project: project_id
  client  = spanner.client instance_id, database_id

  records = [
    { SingerId: 1, AlbumId: 1, MarketingBudget: 200_000 },
    { SingerId: 2, AlbumId: 2, MarketingBudget: 400_000 }
  ]
  # max_commit_delay is the amount of latency in millisecond, this request
  # is willing to incur in order to improve throughput.
  # The commit delay must be at least 0ms and at most 500ms.
  # Default value is nil.
  commit_options = {
    return_commit_stats: true,
    max_commit_delay: 100
  }
  resp = client.upsert "Albums", records, commit_options: commit_options
  puts "Updated data with #{resp.stats.mutation_count} mutations."
end

Supervisa la latencia de las solicitudes de escritura

Puedes supervisar el uso de CPU y la latencia de Spanner Consola de Google Cloud Cuando estableces un tiempo de retraso mayor para las solicitudes de escritura, Es posible que observes el uso de CPU disminuyen, mientras que la latencia aumenta. Para aprender sobre la latencia en Solicitudes de Spanner, consulta Captura y visualiza la latencia de solicitud a la API de Spanner.