Opérations d'écriture optimisées pour le débit

Cette page explique comment configurer le délai maximal de commit (écriture) pour optimiser le débit en écriture dans Spanner.

Présentation

Pour assurer la cohérence des données, Spanner envoie des requêtes d'écriture à toutes les instances répliquées participant au vote dans la base de données. Ce processus de réplication peut entraîner une surcharge de calcul. Pour en savoir plus, consultez la page Réplication.

Les écritures optimisées pour le débit permettent d'amortir ces coûts de calcul en exécutant un groupe d'écritures ensemble. Pour ce faire, Spanner introduit un court délai et collecte un groupe d'écritures à envoyer aux mêmes participants votants. L'exécution des écritures de cette manière peut améliorer considérablement le débit, au prix d'une latence légèrement plus importante.

Comportement par défaut

Si vous ne définissez pas de délai de commit, Spanner peut définir un court délai à votre place s'il pense que cela amortir le coût de vos écritures.

Cas d'utilisation courants

Vous pouvez définir manuellement le délai de vos requêtes d'écriture en fonction des besoins de votre application. Vous pouvez également désactiver les délais de commit pour les applications très sensibles à la latence en définissant le délai de commit maximal sur 0 ms.

Si votre application tolère la latence et que vous souhaitez optimiser le débit, la définition d'un délai de commit plus long améliore considérablement le débit tout en entraînant une latence plus élevée pour chaque écriture. Par exemple, si vous effectuez le chargement groupé d'une grande quantité de données et que l'application ne se soucie pas de la vitesse à laquelle Spanner écrit des données individuelles, vous pouvez définir le délai de commit sur une valeur plus longue, telle que 100 ms. Nous vous recommandons de commencer par une valeur de 100 ms, puis d'ajuster la vitesse à la hausse ou à la baisse jusqu'à ce que les compromis en termes de latence et de débit répondent à vos besoins. Pour la plupart des applications, une valeur comprise entre 20 ms et 100 ms convient mieux.

Si vous avez une application sensible à la latence, Spanner l'est également par défaut. En cas de charge de travail en pics, il est possible que Spanner définisse un faible délai. Vous pouvez essayer de définir une valeur de 0 ms pour déterminer si la latence réduite au prix d'une augmentation du débit est raisonnable pour votre application.

Définir des délais de commit mixtes

Vous pouvez configurer différents délais de commit max. sur des sous-ensembles de vos écritures. Dans ce cas, Spanner utilise le délai le plus court configuré pour l'ensemble d'écritures. Toutefois, nous vous recommandons de choisir une valeur unique pour la plupart des cas d'utilisation, car cela entraîne un comportement plus prévisible.

Limites

Vous pouvez définir un délai de commit compris entre 0 et 500 ms. Si vous définissez des délais de commit supérieurs à 500 ms, une erreur est générée.

Définir le délai de commit maximal pour les requêtes de commit

Le paramètre de délai de commit maximal fait partie de la méthode CommitRequest. Vous pouvez accéder à cette méthode à l'aide de l'API RPC, de l'API REST ou de la bibliothèque cliente Cloud Spanner.

Go


import (
	"context"
	"fmt"
	"io"
	"time"

	"cloud.google.com/go/spanner"
)

// maxCommitDelay sets the maximum commit delay for a transaction.
func maxCommitDelay(w io.Writer, db string) error {
	// db = `projects/<project>/instances/<instance-id>/database/<database-id>`
	ctx := context.Background()
	client, err := spanner.NewClient(ctx, db)
	if err != nil {
		return fmt.Errorf("maxCommitDelay.NewClient: %w", err)
	}
	defer client.Close()

	// Set the maximum commit delay to 100ms.
	// This is the amount of latency this request is willing to incur in order
	// to improve throughput. If this field is not set, Spanner assumes requests
	// are relatively latency sensitive and automatically determines an
	// appropriate delay time. You can specify a batching delay value between 0 and 500 ms.
	// The transaction will also return the commit statistics.
	commitDelay := 100 * time.Millisecond
	resp, err := client.ReadWriteTransactionWithOptions(ctx, func(ctx context.Context, txn *spanner.ReadWriteTransaction) error {
		stmt := spanner.Statement{
			SQL: `INSERT Singers (SingerId, FirstName, LastName)
					VALUES (111, 'Virginia', 'Watson')`,
		}
		rowCount, err := txn.Update(ctx, stmt)
		if err != nil {
			return err
		}
		fmt.Fprintf(w, "%d record(s) inserted.\n", rowCount)
		return nil
	}, spanner.TransactionOptions{CommitOptions: spanner.CommitOptions{MaxCommitDelay: &commitDelay, ReturnCommitStats: true}})
	if err != nil {
		return fmt.Errorf("maxCommitDelay.ReadWriteTransactionWithOptions: %w", err)
	}
	fmt.Fprintf(w, "%d mutations in transaction\n", resp.CommitStats.MutationCount)
	return nil
}

Node.js

// Imports the Google Cloud client library.
const {Spanner, protos} = require('@google-cloud/spanner');

/**
 * TODO(developer): Uncomment the following lines before running the sample.
 */
// const projectId = 'my-project-id';
// const instanceId = 'my-instance';
// const databaseId = 'my-database';

// Creates a client.
const spanner = new Spanner({
  projectId: projectId,
});

async function spannerSetMaxCommitDelay() {
  // Gets a reference to a Cloud Spanner instance and database.
  const instance = spanner.instance(instanceId);
  const database = instance.database(databaseId);

  database.runTransaction(async (err, transaction) => {
    if (err) {
      console.error(err);
      return;
    }
    try {
      const [rowCount] = await transaction.runUpdate({
        sql: 'INSERT Singers (SingerId, FirstName, LastName) VALUES (111, @firstName, @lastName)',
        params: {
          firstName: 'Virginia',
          lastName: 'Watson',
        },
      });

      console.log(
        `Successfully inserted ${rowCount} record into the Singers table.`
      );

      await transaction.commit({
        // The maximum amount of time to delay the transaction to improve
        // throughput.
        maxCommitDelay: protos.google.protobuf.Duration({
          seconds: 0, // 0 seconds
          nanos: 100000000, // 100,000,000 nanoseconds = 100 milliseconds
        }),
      });
    } catch (err) {
      console.error('ERROR:', err);
    } finally {
      // Close the database when finished.
      database.close();
    }
  });
}
spannerSetMaxCommitDelay();

Python

# instance_id = "your-spanner-instance"
# database_id = "your-spanner-db-id"
spanner_client = spanner.Client()
instance = spanner_client.instance(instance_id)
database = instance.database(database_id)

def insert_singers(transaction):
    row_ct = transaction.execute_update(
        "INSERT Singers (SingerId, FirstName, LastName) "
        " VALUES (111, 'Grace', 'Bennis')"
    )

    print("{} record(s) inserted.".format(row_ct))

database.run_in_transaction(
    insert_singers, max_commit_delay=datetime.timedelta(milliseconds=100)
)

Ruby

require "google/cloud/spanner"

##
# This is a snippet for showcasing how to pass max_commit_delay in  commit_options.
#
# @param project_id  [String] The ID of the Google Cloud project.
# @param instance_id [String] The ID of the spanner instance.
# @param database_id [String] The ID of the database.
#
def spanner_set_max_commit_delay project_id:, instance_id:, database_id:
  # Instantiates a client
  spanner = Google::Cloud::Spanner.new project: project_id
  client  = spanner.client instance_id, database_id

  records = [
    { SingerId: 1, AlbumId: 1, MarketingBudget: 200_000 },
    { SingerId: 2, AlbumId: 2, MarketingBudget: 400_000 }
  ]
  # max_commit_delay is the amount of latency in millisecond, this request
  # is willing to incur in order to improve throughput.
  # The commit delay must be at least 0ms and at most 500ms.
  # Default value is nil.
  commit_options = {
    return_commit_stats: true,
    max_commit_delay: 100
  }
  resp = client.upsert "Albums", records, commit_options: commit_options
  puts "Updated data with #{resp.stats.mutation_count} mutations."
end

Surveiller la latence des requêtes d'écriture

Vous pouvez surveiller l'utilisation du processeur et la latence du processeur Spanner à l'aide de la console Google Cloud. Lorsque vous définissez un délai plus long pour vos requêtes d'écriture, attendez-vous à une réduction de l'utilisation du processeur, tandis que la latence augmente. Pour en savoir plus sur la latence des requêtes Spanner, consultez la page Capturer et visualiser la latence des requêtes de l'API Spanner.