Configurazione delle richieste di warmup per migliorare le prestazioni

Puoi utilizzare le richieste di riscaldamento per ridurre la latenza di richieste e risposte durante il caricamento del codice dell'app in un'istanza appena creata.

App Engine deve spesso caricare il codice della tua app in una nuova istanza. Il caricamento di un'istanza può avvenire nelle seguenti situazioni:

  • Quando esegui il redeployment di una versione dell'app.
  • Quando vengono create nuove istanze a causa del carico delle richieste che supera la capacità dell'attuale insieme di istanze in esecuzione.
  • Quando si verificano operazioni di manutenzione e riparazione dell'infrastruttura di base o dell'hardware fisico.

Il caricamento del codice dell'app in una nuova istanza può comportare richieste di caricamento. Le richieste di caricamento possono comportare un aumento della latenza delle richieste per gli utenti, ma puoi evitarla utilizzando le richieste di riscaldamento. Le richieste di riscaldamento caricano il codice dell'app in una nuova istanza prima che le richieste in tempo reale raggiungano l'istanza.

Se le richieste di preriscaldamento sono abilitate per la tua applicazione, App Engine tenta di rilevare quando l'applicazione ha bisogno di una nuova istanza e avvia una richiesta di preriscaldamento per inizializzarla. Tuttavia, questi tentativi di rilevamento non funzionano in tutti i casi. Di conseguenza, potresti riscontrare richieste di caricamento anche se le richieste di riscaldamento sono attivate nella tua app. Ad esempio, se la tua app non genera traffico, la prima richiesta all'app sarà sempre una richiesta di caricamento, non una richiesta di warmup.

Le richieste di preriscaldamento utilizzano le ore di istanza come qualsiasi altra richiesta all'applicazione App Engine. Nella maggior parte dei casi in cui le richieste di riscaldamento sono attivate, non noterai un aumento delle ore di istanza perché la tua applicazione viene semplicemente inizializzata in una richiesta di warmup anziché in una richiesta di caricamento. L'utilizzo in ore dell'istanza può aumentare se decidi di eseguire più operazioni, ad esempio la pre-cache durante una richiesta di warmup. Se imposti min_idle_instances su un valore maggiore di 0, potresti riscontrare richieste di warmup al primo avvio di queste istanze, che tuttavia rimarranno disponibili in un secondo momento.

Attivazione delle richieste di warmup

Le richieste di preriscaldamento vengono utilizzate dal programmatore di App Engine, che controlla la scalabilità automatica delle istanze in base alla configurazione fornita dall'utente. Con le richieste di preriscaldamento attivate, App Engine invia richieste GET a /_ah/warmup. Puoi implementare gestori per questa richiesta per eseguire attività specifiche dell'applicazione, come la pre-cache dei dati dell'applicazione.

Il programmatore avvia le istanze quando stabilisce che sono necessarie altre istanze. Le richieste di riscaldamento potrebbero essere visualizzate nei log anche se sono disattivate perché lo scheduler le utilizza per avviare le istanze.

Tieni presente che non è garantito che le richieste di riscaldamento vengano chiamate. In alcuni casi vengono inviate richieste di caricamento: ad esempio, se l'istanza è la prima che viene avviata o se si verifica un rapido aumento del traffico. Tuttavia, se le richieste di warmup sono abilitate, verrà eseguito un tentativo "best effort" per inviare richieste a istanze già sottoposte a warmup.

Per attivare le richieste di riscaldamento, aggiungi l'elemento warmup sotto la direttiva inbound_services nel file app.yaml, ad esempio:

inbound_services:
- warmup

Creazione del gestore

Crea un gestore che elabori le richieste inviate a /_ah/warmup. L'handler deve eseguire qualsiasi logica di riscaldamento necessaria per l'app.


// Sample warmup demonstrates usage of the /_ah/warmup handler.
package main

import (
	"context"
	"fmt"
	"log"
	"net/http"
	"os"
	"time"

	"cloud.google.com/go/storage"
)

var startupTime time.Time
var client *storage.Client

func main() {
	// Perform required setup steps for the application to function.
	// This assumes any returned error requires a new instance to be created.
	if err := setup(context.Background()); err != nil {
		log.Fatalf("setup: %v", err)
	}

	// Log when an appengine warmup request is used to create the new instance.
	// Warmup steps are taken in setup for consistency with "cold start" instances.
	http.HandleFunc("/_ah/warmup", func(w http.ResponseWriter, r *http.Request) {
		log.Println("warmup done")
	})
	http.HandleFunc("/", indexHandler)

	port := os.Getenv("PORT")
	if port == "" {
		port = "8080"
		log.Printf("Defaulting to port %s", port)
	}

	log.Printf("Listening on port %s", port)
	if err := http.ListenAndServe(":"+port, nil); err != nil {
		log.Fatal(err)
	}
}

// setup executes per-instance one-time warmup and initialization actions.
func setup(ctx context.Context) error {
	// Store the startup time of the server.
	startupTime = time.Now()

	// Initialize a Google Cloud Storage client.
	var err error
	if client, err = storage.NewClient(ctx); err != nil {
		return err
	}

	return nil
}

// indexHandler responds to requests with our greeting.
func indexHandler(w http.ResponseWriter, r *http.Request) {
	if r.URL.Path != "/" {
		http.NotFound(w, r)
		return
	}
	uptime := time.Since(startupTime).Seconds()
	fmt.Fprintf(w, "Hello, World! Uptime: %.2fs\n", uptime)
}