Puoi utilizzare le richieste di riscaldamento per ridurre la latenza di richieste e risposte durante il caricamento del codice dell'app in un'istanza appena creata.
App Engine deve spesso caricare il codice della tua app in una nuova istanza. Il caricamento di un'istanza può verificarsi nelle seguenti situazioni:
- Quando esegui il redeployment di una versione dell'app.
- Quando vengono create nuove istanze a causa del carico delle richieste la capacità del set attuale di istanze in esecuzione.
- Quando si verificano operazioni di manutenzione e riparazione dell'infrastruttura di base o dell'hardware fisico.
Il caricamento del codice dell'app in una nuova istanza può comportare richieste di caricamento. Il caricamento delle richieste può comportare un aumento della latenza delle richieste per gli utenti, ma è possibile evitare questa latenza utilizzando le richieste di preparazione. Le richieste di riscaldamento caricano del codice dell'app in una nuova istanza prima che le richieste in tempo reale raggiungano l'istanza in questione.
Se le richieste di warmup sono abilitate per la tua applicazione, App Engine tenta di per rilevare quando la tua applicazione ha bisogno di una nuova istanza e avvia un warmup per inizializzare una nuova istanza. Tuttavia, questi tentativi di rilevamento funzionano in ogni caso. Di conseguenza, potresti riscontrare richieste di caricamento, anche se le richieste di riscaldamento siano abilitate nella tua app. Ad esempio, se la tua app non pubblica di traffico, la prima richiesta all'app sarà sempre una richiesta di caricamento, non richiesta di warmup.
Le richieste di riscaldamento utilizzano le ore di istanza come qualsiasi altra richiesta al tuo
nell'applicazione App Engine. Nella maggior parte dei casi in cui sono abilitate le richieste di riscaldamento,
non noterai un aumento delle ore di istanza perché la tua applicazione
semplicemente inizializzando una richiesta di warmup invece di una richiesta di caricamento. Il tuo
l'utilizzo delle ore di istanza può aumentare se decidi di eseguire altre attività, ad esempio
pre-memorizzazione nella cache durante una richiesta di warmup. Se imposti
min_idle_instances
a un valore superiore a 0
, potresti riscontrare richieste di riscaldamento quando queste istanze
all'avvio, ma rimarranno disponibili dopo tale data.
Abilitazione delle richieste di riscaldamento in corso...
Le richieste di riscaldamento vengono utilizzate dallo scheduler di App Engine, che controlla le
scalabilità automatica delle istanze
in base alla configurazione fornita dall'utente. Con riscaldamento
richieste abilitate, App Engine invia GET
richieste a /_ah/warmup
. Tu
può implementare gestori per questa richiesta per eseguire attività specifiche dell'applicazione,
come la pre-memorizzazione nella cache dei dati dell'applicazione.
Lo scheduler avvia le istanze quando determina che sono presenti più istanze necessaria. Le richieste di riscaldamento possono essere visualizzate in log anche se sono disabilitate perché lo scheduler le usa per avviare le istanze.
Tieni presente che non è garantito che le richieste di riscaldamento vengano chiamate. In alcuni casi vengono inviate richieste di caricamento: ad esempio, se l'istanza è la prima avviata o se si verifica un aumento brusco del traffico. Tuttavia, farà del nostro meglio tentativo di inviare richieste a istanze già predisposte se le richieste di riscaldamento sono abilitate.
Per attivare le richieste di riscaldamento, aggiungi l'elemento warmup
sotto la
inbound_services
nel tuo file app.yaml
, ad esempio:
inbound_services:
- warmup
Creazione del gestore
Crea un gestore che elabori le richieste inviate a /_ah/warmup
.
L'handler deve eseguire qualsiasi logica di riscaldamento necessaria per l'app.