Configurazione delle richieste di warmup per migliorare le prestazioni

Puoi utilizzare le richieste di preriscaldamento per ridurre la latenza di richieste e risposte durante il caricamento del codice dell'app in un'istanza appena creata.

App Engine deve spesso caricare il codice della tua app in una nuova istanza. Il caricamento di un'istanza può avvenire nelle seguenti situazioni:

  • Quando esegui nuovamente il deployment di una versione dell'app.
  • Quando vengono create nuove istanze a causa del carico delle richieste che supera la capacità del set corrente di istanze in esecuzione.
  • Quando si verificano manutenzione e riparazioni dell'infrastruttura sottostante o dell'hardware fisico.

Il caricamento del codice dell'app in una nuova istanza può comportare richieste di caricamento. Le richieste di caricamento possono comportare un aumento della latenza delle richieste per gli utenti, ma puoi evitare questa latenza utilizzando le richieste di preriscaldamento. Le richieste di preriscaldamento caricano il codice dell'app in una nuova istanza prima che qualsiasi richiesta live raggiunga l'istanza. Le richieste di warmup, come le altre richieste, sono soggette al timeout della richiesta.

Se le richieste di preriscaldamento sono abilitate per la tua applicazione, App Engine tenta di rilevare quando l'applicazione ha bisogno di una nuova istanza e avvia una richiesta di preriscaldamento per inizializzare una nuova istanza. Tuttavia, questi tentativi di rilevamento non funzionano in tutti i casi. Di conseguenza, potresti riscontrare richieste di caricamento, anche se le richieste di preriscaldamento sono attivate nella tua app. Ad esempio, se la tua app non genera traffico, la prima richiesta all'app sarà sempre una richiesta di caricamento, non unrichiesta di warmupnto.

Le richieste di preriscaldamento utilizzano le ore di istanza come qualsiasi altra richiesta alla tua applicazione App Engine. Nella maggior parte dei casi in cui sono abilitate le richieste di preavvio, non noterai un aumento delle ore di istanza perché l'applicazione si inizializza semplicemente in una richiesta di warmupio anziché in una richiesta di caricamento. L'utilizzo delle ore di istanza può aumentare se decidi di svolgere più lavoro, ad esempio la pre-memorizzazione nella cache durante una richiesta di warmup. Se imposti min_idle_instances su un valore maggiore di 0, potresti riscontrare richieste di warmup all'avvio iniziale di queste istanze, ma rimarranno disponibili dopo questo periodo di tempo.

Abilitazione delle richieste di warmup

Le richieste di preriscaldamento vengono utilizzate dallo scheduler App Engine, che controlla la scalabilità automatica delle istanze in base alla configurazione fornita dall'utente. Con le richieste di preavvio abilitate, App Engine invia GET richieste a /_ah/warmup. Puoi implementare i gestori per questa richiesta per eseguire attività specifiche dell'applicazione, come la pre-memorizzazione nella cache dei dati dell'applicazione.

Lo scheduler avvia le istanze quando determina che sono necessarie altre istanze. Le richieste di preavvio potrebbero essere visualizzate nei log anche se sono disattivate perché lo scheduler le utilizza per avviare le istanze.

Tieni presente che non è garantita la chiamata delle richieste di precaricamento. In alcune situazioni vengono inviate richieste di caricamento, ad esempio se l'istanza è la prima a essere avviata o se si verifica un forte aumento del traffico. Tuttavia, se le richieste di warmup sono abilitate, verrà effettuato un tentativo "best effort" di inviare le richieste alle istanze già sottoposte a warmup.

Per attivare le richieste di preavvio, aggiungi l'elemento warmup sotto la direttiva inbound_services nel file app.yaml, ad esempio:

inbound_services:
- warmup

Creazione del gestore

Crea un gestore che elabori le richieste inviate a /_ah/warmup. Il gestore deve eseguire qualsiasi logica di preparazione necessaria per la tua app.