Riferimento app.yaml di App Engine

ID regione

REGION_ID è un codice abbreviato assegnato da Google in base alla regione selezionata al momento della creazione dell'app. Il codice non corrispondono a un paese o a una provincia, anche se potrebbero essere visualizzati alcuni ID regione in modo simile ai codici paese e provincia di uso comune. Per le app create dopo il giorno Febbraio 2020, REGION_ID.r è incluso in URL di App Engine. Per le app esistenti create prima di questa data, l'ID regione è facoltativo nell'URL.

Scopri di più sugli ID regione.

Configura le impostazioni dell'app App Engine in app.yaml di configurazione del deployment. Il file di configurazione deve specificare almeno una voce runtime.

Ogni servizio nella tua app ha il proprio file app.yaml, che funge da descrittore per e deployment continuo. Devi prima creare il file app.yaml per il servizio default prima di poter creare e implementare file app.yaml per servizi aggiuntivi all'interno della tua app. Per scoprire di più sulla strutturazione di più servizi nella tua app, consulta Strutturare i servizi web in App Engine.

Sintassi

La sintassi di app.yaml è il formato YAML.

Il formato YAML supporta i commenti. Una riga che inizia con il carattere cancelletto (#) viene ignorata:

# This is a comment.

I pattern di URL e percorsi file utilizzano la sintassi delle espressioni regolari estese POSIX, esclusi gli elementi di confronto e le classi di confronto. Riferimenti precedenti a corrispondenze raggruppate (ad es. \1) così come le seguenti estensioni Perl: \w \W \s \S \d \D.

Esempio

Di seguito è riportato un esempio di file app.yaml:

runtime: python312

instance_class: F2

env_variables:
  BUCKET_NAME: "example-gcs-bucket"

handlers:
# Matches requests to /images/... to files in static/images/...
- url: /images
  static_dir: static/images

- url: /.*
  secure: always
  redirect_http_response_code: 301
  script: auto

Elementi di runtime e app

Elemento Descrizione
app_engine_apis

Facoltativo. Se vuoi utilizzare Servizi legacy in bundle di App Engine per runtime di seconda generazione, imposta questo campo su true.

build_env_variables

Facoltativo. Se utilizzi un runtime che supporta buildpack, puoi definire le variabili di ambiente di compilazione nel file app.yaml.

Per ulteriori informazioni, vedi Utilizzo delle variabili di ambiente di build.

default_expiration

Facoltativo. Imposta un periodo di cache predefinito globale per tutti i gestori di file statici di un'applicazione. Puoi anche configurare una durata della cache per file statici specifici e i gestori di rete. Il valore è una stringa di numeri e unità, separati da spazi, dove le unità possono essere d per giorni, h per ore, m per minuti e s per secondi. Ad esempio, "4d 5h" imposta la scadenza della cache su 4 giorni e 5 ore dopo la prima richiesta del file. Se omesso, il server di produzione imposta la scadenza su 10 minuti.

Esempio in Python:
runtime: python312

default_expiration: "4d 5h"

handlers:
# ...

Per ulteriori informazioni, consulta la sezione Scadenza della cache.

entrypoint

Facoltativo. Esegue l'override del comportamento di avvio predefinito eseguendo il comando entrypoint all'avvio dell'app. Affinché la tua app riceva richieste HTTP, l'elemento entrypoint deve contenere un comando che avvii un server web in ascolto sulla porta 8080.

Se non specifichi entrypoint per il parametro Runtime Python, App Engine configura e avvia il server web Gunicorn.

Per ulteriori informazioni, vedi Avvio dell'applicazione.

env_variables

Facoltativo. Puoi definire le variabili di ambiente nel file app.yaml per renderle disponibili alla tua app. Assicurati che la chiave in Variabili di ambiente corrisponda all'espressione "[a-zA-Z_][a-zA-Z0-9_]*" (inizia con l'alfabeto o "_" seguito da qualsiasi carattere alfanumerico o "_").

Variabili di ambiente precedute dal prefisso GAE sono riservate all'uso del sistema e non sono consentite in app.yaml file.

Per Python, queste variabili sono disponibili nel Dizionario os.environ:

env_variables:
          DJANGO_SETTINGS_MODULE: "myapp.settings"

Vedi anche l'elenco di variabili di ambiente di runtime che non possono essere sovrascritte.

error_handlers

Facoltativo. Utilizzato per configurare pagine di errore personalizzate che vengono restituite per diverse tipi di errori.

Questo elemento può contenere i seguenti elementi:

error_code
Facoltativo. error_code può essere uno dei seguenti:
over_quota
Indica che l'app dispone di quota di risorse superata
timeout
Viene pubblicato se viene raggiunta una scadenza prima che la tua app risponda.

Il codice errore è facoltativo; se non è specificato, il file specificato è la risposta di errore predefinita per l'app.

file
Ogni voce del file indica un file statico da pubblicare al posto della risposta generica all'errore. Se specifichi Elemento file senza un corrispondente Elemento error_code, il file statico sarà il valore predefinito pagina di errore relativa alla tua app. I dati di errore personalizzati devono essere inferiori a 10 kilobyte.
Esempio
error_handlers:
  - file: default_error.html

  - error_code: over_quota
    file: over_quota.html
handlers

Facoltativo. Un elenco di pattern URL e descrizioni di come dovrebbero essere gestiti. App Engine può gestire gli URL eseguendo il codice dell'applicazione oppure tramite la pubblicazione di file statici caricati con il codice, ad esempio immagini, CSS o JavaScript.

Visualizza i gestori e gli elementi secondari a riga di comando.

inbound_services

Facoltativo. Le applicazioni devono abilitare questi servizi prima di poter ricevere messaggi in entrata richieste. Puoi abilitare il servizio per un'app includendo una sezione inbound_services nella app.yaml file.

warmup
Abilita le richieste di warmup. Consulta Configurazione delle richieste di warmup.
Esempio:
inbound_services:
- warmup
instance_class

Facoltativo. La classe di istanza per questo servizio.

I seguenti valori sono disponibili a seconda del servizio scalabilità:

Scalabilità automatica
F1, F2, F4 e F4_1G
Predefinito: F1

Facoltativamente, utilizza la Elemento automatic_scaling per modificare il valore predefinito impostazioni per la scalabilità automatica, come il valore minimo e massimo numero di istanze, latenza e connessioni simultanee.

Nota: se instance_class è impostato su F2 o su un valore superiore, puoi ottimizzare le tue istanze impostando max_concurrent_requests a un valore superiore a il valore predefinito è 10. Per determinare il valore ottimale, aumentarlo gradualmente e monitorare il rendimento un'applicazione.

Scalabilità di base e manuale
B1, B2, B4, B4_1G e B8
Predefinito: B2

Le classi di istanze di base e manuali richiedono di specificare l'elemento basic_scaling o l'elemento manual_scaling.

runtime

Obbligatorio. Il nome dell'ambiente di runtime utilizzato dal tuo dell'app. Ad esempio, per specificare l'ambiente di runtime, usa:

runtime: python312
service

Obbligatorio se crei un Google Cloud. Facoltativo per default completamente gestito di Google Cloud. Ogni servizio e ogni versione deve avere un nome. Un nome può contenere numeri, lettere e trattini. La lunghezza combinata di VERSION-dot-SERVICE-dot-PROJECT_ID, dove VERSION è il nome della versione, SERVICE è il nome del servizio e PROJECT_ID è l'ID progetto, non deve essere superiore a 63 caratteri e non deve iniziare o terminare con un trattino. Scegli un nome univoco per ogni servizio e ogni versione. Non riutilizzare i nomi tra servizi e versioni.

Esempio:
service: service-name
service_account

Facoltativo. L'elemento service_account ti consente di specificare account di servizio specifico della versione come identità per la versione. L'account di servizio specificato viene utilizzato per accedere ad altri servizi Google Cloud ed eseguire attività.

Esempio:
service_account: [SERVICE_ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
vpc_access_connector

Facoltativo. Configura l'applicazione in modo che utilizzi un connettore di accesso VPC serverless, in modo che possa inviare richieste alle risorse interne della rete VPC. Per ulteriori informazioni, vedi Connessione a una rete VPC.

name
Valore letterale stringa. Specifica il nome completo del connettore di accesso VPC serverless tra virgolette:
"projects/PROJECT_ID/locations/REGION/connectors/CONNECTOR_NAME"
egress_setting
Facoltativo. Il valore predefinito è private-ranges-only. La egress_setting può essere uno dei seguenti:
private-ranges-only
Predefinita. Le richieste agli indirizzi IP interni vengono inviate tramite il connettore di accesso VPC serverless alla rete VPC connessa. Le richieste agli indirizzi IP esterni vengono inviate alla rete internet pubblica.
all-traffic
Tutte le richieste vengono inviate tramite Connettore di accesso VPC serverless alla rete VPC connessa.
Esempio
vpc_access_connector:
  name: "projects/PROJECT_ID/locations/REGION/connectors/CONNECTOR_NAME"
  egress_setting: all-traffic

Elemento Handlers

L'elemento handlers fornisce un elenco di URL e descrizioni di come dovrebbero essere gestiti. App Engine può gestire gli URL eseguendo il codice dell'applicazione o pubblicando file statici caricati con il codice, ad esempio immagini, CSS o JavaScript.

I pattern vengono valutati nell'ordine in cui appaiono nel file app.yaml, dall'alto verso il basso. Il primo mapping il cui pattern corrisponde all'URL è quello utilizzato per gestire la richiesta.

La tabella seguente elenca i sottoelementi dell'elemento handlers che controllano il comportamento per file statici, directory statiche, script in runtime diversi da Node.js e altre impostazioni.

Elemento Descrizione
auth_fail_action

Per utilizzare questo elemento, app_engine_apis deve essere impostato su true.

Facoltativo. Descrive l'azione intrapresa quando l'elemento login è specificato per un gestore e l'utente non ha eseguito l'accesso. Ha due valori possibili:

redirect
Valore predefinito. L'utente viene reindirizzato alla pagina di accesso a Google o /_ah/login_required se viene utilizzata l'autenticazione OpenID. L'utente viene reindirizzato all'URL dell'applicazione dopo aver eseguito l'accesso o creato un account.
unauthorized
La richiesta è stata rifiutata con un codice di stato HTTP 401 e un messaggio di errore.

Se un'applicazione ha bisogno di un comportamento diverso, l'applicazione stessa può implementare la gestione degli accessi utente. Ad esempio, richiedere l'accesso per la directory /profile/ o per accedere come amministratore nella directory /admin/. Vedi Utenti API per saperne di più.

Puoi configurare un gestore in modo che rifiuti l'accesso agli URL protetti quando l'utente non ha eseguito l'accesso, anziché reindirizzarlo alla pagina di accesso, aggiungendo auth_fail_action: unauthorized alla configurazione del gestore.

expiration Facoltativo. Il periodo di tempo per cui un file statico pubblicato da questo gestore deve essere memorizzato nella cache da proxy web e browser. Il valore è una stringa di numeri e unità, separati da spazi, in cui le unità possono essere d per i giorni, h per le ore, m per i minuti e s per i secondi. Ad esempio, "4d 5h" imposta la scadenza della cache su 4 giorni e 5 ore dopo la prima richiesta del file. Se omesso, il valore È in uso default_expiration. Vedi Cache data di scadenza per ulteriori dettagli.
http_headers

Facoltativo. Puoi impostare le intestazioni HTTP per le risposte degli elaboratori di directory o file statici.

Se devi impostare le intestazioni HTTP nei gestori script, devi farlo nel codice dell'app. Per informazioni sulle intestazioni di risposta che influiscono sulla memorizzazione nella cache, consulta Memorizzazione nella cache dei contenuti statici.

Per ulteriori informazioni sulle intestazioni specifiche di App Engine, consulta Intestazioni e risposte delle richieste.

Esempio
handlers:
- url: /images
  static_dir: static/images
  http_headers:
    X-Foo-Header: foo
    X-Bar-Header: bar value
    vary: Accept-Encoding
  # ...

Assistenza CORS

Un uso importante di questa funzionalità è supportare le risorse multiorigine condivisione (CORS), ad esempio l'accesso a file ospitati da un altro dell'app App Engine.

Ad esempio, potresti avere l'app di gioco mygame.uc.r.appspot.com che accede agli asset ospitati da myassets.uc.r.appspot.com. Tuttavia, se mygame tenta di eseguire un XMLHttpRequest di JavaScript su myassets, non avrà esito positivo a meno che l'handler per myassets non restituisca un'intestazione di risposta Access-Control-Allow-Origin: contenente il valore http://mygame.uc.r.appspot.com.

Ecco come restituire il gestore di file statico valore di intestazione risposta richiesto:

handlers:
- url: /images
  static_dir: static/images
  http_headers:
    Access-Control-Allow-Origin: https://mygame.uc.r.appspot.com
  # ...

Suggerimento: per consentire a tutti di accedere ai tuoi asset, puoi utilizzare il carattere jolly '*' anziché https://mygame.uc.r.appspot.com.

login

Per utilizzare questo elemento, app_engine_apis deve essere impostato su true.

Facoltativo. Determina se l'handler URL richiede che l'utente abbia eseguito l'accesso.

Questo elemento ha tre possibili valori:

optional
Valore predefinito. Non è necessario che l'utente abbia eseguito l'accesso.
required
Se l'utente ha eseguito l'accesso, il gestore procede normalmente. Altrimenti, l'azione specificata in auth_fail_action è già in uso.
admin
Come per required, esegue auth_fail_action se l'utente non ha eseguito l'accesso. Inoltre, se l'utente non è un gestore dell'applicazione, riceve un messaggio di errore indipendentemente dall'impostazione auth_fail_action. Se l'utente è un amministratore, il gestore procede.

Quando un gestore URL con un'impostazione login diversa da optional corrisponde a un URL, il gestore controlla innanzitutto se l'utente ha eseguito l'accesso all'applicazione utilizzando la sua opzione di autenticazione. In caso contrario, per impostazione predefinita, l'utente viene reindirizzato alla pagina di accesso. Puoi anche utilizzare auth_fail_action per configurare l'app in modo che rifiuti semplicemente le richieste di un gestore da parte degli utenti che non sono adeguatamente autenticati, anziché reindirizzare l'utente a la pagina di accesso.

Nota: la limitazione dell'accesso di admin è soddisfatta anche per per le quali App Engine imposta le richieste X-Appengine intestazioni speciali. Ad esempio, cron attività pianificate soddisfano la restrizione admin perché App Engine imposta un'intestazione HTTP X-Appengine-Cron: true sulle rispettive richieste. Tuttavia, le richieste non soddisferebbero la required limitazione di accesso, perché le attività pianificate di cron non vengono eseguite come nessun utente.

mime_type

Facoltativo. Se specificato, tutti i file pubblicati da questo gestore verranno pubblicati utilizzando il tipo MIME specificato. Se non specificato, il tipo MIME di un file verrà ricavata dall'estensione del nome file del file. Se lo stesso file viene caricato con più estensioni, l'estensione risultante può dipendere dall'ordine in cui sono stati eseguiti i caricamenti.

Per ulteriori informazioni sui possibili tipi multimediali MIME, visita il sito web sui tipi di media MIME di IANA.

redirect_http_response_code

Facoltativo. redirect_http_response_code viene utilizzato con l'impostazione secure per impostare il codice di risposta HTTP restituito quando viene eseguito un reindirizzamento richiesto dalla configurazione dell'impostazione secure. L'elemento redirect_http_response_code ha i seguenti valori possibili:

301
Codice di risposta Spostato in modo permanente.
302
Codice di risposta trovato.
303
Vedi Altro codice di risposta.
307
Codice di risposta di reindirizzamento temporaneo.

Quando la richiesta di un utente viene reindirizzata, viene impostato il codice di stato HTTP al valore dell'attributo redirect_http_response_code . Se il parametro non è presente, verrà restituito 302.

script

Facoltativo. Specifica che le richieste all'handler specifico devono avere come target la tua app. L'unico valore accettato per l'elemento script è auto perché tutto il traffico viene pubblicato utilizzando il comando entrypoint. Per utilizzare i gestori statici, almeno uno dei gestori deve contenere la riga script: auto o definire un elemento entrypoint per il deployment.

secure Facoltativo. Qualsiasi gestore di URL può usare l'impostazione secure, inclusi gestori di file statici. L'elemento secure ha i seguenti valori possibili:
optional
Sia le richieste HTTP che quelle HTTPS con URL corrispondenti all'handler vanno a buon fine senza reindirizzamenti. L'applicazione può esaminare la richiesta per determinare quale protocollo è stato utilizzato e rispondere di conseguenza. Questo è l'impostazione predefinita se secure non viene fornito per un .
never
Le richieste di un URL che corrispondono a questo gestore e che utilizzano HTTPS vengono reindirizzate automaticamente all'URL HTTP equivalente. Quando un utente La richiesta HTTPS viene reindirizzata a una richiesta HTTP vengono rimossi dalla richiesta. In questo modo, un utente non può inviare accidentalmente i dati delle query tramite una connessione non sicura che era stata pensata per una connessione sicura.
always
Le richieste per un URL corrispondente a questo gestore che non utilizzano HTTPS vengono vengono reindirizzati automaticamente all'URL HTTPS con lo stesso percorso. Termine di ricerca vengono conservati per il reindirizzamento.
Esempio di Python
handlers:
- url: /youraccount/.*
  secure: always
  script: auto

A scegliere come target una specifica versione dell'app utilizzando REGION_ID.r.appspot.com dominio, sostituisci i punti che generalmente separano i componenti di sottodominio dell'URL con la stringa "-dot-", ad esempio:
https://VERSION_ID-dot-default-dot-PROJECT_ID.REGION_ID.r.appspot.com

Per utilizzare domini personalizzati con HTTPS, devi prima attivare e configurare i certificati SSL per quel dominio.

L'accesso e la disconnessione dagli Account Google vengono sempre eseguiti utilizzando una connessione sicura, indipendentemente dalla configurazione degli URL dell'applicazione.

static_dir

Facoltativo. Il percorso della directory contenente i file statici, da nella directory radice dell'applicazione. Tutto ciò che dopo la fine il pattern url corrispondente viene aggiunto a static_dir per formare il percorso completo del file richiesto.

Ogni file nella directory statica viene pubblicato utilizzando il tipo MIME corrispondente all'estensione del nome file, a meno che non venga sostituito dall'impostazione mime_type della directory. Tutti i file della directory specificata vengono caricati come file statici e nessuno di questi può essere eseguito come script.

Esempio:
handlers:
# All URLs beginning with /stylesheets are treated as paths to
# static files in the stylesheets/ directory.
- url: /stylesheets
  static_dir: stylesheets
  # ...
static_files

Facoltativo. Un gestore di pattern di file statici associa un pattern URL a i percorsi dei file statici caricati con l'applicazione. Pattern URL l'espressione regolare può definire i raggruppamenti di espressioni regolari da utilizzare nella costruzione del percorso del file. Puoi utilizzarlo al posto di static_dir per mappare file specifici in una directory senza dover mappare l'intera directory.

Esempio:
handlers:
# All URLs ending in .gif .png or .jpg are treated as paths to
# static files in the static/ directory. The URL pattern is a
# regular expression, with a grouping that is inserted into the
# path to the file.
- url: /(.*\.(gif|png|jpg))$
  static_files: static/\1
  upload: static/.*\.(gif|png|jpg)$
  # ...

I file statici non possono essere gli stessi dei file di codice dell'applicazione.

upload

Facoltativo. Un'espressione regolare che corrisponde ai percorsi dei file di tutti i file a cui farà riferimento questo gestore. Questa operazione è necessaria perché il gestore non è in grado di determinare quali file nella tua applicazione della directory corrispondano agli attributi url static_files pattern. I file statici vengono caricati e vengono gestiti separatamente dai file dell'applicazione. L'esempio riportato sopra potrebbe utilizzare il seguente pattern upload: archives/(.*)/items/(.*)

url

Elemento obbligatorio in handlers. Il pattern dell'URL come un'espressione regolare che può contenere raggruppamenti. Ad esempio, /profile/(.*)/(.*) corrisponde all'URL /profile/edit/manager e utilizza edit e manager come primo e secondo raggruppamento.

Il pattern URL presenta alcune differenze di comportamento se utilizzato con i seguenti elementi:

static_dir
Utilizza un prefisso URL. Il pattern di espressioni regolari non deve contenere agrupamenti se utilizzato con l'elemento static_dir. Tutti gli URL che iniziano con questo prefisso vengono gestiti da questo gestore, che utilizza la parte dell'URL dopo il prefisso come parte del percorso del file.
static_files
Un gestore di pattern di file statici associa un pattern URL ai percorsi dei file statici caricati con l'applicazione. Il pattern URL è regolare può definire raggruppamenti di espressioni regolari da utilizzare nel costruzione del percorso del file. Puoi utilizzarlo al posto di static_dir per mappare file specifici in una directory senza dover mappare l'intera directory.

Ridimensionare gli elementi

Gli elementi nella tabella seguente configurano la scalabilità dell'applicazione. In caso contrario del tipo specificato, la scalabilità automatica è impostata per impostazione predefinita.

Per saperne di più sulla scalabilità delle app di App Engine, consulta Tipi di scalabilità.

Elemento Descrizione
automatic_scaling

Facoltativo. Applicabile solo per le applicazioni che utilizzano una classe di istanze F1 o superiore.

Specifica questo elemento per modificare le impostazioni predefinite della scalabilità automatica. come l'impostazione dei livelli minimo e massimo per il numero di istanze, latenza e connessioni simultanee per un servizio.

Questo elemento può contenere i seguenti elementi:

max_instances
Facoltativa. Specifica un valore compreso tra 0 e 2147483647, dove zero disattiva l'impostazione.

Questo parametro specifica il numero massimo di istanze per l'applicazione Motore da creare per questa versione del modulo. Questa opzione è utile per limitare i costi di un modulo.

min_instances
Facoltativo. Il numero minimo di istanze da creare per App Engine per questa versione del modulo. Queste istanze gestiscono il traffico quando e continuano a gestire il traffico anche e le istanze aggiuntive avviate in base alle necessità per gestire il traffico.

Specifica un valore compreso tra 0 e 1000. Puoi impostare il parametro sul valore 0 per consentire il ridimensionamento a 0 istanze al fine di ridurre i costi quando non vengono inviate richieste. Tieni presente che ti viene addebitato il costo per il numero di istanze specificate, indipendentemente dal fatto che ricevano o meno traffico.

max_idle_instances

Facoltativo. Il numero massimo di istanze inattive che App Engine deve mantenere per questa versione. Specifica un valore compreso tra 1 e 1000. Se non specificato, il valore predefinito è automatic, il che significa che App Engine gestirà il numero di istanze inattive.

Tieni presente che:

  • Un valore massimo elevato riduce ulteriormente il numero di istanze inattive gradualmente quando i livelli di carico tornano alla normalità dopo un picco. Questo consente alla tua applicazione di mantenere un rendimento costante delle fluttuazioni nel carico delle richieste, ma aumenta anche il numero di di Compute Engine (e conseguenti costi di esecuzione) durante tali periodi carico di lavoro.
  • Un valore massimo basso mantiene bassi i costi di gestione, ma può peggiorare le prestazioni in presenza di livelli di carico volatili.

Nota:per tornare ai livelli normali dopo un un picco di carico, il numero di istanze inattive può superare temporaneamente il valore massimo specificato. Tuttavia, non ti verrà addebitato il costo di più istanze rispetto al numero massimo specificato.

min_idle_instances

(Facoltativo) Il numero di istanze aggiuntive da mantenere in esecuzione e pronte a gestire il traffico per questa versione.

App Engine calcola il numero di istanze necessarie per gestire il traffico corrente dell'applicazione in base alle impostazioni di scalabilità come target_cpu_utilization e target_throughput_utilization. L'impostazione min_idle_instances specifica il numero di istanze da eseguire oltre a questo numero calcolato. Ad esempio: se App Engine calcola cinque istanze sono necessarie per gestire il traffico e min_idle_instances è impostato su 2, App Engine eseguirà 7 istanze (5, calcolate in base al traffico, più altri 2 per min_idle_instances).

Tieni presente che ti viene addebitato il costo per il numero di istanze specificate, indipendentemente dal fatto che ricevano o meno traffico. Tieni presente che:

  • Un numero minimo ridotto consente di ridurre i costi di gestione durante i periodi di inattività, ma significa che potrebbero essere disponibili meno istanze immediatamente per rispondere a un picco di carico improvviso.
  • Un valore minimo elevato ti consente di preparare l'applicazione per picchi rapidi nel carico delle richieste. App Engine mantiene il minimo di istanze in esecuzione per gestire le richieste in entrata. Tu il costo viene addebitato per il numero di istanze specificato, non stanno gestendo le richieste.

    Se imposti un numero minimo di istanze inattive, latenza in sospeso avrà meno impatto sulle prestazioni della tua applicazione.

target_cpu_utilization
Facoltativa. Specifica un valore compreso tra 0,5 e 0,95. L'impostazione predefinita è 0.6.

Questo parametro specifica la soglia di utilizzo della CPU alla quale le nuove istanze iniziato a gestire il traffico, consentendoti di bilanciare le prestazioni e i costi, con valori più bassi che aumentano le prestazioni e un aumento dei costi e valori più alti che riducono il rendimento, e la riduzione dei costi. Ad esempio, il valore 0,7 significa che vengono avviate quando l'utilizzo della CPU raggiunge il 70%.

target_throughput_utilization
Facoltativo. Specifica un valore compreso tra 0,5 e 0,95. Il valore predefinito è 0.6.

Utilizzato con max_concurrent_requests per specificare quando viene avviata una nuova istanza a causa di richieste concorrenti. Quando di richieste in parallelo raggiunge un valore uguale a max_concurrent_requests volte target_throughput_utilization, lo scheduler prova per avviare una nuova istanza.

max_concurrent_requests

Facoltativo. Il numero di richieste in parallelo e una scalabilità automatica l'istanza può accettare prima che lo scheduler crei una nuova istanza (valore predefinito: 10, massimo: 1000).

Utilizzato con target_throughput_utilization per specificare quando viene avviata una nuova istanza a causa di richieste in parallelo. Quando il numero di richieste simultanee raggiunge un valore pari a max_concurrent_requests volte target_throughput_utilization, lo scheduler tenta di avviare una nuova istanza.

Ti consigliamo di non impostare max_concurrent_requests a meno di 10, a meno che tu non abbia bisogno di un singolo thread. Un valore meno di 10, è probabile che un numero maggiore di istanze del necessario per un'app threadsafe, con possibili conseguenze costi inutili.

Se questa impostazione è troppo alta, l'API potrebbe essere aumentata una latenza di pochi millisecondi. Tieni presente che il programmatore potrebbe generare una nuova istanza prima che venga raggiunto il numero massimo effettivo di richieste.

max_pending_latency

Il periodo di tempo massimo che App Engine deve consentire di inviare una richiesta di attendere in coda prima di avviare istanze aggiuntive per gestire le richieste in modo da ridurre latenza in sospeso. Quando viene raggiunta questa soglia, viene attivato un indicatore di scalabilità e si verifica un aumento del numero di istanze.

Se non specificato, il valore predefinito è automatic. Ciò significa che le richieste possono rimanere nella coda in attesa per un massimo di 10 secondi, il limite di tempo massimo per le richieste in attesa, prima che vengano avviate nuove istanze.

Un valore massimo basso significa che App Engine avvierà nuove istanze per le richieste in attesa, migliorando il rendimento e aumentando i costi di gestione.

Un valore massimo elevato significa che gli utenti potrebbero attendere più a lungo per le loro richieste la pubblicazione (se ci sono richieste in attesa e non di Compute Engine, ma la tua applicazione costerà meno vengono eseguiti tutti i test delle unità.

min_pending_latency

Un elemento facoltativo che puoi impostare per specificare la quantità minima tempo in cui App Engine deve consentire l'attesa di una richiesta in attesa prima di avviare una nuova istanza per gestirla. Specificare un valore può ridurre i costi di gestione, ma aumentare il tempo e gli utenti devono attendere la risposta alle loro richieste.

Per le app gratuite, il valore predefinito è 500ms. Per le app pagate, il valore predefinito è 0.

Questo elemento funziona insieme all'elemento max_pending_latency per determinare quando App Engine crea nuove istanze. Se sono presenti richieste in attesa in coda:

  • Meno del valore di min_pending_latency specificato, App Engine non creerà nuove istanze.
  • Più di max_pending_latency, App Engine proverà a creare una nuova istanza.
  • Tra l'ora specificata da min_pending_latency e max_pending_latency, App Engine tenterà di riutilizzare un'istanza esistente. Se nessuna istanza è in grado di elaborare la richiesta prima di max_pending_latency, App Engine creerà una nuova istanza.
Esempio
automatic_scaling:
  target_cpu_utilization: 0.65
  min_instances: 5
  max_instances: 100
  min_pending_latency: 30ms
  max_pending_latency: automatic
  max_concurrent_requests: 50
basic_scaling

Le applicazioni che utilizzano istanza di B1 o superiore, deve specificare questo elemento oppure manual_scaling.

Questo elemento consente la scalabilità di base delle classi di istanze B1 e successive e può contenere i seguenti elementi:

max_instances
Obbligatorio. Il numero massimo di istanze che App Engine può creare per questa versione del servizio. Questa opzione è utile per limitare i costi di un servizio.
idle_timeout
Facoltativa. L'istanza verrà arrestata dopo questo periodo di tempo dalla ricezione dell'ultima richiesta. Il valore predefinito è 5 minuti (5m).
Esempio
basic_scaling:
  max_instances: 11
  idle_timeout: 10m
manual_scaling

Le applicazioni che utilizzano istanza di B1 o superiore, deve specificare questo elemento oppure basic_scaling.

Questo elemento consente la scalabilità manuale delle classi di istanza B1 e superiori, e può contenere il seguente elemento:

instances
Il numero di istanze da assegnare al servizio all'inizio.
Esempio
manual_scaling:
  instances: 5