Ambiente di runtime Python 2

Con App Engine, puoi creare applicazioni web utilizzando il linguaggio di programmazione Python e sfruttare le numerose librerie, strumenti e framework per Python, che gli sviluppatori professionisti utilizzano per creare applicazioni web di altissimo livello. L'applicazione Python viene eseguita nell'infrastruttura scalabile di Google e utilizza servizi e archiviazione permanente su larga scala.

Introduzione

App Engine esegue il codice dell'applicazione Python utilizzando un interprete di Python precaricato in un ambiente sicuro con sandbox. L'app riceve richieste web, esegue il lavoro e invia risposte interagendo con questo ambiente.

Un'app web Python interagisce con il server web App Engine utilizzando il protocollo WSGI, perciò le app possono utilizzare qualsiasi framework di applicazioni web compatibile con WSGI. App Engine include un semplice framework per applicazioni web, denominato webapp2, per semplificare l'avvio. Per le applicazioni più grandi, i framework di terze parti maturi, come Django, funzionano bene con App Engine.

L'interprete Python può eseguire qualsiasi codice Python, compresi i moduli Python che includi nella tua applicazione, nonché la libreria standard Python. L'interprete non può caricare moduli Python con codice C; è un ambiente Python "puro".

L'ambiente "sandbox" protetto isola l'applicazione per servizi e sicurezza. Garantisce che le app possano eseguire solo azioni che non interferiscono con le prestazioni e la scalabilità di altre app. Ad esempio, un'app non può scrivere dati nel file system locale o stabilire connessioni di rete arbitrarie. Al contrario, le app utilizzano servizi scalabili forniti da App Engine per archiviare i dati e comunicare su internet. L'interprete Python genera un'eccezione quando un'app tenta di importare un modulo Python dalla libreria standard che è noto per non funzionare all'interno delle limitazioni della sandbox.

La piattaforma App Engine fornisce molti servizi che il tuo codice può chiamare. L'applicazione può anche configurare attività pianificate eseguite a intervalli specificati.

Selezione del runtime Python 2

Puoi specificare l'ambiente di runtime Python nel file di configurazione app.yaml, utilizzato per eseguire il deployment dell'applicazione in App Engine. Ad esempio, aggiungi quanto segue al file app.yaml per utilizzare Python versione 2.7:

runtime: python27
api_version: 1
threadsafe: true
...

Il primo elemento, runtime, seleziona l'ambiente di runtime Python.

Il secondo elemento, api_version, seleziona la versione dell'ambiente di runtime Python da utilizzare. Al momento della stesura di questo articolo, App Engine ha una sola versione dell'ambiente Python, 1. Se il team di App Engine deve rilasciare modifiche all'ambiente che potrebbero non essere compatibili con il codice esistente, lo farà con un nuovo identificatore di versione. L'app continuerà a utilizzare la versione selezionata finché non modifichi l'impostazione api_version e carichi l'app.

Per ulteriori informazioni sul file app.yaml e su come eseguire il deployment della tua app in App Engine, consulta gli argomenti Riferimento app.yaml, Migrazione a Python 2.7 e Deployment di un'app Python.

La sandbox

Per consentire ad App Engine di distribuire le richieste per le applicazioni tra più server web e per impedire a un'applicazione di interferire con un altro, l'applicazione viene eseguita in un ambiente "sandbox" limitato. In questo ambiente, l'applicazione può eseguire codice, archiviare ed eseguire query sui dati in Datastore, utilizzare i servizi posta, recupero degli URL e utenti di App Engine, esaminare la richiesta web dell'utente e preparare la risposta.

Un'applicazione App Engine non può:

  • scrivere nel file system. Le applicazioni devono utilizzare Datastore per l'archiviazione di dati permanenti. La lettura dal file system è consentita e tutti i file dell'applicazione caricati con l'applicazione sono disponibili.

  • rispondere lentamente. Una richiesta web inviata a un'applicazione deve essere gestita entro pochi secondi. I processi con tempi di risposta lunghi vengono terminati per evitare di sovraccaricare il server web.

  • effettuare altri tipi di chiamate di sistema.

Sandboxing in Python

Puoi caricare e utilizzare i file .pyc quando usi il runtime Python 2.7, ma non puoi caricare una versione .py e una versione .pyc dello stesso file. Puoi caricare file .zip contenenti file .py o .pyc (o una combinazione di questi). Se carichi file .pyc, devi tenere conto di una serie di avvertenze importanti:

  • Per uno script CGI, il gestore di script deve comunque utilizzare l'estensione del file .py, anche se carichi un file .pyc.
  • Per impostazione predefinita, i file .pyc vengono ignorati durante il deployment. Devi eseguire l'override dell'elemento skip_files nel file app.yaml in modo che il nuovo valore non causi il salto dei file .pyc.
  • Devi usare Python 2.7 per creare il file .pyc. Se utilizzi una versione diversa di Python (ad esempio Python 2.6) sulla tua macchina di sviluppo, dovrai ottenere la versione 2.7 per creare un file .pyc compatibile.

Python puro 2

Tutto il codice per l'ambiente di runtime Python deve essere Python puro e non includere estensioni C o altro codice che deve essere compilato.

L'ambiente include la libreria standard Python. Alcuni moduli sono stati disabilitati perché le loro funzioni di base non sono supportate da App Engine, come il networking o la scrittura nel file system. Inoltre, è disponibile il modulo os, ma le funzionalità non supportate sono disattivate. Un tentativo di importare un modulo non supportato o di utilizzare una funzionalità non supportata genererà un'eccezione.

Alcuni moduli della libreria standard sono stati sostituiti o personalizzati per funzionare con App Engine. Questi moduli variano tra i due runtime Python, come descritto di seguito.

Librerie personalizzate in Python versione 2.7

Nel runtime Python 2.7, sono stati sostituiti o personalizzati i seguenti moduli:

  • tempfile è disabilitato, ad eccezione di TemporaryFile che ha un alias di StringIO.

  • logging è disponibile e il suo utilizzo è vivamente consigliato. Consulta Logging.

Oltre alla libreria standard Python e alle librerie di App Engine, il runtime Python versione 2.7 include diverse librerie di terze parti.

Aggiunta di librerie Python di terze parti

Puoi includere librerie Python di terze parti nell'applicazione inserendo il codice nella directory dell'applicazione. Se crei un link simbolico alla directory di una libreria nella directory dell'applicazione, questo link viene seguito e la libreria viene inclusa nell'app di cui esegui il deployment in App Engine.

Il percorso di inclusione del modulo Python include la directory principale dell'applicazione, ovvero la directory contenente il file app.yaml. I moduli Python creati nella directory root dell'applicazione sono disponibili utilizzando un percorso della directory principale. Non dimenticare di creare i file __init__.py richiesti nelle tue sottodirectory in modo che Python riconosca queste sottodirectory come pacchetti. Assicurati inoltre che le librerie non abbiano bisogno di estensioni C.

Thread

I thread possono essere creati in Python versione 2.7 utilizzando i moduli thread o threading. Tieni presente che i thread verranno uniti dal runtime al termine della richiesta, quindi non possono essere eseguiti dopo la fine della richiesta.

Thread di sfondo

Il codice in esecuzione su un'istanza con scalabilità manuale o di base può avviare un thread in background che può durare più della richiesta che lo genera. Ciò consente a un'istanza di eseguire attività periodiche o pianificate arbitrarie o di continuare a lavorare in background dopo che una richiesta è stata restituita all'utente.

Le voci os.environ e di logging di un thread in background sono indipendenti da quelle del thread di origine.

Devi importare il modulo google.appengine.api.background_thread dall'SDK per App Engine.

from google.appengine.api import background_thread

La classe BackgroundThread è come la normale classe Python threading.Threadclass, ma può sopravvivere alla richiesta che la genera. Esiste anche la funzione start_new_background_thread() che crea un thread in background e lo avvia:

# sample function to run in a background thread
def change_val(arg):
    global val
    val = arg

if auto:
    # Start the new thread in one command
    background_thread.start_new_background_thread(change_val, ['Cat'])
else:
    # create a new thread and start it
    t = background_thread.BackgroundThread(
        target=change_val, args=['Cat'])
    t.start()
Il numero massimo di thread in background simultanei creati dall'API App Engine è 10 per istanza. (Questo limite non si applica ai normali thread Java non correlati all'API App Engine.)

Strumenti

L'SDK per App Engine include strumenti per testare l'applicazione, caricare i file dell'applicazione, gestire gli indici di Datastore, scaricare i dati di log e caricare grandi quantità di dati in Datastore.

Il server di sviluppo esegue l'applicazione sul computer locale per testare l'applicazione. Il server simula i servizi Datastore e le restrizioni della sandbox. Il server di sviluppo può inoltre generare configurazioni per gli indici Datastore in base alle query eseguite dall'app durante il test.

Lo strumento gcloud gestisce tutte le interazioni dalla riga di comando con l'applicazione in esecuzione su App Engine. Utilizza gcloud app deploy per caricare la tua applicazione in App Engine o per aggiornare singoli file di configurazione, ad esempio la configurazione degli indici del datastore, che ti consente di creare nuovi indici prima di eseguire il deployment del codice. Puoi anche visualizzare i dati di log dell'app per analizzare le prestazioni dell'app utilizzando strumenti personalizzati.

Contemporaneità e latenza

La latenza dell'applicazione ha l'impatto maggiore sul numero di istanze necessarie per gestire il traffico. Se elabori rapidamente le richieste, una singola istanza può gestire molte richieste.

Le istanze a thread singolo possono gestire una singola richiesta in parallelo. Esiste quindi una relazione diretta tra la latenza e il numero di richieste che possono essere gestite nell'istanza al secondo. Ad esempio, una latenza di 10 ms equivale a 100 richiesta/secondo/istanza.

Le istanze multi-thread possono gestire molte richieste in parallelo. Esiste quindi una relazione diretta tra la CPU utilizzata e il numero di richieste al secondo.

Le app Python 2.7 supportano le richieste in parallelo, pertanto una singola istanza può gestire nuove richieste in attesa del completamento di altre. La contemporaneità riduce notevolmente il numero di istanze richieste dalla tua app, ma è necessario progettare l'app per il multi-threading.

Ad esempio, se un'istanza B4 (circa 2,4 GHz) consuma 10 Mcicli per richiesta, puoi elaborare 240 richieste/secondo/istanza. Se consuma 100 Mcicli/richiesta, puoi elaborare 24 richieste/secondo/istanza. Questi valori sono il caso ideale, ma sono abbastanza realistici in termini di ciò che si può ottenere su un'istanza.

Variabili di ambiente

Le seguenti variabili di ambiente sono impostate dal runtime:

Variabile di ambiente Descrizione
GAE_APPLICATION L'ID della tua applicazione App Engine. Questo ID è preceduto dal prefisso "region code~", ad esempio "e~" per le applicazioni di cui è stato eseguito il deployment in Europa.
GAE_DEPLOYMENT_ID L'ID del deployment attuale.
GAE_ENV L'ambiente App Engine. Impostato su standard.
GAE_INSTANCE L'ID dell'istanza su cui è attualmente in esecuzione il servizio.
GAE_RUNTIME Il runtime specificato nel file app.yaml.
GAE_SERVICE Il nome del servizio specificato nel file app.yaml. Se non viene specificato alcun nome del servizio, viene impostato su default.
GAE_VERSION L'etichetta della versione corrente del servizio.
GOOGLE_CLOUD_PROJECT L'ID progetto Google Cloud associato alla tua applicazione.
PORT La porta che riceve le richieste HTTP.

Puoi definire variabili di ambiente aggiuntive nel file app.yaml, ma i valori precedenti non possono essere sostituiti.