L'API Blobstore consente all'applicazione di gestire oggetti di dati, denominati BLOB,molto più grandi delle dimensioni consentite per gli oggetti nel servizio Datastore. I BLOB sono utili per pubblicare file di grandi dimensioni, ad esempio file video o immagine, e per consentire agli utenti di caricare file di dati di grandi dimensioni. I blob vengono creati caricando un file tramite una richiesta HTTP. In genere, le applicazioni lo fanno presentando all'utente un modulo con un campo per il caricamento di file. Una volta inviato il modulo, l'archivio BLOB crea un BLOB dai contenuti del file e restituisce un riferimento opaco al BLOB, chiamato chiave BLOB,che puoi utilizzare in un secondo momento per pubblicare il blob. L'applicazione può fornire il valore del blob completo in risposta alla richiesta di un utente oppure può leggere il valore direttamente utilizzando un'interfaccia simile a un file in modalità flusso.
Introduzione al Blobstore
Google App Engine include il servizio Blobstore, che consente alle applicazioni di gestire oggetti dati limitati solo dalla quantità di dati che possono essere caricati o scaricati tramite una singola connessione HTTP. Questi oggetti sono chiamati valori dell'archivio BLOB o BLOB. I valori dell'archivio BLOB vengono pubblicati come risposte dagli elaboratori delle richieste e vengono creati come caricamenti tramite moduli web. Le applicazioni non creano direttamente i dati dei blob, ma indirettamente tramite un modulo web inviato o un'altra richiesta HTTP POST
. I valori di Blobstore possono essere mostrati all'utente o essere accessibili dall'applicazione in uno stream simile a un file utilizzando l'API Blobstore.
Per chiedere a un utente di caricare un valore Blobstore, la tua applicazione presenta un modulo web con un campo di caricamento file. L'applicazione genera l'URL di azione del modulo chiamando l'API Blobstore. Il browser dell'utente carica il file direttamente nel Blobstore tramite l'URL generato. L'archivio BLOB archivia quindi il blob, riscrive la richiesta in modo che contenga la chiave BLOB e la passa a un percorso nell'applicazione. Un gestore di richieste in quel percorso della tua applicazione può eseguire ulteriori elaborazioni dei moduli.
Per pubblicare un blob, l'applicazione imposta un'intestazione nella risposta in uscita e App Engine sostituisce la risposta con il valore del blob.
Dopo la creazione, i BLOB non possono essere modificati, ma possono essere eliminati. A ogni blob è associato un record di informazioni sul blob, archiviato nel datastore, che fornisce dettagli sul blob, ad esempio la data e l'ora di creazione e il tipo di contenuti. Puoi utilizzare la chiave del blob per recuperare i record di informazioni del blob ed eseguire query sulle relative proprietà.
Un'applicazione può leggere un valore di Blobstore una parte alla volta utilizzando una chiamata API. La dimensione della porzione può raggiungere le dimensioni massime del valore restituito da un'API. Questa dimensione è di poco inferiore a 32 megabyte, rappresentata in Python dalla costante google.appengine.ext.blobstore.MAX_BLOB_FETCH_SIZE
. Un'applicazione non può creare o modificare i valori di Blobstore, tranne tramite i file caricati dall'utente.
Utilizzo di Blobstore
Le applicazioni possono utilizzare Blobstore per accettare file di grandi dimensioni come caricamenti da parte degli utenti e per pubblicarli. I file vengono chiamati blob dopo il caricamento. Le applicazioni non accedono direttamente ai blob. Le applicazioni utilizzano invece i BLOB tramite entità di informazioni BLOB (rappresentate dalla classe BlobInfo
) nel datastore.
L'utente crea un blob inviando un modulo HTML che include uno o più campi di input del file. La tua applicazione chiama create_upload_url()
per ottenere la destinazione (azione) di questo modulo, passando alla funzione un percorso URL di un gestore nella tua applicazione. Quando l'utente invia il modulo, il browser dell'utente carica i file specificati direttamente nell'archivio BLOB. Blobstore riscrive la richiesta dell'utente e archivia i dati del file caricato, sostituendo i dati del file caricato con una o più chiavi blob corrispondenti, quindi passa la richiesta riscritta al gestore nel percorso dell'URL che hai fornito a create_upload_url()
. Questo gestore può eseguire ulteriori elaborazioni in base alla chiave BLOB.
L'applicazione può leggere parti di un valore Blobstore utilizzando un'interfaccia di streaming simile a un file. Vedi Il corso BlobReader
.
Caricamento di un blob
Per creare e caricare un blob:
1. Creare un URL di caricamento
Chiama blobstore.create_upload_url()
per creare un URL di caricamento per il modulo che l'utente dovrà compilare, passando il percorso dell'applicazione da caricare al termine del POST
del modulo.
Esiste una versione asincrona, create_upload_url_async()
. Consente di continuare a eseguire il codice dell'applicazione mentre Blobstore genera l'URL di caricamento.
2. Crea un modulo di caricamento
Il modulo deve includere un campo di caricamento file e enctype
del modulo deve essere impostato su multipart/form-data
. Quando l'utente invia il modulo, POST
viene gestito dall'API Blobstore, che crea il blob. L'API crea anche un record di informazioni per il blob e lo archivia nel datastore, poi passa la richiesta riscritta all'applicazione nel percorso specificato come chiave blob.
3. Implementa il gestore del caricamento
In questo gestore, puoi memorizzare la chiave del blob con il resto del modello di dati dell'applicazione. La chiave del blob rimane accessibile dall'entità di informazioni del blob nel datastore. Tieni presente che, dopo che l'utente ha inviato il modulo e viene chiamato il tuo gestore, il blob è già stato salvato e le informazioni del blob sono state aggiunte al datastore. Se la tua applicazione non vuole conservare il blob, devi eliminarlo immediatamente per evitare che diventi orfano:
Il webapp framework fornisce la classe di gestore del caricamento blobstore_handlers.BlobstoreUploadHandler
per aiutarti ad analizzare i dati del modulo. Per ulteriori informazioni, consulta la documentazione di riferimento per BlobstoreUploadHandler
.
Quando l'archivio BLOB riscrive la richiesta dell'utente, il corpo delle parti MIME dei file caricati viene svuotato e la chiave BLOB viene aggiunta come intestazione della parte MIME. Tutti gli altri campi e parti del modulo vengono conservati e passati al gestore del caricamento. Se non specifichi un tipo di contenuto, l'archivio BLOB proverà a deducerlo dall'estensione del file. Se non è possibile determinare il tipo di contenuti, al blob appena creato viene assegnato il tipo di contenuti application/octet-stream
.
Pubblicazione di un blob
Per pubblicare i BLOB, devi includere un gestore del download dei BLOB come percorso nell'applicazione. L'applicazione gestisce un blob impostando un'intestazione sulla risposta in uscita. L'esempio seguente utilizza il framework webapp
. Quando utilizzi webapp
, l'handler deve passare la chiave del blob per il blob desiderato a self.send_blob()
. In questo esempio, la chiave blob viene passata al gestore dei download come parte dell'URL. In pratica, il gestore dei download può ottenere la chiave blob con qualsiasi mezzo a tua scelta, ad esempio tramite un altro metodo o un'azione utente.
Il framework della web app fornisce la classe di gestore dei download blobstore_handlers.BlobstoreDownloadHandler
per aiutarti ad analizzare i dati del modulo. Per ulteriori informazioni, consulta il riferimento a BlobstoreDownloadHandler
.
I BLOB possono essere pubblicati da qualsiasi URL dell'applicazione. Per pubblicare un blob nell'applicazione, dovrai inserire un'intestazione speciale nella risposta contenente la chiave blob. App Engine sostituisce il corpo della risposta con i contenuti del blob.
Intervalli di byte BLOB
L'archivio BLOB supporta la gestione di parte di un valore grande anziché del valore completo in risposta a una richiesta. Per pubblicare un valore parziale, includi l'intestazione X-AppEngine-BlobRange
nella risposta in uscita. Il suo valore è un intervallo di byte HTTP standard. La numerazione di byte è in base zero. Un valore X-AppEngine-BlobRange
vuoto indica all'API di ignorare l'intestazione dell'intervallo e di pubblicare il blob completo. Ecco alcuni esempi di intervalli:
0-499
pubblica i primi 500 byte del valore (da 0 a 499 inclusi).500-999
gestisce 500 byte a partire dal 501° byte.500-
gestisce tutti i byte a partire dal 501° byte fino alla fine del valore.-500
pubblica gli ultimi 500 byte del valore.
Se l'intervallo di byte è valido per il valore dell'archivio BLOB, quest'ultimo invia al client un codice di stato 206
Partial
Content
e l'intervallo di byte richiesto. Se l'intervallo non è valido per il valore, l'archivio BLOB invia 416
Requested
Range
Not
Satisfiable
.
L'archivio BLOB non supporta più intervalli di byte in una singola richiesta (ad esempio 100-199,200-299
), indipendentemente dal fatto che si sovrappongano o meno.
La classe webapp.blobstore_handlers.BlobstoreDownloadHandler
include funzionalità per impostare questo intestazione utilizzando gli indici di byte forniti e per dedurre automaticamente l'intervallo di byte da un intestazione range
fornita dall'utente.
Completa l'applicazione di esempio
Nella seguente applicazione di esempio, l'URL principale dell'applicazione carica il modulo che richiede all'utente un file da caricare e il gestore del caricamento chiama immediatamente il gestore dei download per pubblicare i dati. Questo serve a semplificare l'applicazione di esempio. In pratica, probabilmente non useresti l'URL principale per richiedere i dati di caricamento né pubblicheresti immediatamente un blob che avevi appena caricato.
Utilizzo del servizio Immagini con Blobstore
Il servizio Immagini può utilizzare un valore Blobstore come origine di una trasformazione. L'immagine di origine può raggiungere le dimensioni massime consentite per un valore di Blobstore. Il servizio Images restituisce comunque l'immagine trasformata all'applicazione, quindi l'immagine trasformata deve avere dimensioni inferiori a 32 MB. Questa opzione è utile per creare miniature di fotografie di grandi dimensioni caricate dagli utenti.
Per informazioni sull'utilizzo del servizio Images con i valori dell'archivio BLOB, consulta la documentazione del servizio immagini.
Utilizzo dell'API Blobstore con Google Cloud Storage
Puoi utilizzare l'API Blobstore per archiviare i BLOB in Cloud Storage anziché in Blobstore. Devi configurare un bucket come descritto nella documentazione di Google Cloud Storage e specificare il bucket e il nome file nel parametro blobstore.blobstore.create_upload_url gs_bucket_name
. Nel gestore di caricamento, devi elaborare i metadati FileInfo restituiti e archiviare esplicitamente il nome file Google Cloud Storage necessario per recuperare il blob in un secondo momento.
Puoi gestire oggetti Cloud Storage anche utilizzando l'API Blobstore. I seguenti snippet di codice spiegano come eseguire questa operazione:
Utilizzo di BlobReader
Un'applicazione può leggere i dati dai valori dell'archivio BLOB utilizzando un'interfaccia simile a
un file Python file
. Questa interfaccia può iniziare a leggere un valore in qualsiasi posizione del byte e utilizza più chiamate di servizio e buffering, in modo che un'applicazione possa accedere alle dimensioni complete del valore nonostante il limite di dimensioni di una singola risposta alla chiamata di servizio.
La classe BlobReader
può accettare uno dei tre valori come argomento del suo costruttore:
L'oggetto implementa i metodi file di uso comune per la lettura del valore. L'applicazione non può modificare il valore di Blobstore; i metodi di file per la scrittura non sono implementati.
Esecuzione di richieste asincrone
Un'applicazione può chiamare alcune funzioni dell'archivio BLOB che funzionano in background. Il Blobstore esegue la richiesta mentre l'applicazione fa altre cose. Per effettuare la richiesta, l'applicazione chiama una funzione asincrona. La funzione restituisce immediatamente un oggetto RPC che rappresenta la richiesta. Quando l'applicazione ha bisogno del risultato della richiesta, chiama il metodo get_result()
dell'oggetto RPC.
Se il servizio non ha completato la richiesta quando l'applicazione chiama get_result()
, il metodo attende fino al completamento della richiesta (o al raggiungimento della scadenza o alla comparsa di un errore). Il metodo restituisce l'oggetto risultato o solleva un'eccezione se si è verificato un errore durante l'esecuzione della richiesta. Ad esempio, questo snippet di codice
upload_url = blobstore.create_upload_url('/upload')
slow_operation()
self.response.out.write("""<form action="%s" method="POST"
enctype="multipart/form-data">""" % upload_url)
diventa
upload_url_rpc = blobstore.create_upload_url_async('/upload')
slow_operation()
upload_url = upload_url_rpc.get_result()
self.response.out.write("""<form action="%s" method="POST"
enctype="multipart/form-data">""" % upload_url)
In questo esempio, l'applicazione esegue il codice slow_operation()
nello stesso momento in cui Blobstore genera l'URL di caricamento.
Quote e limiti
Lo spazio utilizzato per i valori di Blobstore contribuisce alla quota Dati archiviati (fatturabili). Le entità di informazioni sui blob nel datastore vengono conteggiate ai fini dei limiti relativi al datastore. Tieni presente che Google Cloud Storage è un servizio a pagamento per utilizzo; ti verrà addebitato in base al listino prezzi di Cloud Storage.
Per ulteriori informazioni sulle quote di sicurezza a livello di sistema, consulta la sezione Quote.
Oltre alle quote di sicurezza a livello di sistema, si applicano i seguenti limiti specificamente all'utilizzo dell'archivio BLOB:
- La dimensione massima dei dati dell'archivio BLOB che possono essere letti dall'applicazione con una chiamata API è di 32 MB.
- Il numero massimo di file che possono essere caricati in un singolo modulo POST è 500.