API Search per servizi in bundle legacy

L'API Search fornisce un modello a documenti di indicizzazione contenenti dati strutturati. Puoi eseguire ricerche in un indice, nonché organizzare e presentare i risultati di ricerca. L'API supporta la corrispondenza del testo completo su campi di stringa. I documenti e gli indici vengono salvati in un archivio permanente separato ottimizzate per le operazioni di ricerca. L'API Search può indicizzare un numero qualsiasi di documenti. La App Engine Datastore può essere più appropriato per le applicazioni che devono per recuperare set di risultati molto grandi.

Panoramica

L'API Search si basa su quattro concetti principali: documenti, indici, query e risultati.

Documenti

Un documento è un oggetto con un ID univoco e un elenco di campi contenenti e i dati di Google Cloud. Ogni campo ha un nome e un tipo. Esistono diversi tipi di campi, identificati dai tipi di valori che contengono:

  • Campo Atom: una stringa di caratteri indivisibile.
  • Campo di testo: una stringa di testo normale in cui è possibile eseguire ricerche parola per parola.
  • Campo HTML: una stringa contenente tag di markup HTML, solo il testo esterno nei tag di markup.
  • Campo numerico: un numero con virgola mobile.
  • Campo Data: un oggetto data con anno/mese/giorno e l'orario facoltativo.
  • Campo punto geografico: un oggetto dati con coordinate di latitudine e longitudine.

La dimensione massima di un documento è 1 MB.

Indici

Un indice memorizza i documenti per il recupero. Puoi recuperare un singolo documento il suo ID, un intervallo di documenti con ID consecutivi o tutti i documenti di Google. Puoi anche eseguire ricerche in un indice per recuperare i documenti che soddisfano determinati criteri per i campi e i relativi valori, specificati come stringa di query. Puoi gestire gruppi di documenti inserendoli in indici separati.

Non esiste un limite al numero di documenti in un indice o al numero di indici che puoi utilizzare. Per impostazione predefinita, la dimensione totale di tutti i documenti in un singolo indice è limitata a 10 GB. Gli utenti con il ruolo Amministratore App Engine possono inviare una richiesta dalla console Google Cloud App Engine Search per ingrandire fino a 200 GB.

Query

Per eseguire una ricerca in un indice, devi creare una query, che contiene una stringa di query e possibilmente alcune opzioni aggiuntive. Una stringa di query specifica le condizioni per i valori di uno o più campi del documento. Quando cerchi un indice, vengono restituiti solo quelli documenti nell'indice con campi che soddisfano la query.

La query più semplice, a volte chiamata "ricerca globale", è una stringa che contiene solo valori di campo. Questa ricerca utilizza una stringa per cercare documenti che contengono le parole "rosa" e "acqua":

def simple_search(index):
    index.search('rose water')

Questa ricerca trova i documenti con campi data contenenti la data 4 luglio 1776 o campi di testo che includono la stringa "1776-07-04":

def search_date(index):
    index.search('1776-07-04')

Una stringa di query può anche essere più specifica. Può contenere uno o più termini, ciascuno che indica un campo e una limitazione del valore del campo. La forma esatta di un termine dipende dal tipo di campo. Ad esempio, supponendo che esista un campo di testo chiamato "prodotto" e un campo numerico chiamato "prezzo", di seguito è riportata una stringa di query con due termini:

def search_terms(index):
    # search for documents with pianos that cost less than $5000
    index.search("product = piano AND price < 5000")

Come suggerisce il nome, le opzioni di query non sono obbligatorie. Consentono di attivare una serie di funzionalità:

  • Controlla quanti documenti vengono restituiti nei risultati della ricerca.
  • Specifica quali campi del documento includere nei risultati. L'impostazione predefinita è includere tutti i campi del documento originale. Puoi specificare che I risultati includono solo un sottoinsieme di campi (il documento originale non è interessato).
  • Ordina i risultati.
  • Creare "campi calcolati" per i documenti con FieldExpressions e i campi di testo ridotti snippet.
  • Supporta la visualizzazione dei risultati di ricerca tramite pagine restituendo solo una parte dei documenti corrispondenti per ogni query (utilizzando offset e cursori)

Ti consigliamo di registrare le stringhe di query nella tua applicazione se vuoi mantenere delle query eseguite.

Risultati di ricerca

Una chiamata a search() può restituire solo un numero limitato di documenti corrispondenti. La ricerca potrebbe trovare più documenti di quelli che possono essere restituiti in una singola chiamata. Ogni chiamata di ricerca restituisce un'istanza della classe SearchResults che contiene informazioni sul numero di documenti trovati e su quanti sono stati restituiti, oltre all'elenco dei documenti restituiti. Puoi ripetere la stessa ricerca, utilizzando cursori o offset per recuperare il set completo di documenti corrispondenti.

Materiale di formazione aggiuntivo

Oltre a questa documentazione, puoi leggere il corso di formazione in due parti sull'API Search all'Academy per sviluppatori Google. Il corso include un'applicazione Python di esempio.

Documenti e campi

La classe Document rappresenta i documenti. Ogni documento ha un identificatore del documento e un elenco di campi.

Identificatore documento

Ogni documento in un indice deve avere un identificatore di documento univoco o doc_id. L'identificatore può essere utilizzato per recuperare un documento da un indice senza eseguire una ricerca. Per impostazione predefinita, l'API Search genera automaticamente un doc_id quando viene creato un documento. Puoi anche specificare il doc_id autonomamente quando crei un documento. Un elemento doc_id deve contenere solo caratteri ASCII visibili e stampabili (codici ASCII da 33 a 126 inclusi) e non più di 500 caratteri. Un identificatore di documento non può iniziare con un punto esclamativo ("!") e non può iniziare e terminare con trattini bassi doppi ("__").

Sebbene sia conveniente creare identificatori di documenti univoci leggibili e significativi, non puoi includere doc_id in una ricerca. Pensa a questo scenario: avere un indice con documenti che rappresentano le parti, utilizzando il numero seriale numero come doc_id. Sarà molto efficiente recuperare il documento per ogni singola parte, ma sarà impossibile cercare una serie di numeri insieme ad altri valori di campo, come la data di acquisto. Memorizzazione del numero di serie numero in un campo atomico risolve il problema.

Campi documento

Un documento contiene campi con un nome, un tipo e un singolo valore di quel tipo. Due o più campi possono avere lo stesso nome, ma tipi diversi. Ad esempio, puoi definire due campi con il nome "età": uno con un tipo di testo (valore "ventidue") e l'altro con un tipo di numero (valore 22).

Nomi dei campi

I nomi dei campi sono sensibili alle maiuscole e possono contenere solo caratteri ASCII. Devono iniziare con una lettera e possono contenere lettere, cifre o trattini bassi. Nome di un campo non può contenere più di 500 caratteri.

Campi con più valori

Un campo può contenere un solo valore, che deve corrispondere al tipo di campo. I nomi dei campi non devono essere univoci. Un documento può avere più campi con lo stesso nome e lo stesso tipo, un modo per rappresentare un campo con più valori. Tuttavia, i campi di date e numeri con lo stesso nome non possono essere ripetuti. Un documento può anche contenere più campi con lo stesso nome diversi.

Tipi di campo

Esistono tre tipi di campi che memorizzano stringhe di caratteri. Li chiamiamo collettivamente campi di stringa:

  • Campo di testo: una stringa con una lunghezza massima di 1024**2 caratteri.
  • Campo HTML: una stringa in formato HTML con una lunghezza massima di 1024**2 caratteri.
  • Campo Atom: una stringa di lunghezza massima di 500 caratteri.

Esistono anche tre tipi di campi per l'archiviazione di dati non testuali:

  • Campo numerico: un valore in virgola mobile a doppia precisione compreso tra -2.147.483.647 e 2.147.483.647.
  • Campo data: A datetime.date o datetime.datetime.
  • Campo punti geografici: un punto sulla Terra descritto da latitudine e longitudine coordinate.

I tipi di campo sono specificati dalle classi TextField, HtmlField, AtomField, NumberField, DateField, e GeoField.

Trattamento speciale dei campi di stringhe e date

Quando un documento con data, testo o I campi HTML vengono aggiunti a un indice; viene effettuata una gestione speciale. Per utilizzare l'API Search in modo efficace, è utile comprendere cosa succede "sotto il cofano".

Tokenizzazione dei campi stringa

Quando un campo HTML o di testo viene indicizzato, i relativi contenuti vengono tokenizzati. La stringa viene suddivisa in token ogni volta che vengono visualizzati spazi vuoti o caratteri speciali (segni di punteggiatura, segno di cancelletto, barra di sbarramento e così via). L'indice includerà una voce per ogni token. In questo modo puoi cercare parole chiave e frasi che includono solo una parte del valore di un campo. Ad esempio, una ricerca di "buio" corrisponderà a un documento con un campo di testo contenente la stringa "era una notte buia e tempestosa", mentre una ricerca di "ora" corrisponderà a un documento con un campo di testo contenente la stringa "questo è un sistema in tempo reale".

Nei campi HTML, il testo all'interno dei tag markup non viene tokenizzato, pertanto un documento con un campo HTML contenente it was a <strong>dark</strong> night corrisponderà a una ricerca di "notte", ma non di "forte". Se vuoi poter cercare il testo markup, memorizzalo in un campo di testo.

I campi di atomi non vengono tokenizzati. Un documento con un campo atomo con il valore "maltempo" corrisponderà solo a una ricerca dell'intera stringa "maltempo". Non corrisponderà a una ricerca di "cattivo" o "meteo" da solo.

Regole di tokenizzazione
  • Il trattino basso (_) e la e commerciale (&) non suddividono le parole in di token.

  • Questi caratteri di spaziatura suddividono sempre le parole in token: spazio, ritorno a capo, avanzamento riga, tabulazione orizzontale, tabulazione verticale, a capo di modulo e NULL.

  • Questi caratteri vengono trattati come punteggiatura e suddivideranno le parole in token:

    !"%()
    *,-|/
    []]^`
    :=>?@
    {}~$
  • I caratteri nella tabella seguente di solito suddividono le parole in token, ma possono essere gestiti in modo diverso a seconda del contesto in cui vengono visualizzate:

    Basato su caratteri Regola
    < In un campo HTML, il segno "meno" indica l'inizio di un tag HTML che viene ignorato.
    + Una stringa composta da uno o più "plus" vengono trattati come parte della parola se compare alla fine della parola (C++).
    # L'"hash" viene trattato come parte della parola se è preceduta da a, b, c, d, e, f, g, j o x (a# - g# sono note musicali; j# e x# sono linguaggio di programmazione, c# sono entrambi). Se un termine è preceduto da "#" (#google), viene trattato come un hashtag e l'hash diventa parte della parola.
    ' L'apostrofo è una lettera se precede la lettera "s" seguito da un'interruzione di parola, come in "John's hat".
    . Se tra le cifre è presente un punto decimale, questo fa parte di un numero (ovvero del separatore decimale). Può anche essere parte di una parola se utilizzata in un acronimo (A.B.C).
    - Il trattino fa parte di una parola se usato in un acronimo (I-B-M).
  • Tutti gli altri caratteri a 7 bit diversi da lettere e cifre ("A-Z", "a-z", "0-9") vengono trattati come punteggiatura e suddividono le parole in token.

  • Tutto il resto viene analizzato come carattere UTF-8.

Acronimi

La tokenizzazione utilizza regole speciali per riconoscere gli acronimi (stringhe come "I.B.M.", "a-b-c" o "C I A"). Un acronimo è una stringa di singoli caratteri alfabetici, con lo stesso carattere separatore tra tutti i caratteri. I separatori validi sono il punto, il trattino o un numero qualsiasi di spazi. Il carattere separatore viene rimosso dalla stringa quando un acronimo viene tokenizzato. Pertanto, le stringhe di esempio menzionate sopra diventano i token "ibm", "abc" e "cia". Il testo originale rimane nel campo del documento.

Quando hai a che fare con gli acronimi, tieni presente che:

  • Un acronimo non può contenere più di 21 lettere. Una stringa di acronimi valida con più di 21 lettere verrà suddivisa in una serie di acronimi, ciascuno con massimo 21 lettere.
  • Se le lettere di un acronimo sono separate da spazi, tutte le lettere devono essere in maiuscolo. Gli acronimi creati con punto e trattino possono usare lettere maiuscole e minuscole lettere.
  • Quando cerchi un acronimo, puoi inserire la forma canonica dell'acronimo (la stringa senza separatori) o l'acronimo con il trattino o il punto (ma non entrambi) tra le lettere. Il testo "I.B.M" potresti essere recuperate con uno dei termini di ricerca "I-B-M", "I.B.M" o "IBM".

Precisione del campo della data

Quando crei un campo data in un documento, imposta il relativo valore su datetime.date o datetime.datetime. Tieni presente che è possibile utilizzare solo gli oggetti di data e ora "naive" di Python. Gli oggetti "Aware" non sono consentiti. . Ai fini dell'indicizzazione e della ricerca nel campo della data, qualsiasi componente temporale viene ignorato e la data viene convertita nel numero di giorni dal 1° gennaio 1970 UTC. Questo significa che anche se il campo Data può contenere un valore di tempo preciso; una query relativa a una data può specificare solo valore del campo data nel modulo yyyy-mm-dd. Ciò significa anche che l'ordine ordinato dei campi della data con la stessa data non è ben definito.

Altre proprietà del documento

Il ranking di un documento è un numero intero positivo che determina il valore predefinito l'ordine dei documenti restituiti da una ricerca. Per impostazione predefinita, il ranking viene impostato al momento della creazione del documento sul numero di secondi dal 1° gennaio 2011. Puoi impostare il ranking in modo esplicito quando crei un documento. Non è buona idea assegnare lo stesso ranking a molti documenti e non dovresti mai assegnare lo stesso ranking a più di 10.000 documenti. Se specifichi sort options, puoi utilizzare il ranking come chiave di ordinamento. Tieni presente che quando il ranking viene utilizzato in un'espressione di ordinamento o in un'espressione di campo, viene fatto riferimento a _rank.

La language specifica la lingua in che i campi sono codificati.

Per ulteriori dettagli su questi attributi, consulta la pagina di riferimento della classe Document.

Collegamento da un documento ad altre risorse

Puoi utilizzare l'doc_id e altri campi di un documento come link ad altri risorse nella tua applicazione. Ad esempio, se utilizzi Blobstore che puoi associare il documento con un blob specifico impostando doc_id o il valore di un Campo Atom alla BlobKey dei dati.

Creazione di un documento

Il seguente esempio di codice mostra come creare un oggetto documento. Il documento viene chiamato con l'argomento campi impostato su un elenco di oggetti campo. Ogni oggetto nell'elenco viene creato e inizializzato utilizzando la funzione del costruttore della classe del campo. Tieni presente l'utilizzo del costruttore GeoPoint e della classe datetime di Python per creare i tipi appropriati di valori di campo.

def create_document():
    document = search.Document(
        # Setting the doc_id is optional. If omitted, the search service will
        # create an identifier.
        doc_id='PA6-5000',
        fields=[
            search.TextField(name='customer', value='Joe Jackson'),
            search.HtmlField(
                name='comment', value='this is <em>marked up</em> text'),
            search.NumberField(name='number_of_visits', value=7),
            search.DateField(name='last_visit', value=datetime.now()),
            search.DateField(
                name='birthday', value=datetime(year=1960, month=6, day=19)),
            search.GeoField(
                name='home_location', value=search.GeoPoint(37.619, -122.37))
        ])
    return document

Utilizzare un indice

Inserire i documenti in un indice

Quando inserisci un documento in un indice, questo viene copiato in storage e ognuno dei suoi campi viene indicizzato in base a nome, tipo e doc_id.

Il seguente esempio di codice mostra come accedere a un indice e inserire un documento in li annotino.

def add_document_to_index(document):
    index = search.Index('products')
    index.put(document)
Puoi trasferire fino a 200 documenti alla volta al metodo put(). L'elaborazione collettiva è più efficiente rispetto all'aggiunta dei documenti uno alla volta.

Quando inserisci un documento in un indice che contiene già un documento con lo stesso doc_id, il nuovo documento sostituisce quello precedente. Nessun avviso è fornite. Puoi chiamare Index.get(id) prima di creare o aggiungere un documento a un indice per verificare se un determinato doc_id esiste già.

Il metodo put restituisce un elenco di PutResults, uno per ogni documento passato come argomento. Se non hai specificato doc_id, puoi esaminare l'attributo id del risultato per individua doc_id che è stato generato:

def add_document_and_get_doc_id(documents):
    index = search.Index('products')
    results = index.put(documents)
    document_ids = [document.id for document in results]
    return document_ids

Tieni presente che la creazione di un'istanza di Index non garantisce che dell'indice permanente esistente. Un indice permanente viene creato la prima volta che lo aggiungi un documento con il metodo put. Se vuoi verificare se un l'indice esiste prima di iniziare a utilizzarlo, usa search.get_indexes() personalizzata.

Aggiornamento dei documenti

Un documento non può essere modificato dopo averlo aggiunto a un indice. Non puoi aggiungere o rimuovi campi o modifica il valore di un campo. Tuttavia, puoi sostituire il documento con un nuovo documento che abbia lo stesso doc_id.

Recupero dei documenti per doc_id

Esistono due modi per recuperare i documenti da un indice utilizzando gli identificatori dei documenti:
  • Utilizza Index.get() per recuperare un singolo documento tramite il relativo doc_id.
  • Utilizza Index.get_range() per recuperare un gruppo di documenti consecutivi ordinati in base a doc_id.

Ogni chiamata è illustrata nell'esempio riportato di seguito.

def get_document_by_id():
    index = search.Index('products')

    # Get a single document by ID.
    document = index.get("AZ125")

    # Get a range of documents starting with a given ID.
    documents = index.get_range(start_id="AZ125", limit=100)

    return document, documents

Ricerca di documenti in base ai contenuti

Per recuperare i documenti da un indice, devi creare una stringa di query e chiamare Index.search(). La stringa di query può essere passata direttamente come argomento oppure puoi includerla in un oggetto Query che viene passato come argomento. Per impostazione predefinita, search() restituisce i documenti corrispondenti ordinati in ordine decrescente di ranking. Per controllare quanti documenti vengono o come vengono ordinati o aggiungere campi calcolati ai risultati, è necessario per utilizzare un oggetto Query, che contiene una stringa di query e può anche specificare altre opzioni di ricerca e ordinamento.

def query_index():
    index = search.Index('products')
    query_string = 'product: piano AND price < 5000'

    results = index.search(query_string)

    for scored_document in results:
        print(scored_document)

Eliminazione di un indice

Ogni indice è costituito dai documenti indicizzati e da uno schema di indice. Per eliminare un indice: eliminare tutti i documenti in un indice e poi eliminare lo schema dell'indice.

Puoi eliminare i documenti in un indice specificando il doc_id di uno o più documenti da eliminare nel metodo Index.delete(). Per migliorare l'efficienza, ti consigliamo di eliminare i documenti in batch. Puoi passare fino a 200 ID documento alla volta al metodo delete().

def delete_index(index):
    # index.get_range by returns up to 100 documents at a time, so we must
    # loop until we've deleted all items.
    while True:
        # Use ids_only to get the list of document IDs in the index without
        # the overhead of getting the entire document.
        document_ids = [
            document.doc_id
            for document
            in index.get_range(ids_only=True)]

        # If no IDs were returned, we've deleted everything.
        if not document_ids:
            break

        # Delete the documents for the given IDs
        index.delete(document_ids)

    # delete the index schema
    index.delete_schema()
Puoi trasferire fino a 200 documenti alla volta al metodo delete(). Eliminare più elementi contemporaneamente è più efficiente che gestirli uno alla volta.

Coerenza finale

Quando inserisci, aggiorni o elimini un documento in un indice, la modifica si propaga in più data center. Questo di solito avviene rapidamente, ma quando possono variare. L'API Search garantisce la coerenza finale. Ciò significa che in alcuni casi, una ricerca o il recupero di uno o più documenti potrebbe restituire risultati che non riflettono le modifiche più recenti.

Determinare le dimensioni di un indice

Un indice archivia i documenti per il recupero. Puoi recuperare un singolo documento tramite il relativo ID, un intervallo di documenti con ID consecutivi o tutti i documenti di un indice. Puoi anche eseguire ricerche in un indice per recuperare i documenti che soddisfano determinati criteri per i campi e i relativi valori, specificati come stringa di query. Puoi gestire gruppi di documenti inserendoli in indici separati. Non esiste un limite al numero di documenti in un indice o al numero di indici che puoi utilizzare. La la dimensione totale di tutti i documenti in un singolo indice è limitata a 10 GB per impostazione predefinita ma possono essere aumentati fino a 200 GB inviando una richiesta dal App Engine Search della console Google Cloud . La proprietà index storage_limit è la dimensione massima consentita di un indice.

La proprietà dell'indice storage_usage è una stima della quantità di spazio di archiviazione utilizzata da un indice. Questo numero è una stima perché il sistema di monitoraggio dell'indice non viene eseguito continuamente; l'utilizzo effettivo viene calcolato periodicamente. Il valore storage_usage viene modificato tra i punti di campionamento tenendo conto delle aggiunte di documenti, ma non delle eliminazioni.

Esecuzione di operazioni asincrone

Puoi utilizzare le chiamate asincrone per eseguire più operazioni senza bloccare, quindi recuperare tutti i risultati contemporaneamente, bloccando solo una volta. Ad esempio, il seguente codice esegue più ricerche in modo asincrono:

def async_query(index):
    futures = [index.search_async('foo'), index.search_async('bar')]
    results = [future.get_result() for future in futures]
    return results

Schemi di indice

Ogni indice ha uno schema che mostra tutti i nomi e i tipi di campo che compaiono nei documenti che contiene. Non puoi definire uno schema autonomamente. Gli schemi vengono gestiti in modo dinamico e vengono aggiornati man mano che i documenti vengono aggiunti a un indice. Un semplice schema potrebbe avere il seguente aspetto, in formato JSON:

{'comment': ['TEXT'], 'date': ['DATE'], 'author': ['TEXT'], 'count': ['NUMBER']}

Ogni chiave del dizionario è il nome di un campo del documento. Il valore della chiave è un dei tipi di campo utilizzati con il nome di quel campo. Se hai utilizzato lo stesso nome campo con tipi di campi diversi lo schema elenca più di un campo digita il nome di un campo, come in questo esempio:

{'ambiguous-integer': ['TEXT', 'NUMBER', 'ATOM']}

Una volta visualizzato in uno schema, un campo non può mai essere rimosso. Non è possibile eliminare un campo, anche se l'indice non contiene più documenti con quel particolare nome campo.

Puoi visualizzare gli schemi per gli indici in questo modo:

from google.appengine.api import search
...
for index in search.get_indexes(fetch_schema=True):
    logging.info("index %s", index.name)
    logging.info("schema: %s", index.schema)
Tieni presente che una chiamata a get_indexes non può restituire più di 1000 indici. Per recuperare altri indici, chiama ripetutamente la funzione utilizzando l'argomento start_index_name.

Uno schema non definisce una "classe" nel senso della programmazione ad oggetti. Per quanto riguarda l'API Search, ogni documento è univoco e gli indici possono contenere diversi tipi di documenti. Se vuoi trattare raccolte di oggetti con lo stesso elenco di campi delle istanze di una classe, è un'astrazione che devi in modo forzato nel codice. Ad esempio, puoi assicurarti che tutti i documenti con lo stesso insieme di campi vengano conservati nel proprio indice. Lo schema dell'indice può essere considerato come la definizione della classe e ogni documento nell'indice è un'istanza della classe.

Visualizzazione degli indici nella console Google Cloud

Nella console Google Cloud, puoi visualizzare informazioni sugli indici della tua applicazione e sui documenti che contengono. Se fai clic sul nome di un indice, vengono visualizzati i documenti che contiene. Vedrai tutti i campi schema definiti per l'indice; per ogni documento con un campo con questo nome, vedrai il valore del campo. Puoi anche eseguire query sui dati dell'indice direttamente dalla console.

Quote dell'API Search

L'API Search prevede diverse quote gratuite:

Risorsa o chiamata API Quota gratuita
Capacità di archiviazione totale (documenti e indici) 0,25 GB
Query 1000 query al giorno
Aggiunta di documenti agli indici 0,01 GB al giorno

L'API Search impone questi limiti per garantire l'affidabilità del servizio. Si applicano sia alle app gratuite che a quelle a pagamento:

Risorsa Quota di sicurezza
Utilizzo massimo delle query 100 minuti aggregati di tempo di esecuzione della query al minuto
Numero massimo di documenti aggiunti o eliminati 15.000 al minuto
Dimensione massima per indice (numero illimitato di indici consentiti) 10 GB

L'utilizzo dell'API viene conteggiato in modi diversi a seconda del tipo di chiamata:

  • Index.search(): ogni chiamata API viene conteggiata come una query; è il tempo di esecuzione equivalente alla latenza della chiamata.
  • Index.put(): quando aggiungi documenti agli indici, le dimensioni di ogni documento e il numero di documenti vengono conteggiati ai fini della quota di indicizzazione.
  • Tutte le altre chiamate all'API Search vengono conteggiate in base al numero di operazioni che comporta:
    • search.get_indexes(): 1 operazione è contato per ciascun indice effettivamente restituito oppure 1 operazione se non viene restituito nulla restituito.
    • Index.get() e Index.get_range(): 1 operazione conteggiata per ogni documento effettivamente restituito oppure 1 operazione se non viene restituito nulla.
    • Index.delete(): viene conteggiata un'operazione per ogni documento nella richiesta o un'operazione se la richiesta è vuota.

La quota sul throughput delle query viene impostata in modo che un singolo utente non possa monopolizzare il servizio di ricerca. Poiché le query possono essere eseguite contemporaneamente, ogni applicazione può eseguire query che consumano fino a 100 minuti di tempo di esecuzione a un minuto di tempo. Se esegui molte query brevi, probabilmente non raggiungeranno questo limite. Una volta superata la quota, le query successive non andranno a buon fine fino al successivo intervallo di tempo, quando la quota verrà ripristinata. La quota non è rigorosamente in porzioni da un minuto; una variante del l'algoritmo leaky bucket viene utilizzato controllare la larghezza di banda della ricerca con incrementi di cinque secondi.

Per ulteriori informazioni sulle quote, consulta la pagina Quote . Quando un'app tenta di superare questi valori, viene restituito un errore di quota insufficiente restituito.

Tieni presente che, sebbene questi limiti vengano applicati al minuto, la console mostra i totali giornalieri per ciascuno. Clienti con L'assistenza Silver, Gold o Platinum può richiedere una maggiore di velocità effettiva massima contattando il rappresentante dell'assistenza.

Prezzi dell'API Search

I seguenti addebiti vengono applicati all'utilizzo oltre le quote gratuite:

Risorsa Costo
Capacità di archiviazione totale (documenti e indici) 0,18 $ per GB al mese
Query 0,50 $ per 10.000 query
Indicizzazione dei documenti disponibili per la ricerca 2,00 $ per GB

Puoi trovare ulteriori informazioni sui prezzi nella pagina Prezzi.