Questa pagina è stata tradotta dall'API Cloud Translation.

Utilizzo dei risultati delle query memorizzati nella cache

BigQuery scrive tutti i risultati delle query in una tabella. La tabella è identificata esplicitamente dall'utente (una tabella di destinazione) oppure è una tabella temporanea con risultati memorizzati nella cache. Se esegui nuovamente la stessa identica query, <x0A>BigQuery restituisce i risultati della tabella memorizzata nella cache, se esiste. Le tabelle dei risultati temporanee memorizzate nella cache vengono gestite per utente e per progetto. A seconda della tua versione, potresti avere accesso ai risultati memorizzati nella cache di altri utenti che eseguono query nello stesso progetto. Non sono previsti costi di archiviazione per le tabelle dei risultati delle query memorizzate nella cache, ma se scrivi i risultati delle query in una tabella permanente, ti viene addebitato un costo per l'archiviazione dei dati.

Tutti i risultati delle query, incluse le query interattive e collettive, vengono memorizzati nella cache in tabelle temporanee per circa 24 ore, con alcune eccezioni.

Limitazioni

L'utilizzo della cache delle query è soggetto alle seguenti limitazioni:

Quando esegui una query duplicata, BigQuery tenta di riutilizzare i risultati memorizzati nella cache. Per recuperare i dati dalla cache, il testo della query duplicata deve essere uguale a quello della query originale.
Affinché i risultati della query vengano mantenuti in una tabella dei risultati memorizzati nella cache, il set di risultati deve essere più piccolo della dimensione massima della risposta. Per saperne di più sulla gestione di grandi set di risultati, consulta Restituzione di risultati di query di grandi dimensioni.
Non puoi scegliere come target le tabelle dei risultati memorizzati nella cache con le istruzioni DML.
Sebbene la semantica attuale lo consenta, l'utilizzo dei risultati memorizzati nella cache come input per i job dipendenti è sconsigliato. Ad esempio, non devi inviare job di query che recuperano i risultati dalla tabella della cache. Scrivi invece i risultati in una tabella di destinazione denominata. Per semplificare la pulizia, funzionalità come la proprietà defaultTableExpirationMs a livello di set di dati possono far scadere automaticamente i dati dopo un determinato periodo di tempo.

Prezzi e quote

I risultati delle query memorizzati nella cache vengono archiviati come tabelle temporanee. Non vengono addebitati costi per l'archiviazione dei risultati delle query memorizzati nella cache nelle tabelle temporanee. Quando i risultati della query vengono recuperati da una tabella dei risultati memorizzati nella cache, la proprietà delle statistiche del job statistics.query.cacheHit viene restituita come true e la query non viene addebitata. Anche se non ti vengono addebitati costi per le query che utilizzano risultati memorizzati nella cache, le query sono soggette ai criteri di quota di BigQuery. Oltre a ridurre i costi, le query che utilizzano i risultati memorizzati nella cache sono molto più veloci perché BigQuery non deve calcolare il set di risultati.

Eccezioni alla memorizzazione nella cache delle query

I risultati della query non vengono memorizzati nella cache:

Quando una tabella di destinazione viene specificata nella configurazione del job, la Google Cloud console, lo strumento a riga di comando bq o l'API.
Se una delle tabelle o delle visualizzazioni logiche a cui viene fatto riferimento è cambiata da quando i risultati sono stati memorizzati nella cache.
Quando una delle tabelle a cui fa riferimento la query ha ricevuto di recente inserimenti di streaming (la tabella contiene dati nello spazio di archiviazione ottimizzato per la scrittura) anche se non sono arrivate nuove righe.
Se la query utilizza funzioni non deterministiche, ad esempio funzioni di data e ora come CURRENT_TIMESTAMP() e CURRENT_DATE e altre funzioni come SESSION_USER(), restituisce valori diversi a seconda di quando viene eseguita una query.
Se esegui query su più tabelle utilizzando un carattere jolly.
Se i risultati memorizzati nella cache sono scaduti; la durata tipica della cache è di 24 ore, ma i risultati memorizzati nella cache sono il risultato di un tentativo e potrebbero essere invalidati prima.
Se la query viene eseguita su un'origine dati esterna diversa da Cloud Storage. (Le query GoogleSQL su Cloud Storage sono supportate dai risultati delle query memorizzati nella cache.)
Se la query viene eseguita su una tabella protetta dalla sicurezza a livello di riga, i risultati non vengono memorizzati nella cache.
Se la query viene eseguita su una tabella protetta dalla sicurezza a livello di colonna, incluso il mascheramento dei dati, i risultati potrebbero non essere memorizzati nella cache.
Se il testo della query è cambiato in qualsiasi modo, inclusi spazi vuoti o commenti modificati.

Come vengono memorizzati i risultati memorizzati nella cache

Quando esegui una query, viene creata una tabella dei risultati temporanea memorizzata nella cache in un tipo speciale di set di dati nascosto denominato set di dati anonimo. A differenza dei normali set di dati che ereditano le autorizzazioni dal modello di gerarchia delle risorse IAM (autorizzazioni di progetto e organizzazione), l'accesso ai set di dati anonimi è limitato al proprietario. Il proprietario di un set di dati anonimo è l'utente che ha eseguito la query che ha prodotto il risultato memorizzato nella cache. Inoltre, viene controllata l'autorizzazione bigquery.jobs.create nel progetto per verificare che l'utente abbia accesso al progetto.

BigQuery non supporta la condivisione di set di dati anonimi. Se intendi condividere i risultati della query, non utilizzare i risultati memorizzati nella cache in un set di dati anonimo. Scrivi invece i risultati in una tabella di destinazione denominata.

Sebbene l'utente che esegue la query abbia accesso completo al set di dati e alla tabella dei risultati memorizzati nella cache, è sconsigliato utilizzarli come input per i job dipendenti.

I nomi dei set di dati anonimi iniziano con un trattino basso. In questo modo vengono nascosti dall'elenco dei set di dati nella console Google Cloud . Puoi elencare i set di dati anonimi e controllare i controlli di accesso ai set di dati anonimi utilizzando lo strumento a riga di comando bq o l'API.

Per saperne di più su come elencare e ottenere informazioni sui set di dati, inclusi quelli anonimi, vedi Elenco dei set di dati.

Memorizzazione nella cache tra utenti

Se utilizzi la versione Enterprise o Enterprise Plus e disponi delle autorizzazioni richieste per eseguire una query memorizzata nella cache del tuo progetto per un altro utente, BigQuery produce il risultato memorizzato nella cache. Il risultato memorizzato nella cache viene copiato nel tuo set di dati anonimo personale e rimane lì per 24 ore dall'esecuzione della query. Gli stessi limiti ed eccezioni per la memorizzazione nella cache per un singolo utente si applicano alla memorizzazione nella cache tra utenti.

Disattivazione del recupero dei risultati memorizzati nella cache

L'opzione Utilizza risultati memorizzati nella cache riutilizza i risultati di un'esecuzione precedente della stessa query, a meno che le tabelle sottoposte a query non siano state modificate. L'utilizzo dei risultati memorizzati nella cache è vantaggioso solo per le query ripetute. Per le nuove query, l'opzione Utilizza risultati memorizzati nella cache non ha alcun effetto, anche se è attivata per impostazione predefinita.

Quando ripeti una query con l'opzione Utilizza risultati memorizzati nella cache disattivata, il risultato memorizzato nella cache esistente viene sovrascritto. BigQuery deve calcolare il risultato della query e ti viene addebitato il costo della query. Questo è particolarmente utile negli scenari di benchmarking.

Se vuoi disattivare il recupero dei risultati memorizzati nella cache e forzare la valutazione live di un job di query, puoi impostare la proprietà configuration.query.useQueryCache del job di query su false.

Per disattivare l'opzione Utilizza risultati memorizzati nella cache:

Console

Apri la Google Cloud console.
Vai alla pagina BigQuery
Fai clic su Crea nuova query.
Inserisci una query SQL valida nell'area di testo Editor query.
Fai clic su Altro e seleziona Impostazioni query.
Per Preferenza cache, deseleziona Utilizza risultati memorizzati nella cache.

bq

Utilizza il flag nouse_cache per sovrascrivere la cache delle query. Il seguente esempio forza BigQuery a elaborare la query senza utilizzare i risultati memorizzati nella cache esistenti:

 bq query \
 --nouse_cache \
 --batch \
 'SELECT
    name,
    count
  FROM
    `my-project`.mydataset.names_2013
  WHERE
    gender = "M"
  ORDER BY
    count DESC
  LIMIT
    6'

API

Per elaborare una query senza utilizzare i risultati memorizzati nella cache esistenti, imposta la proprietà useQueryCache su false nella configurazione del job query.