Scrittura di query in sessioni

Questo documento descrive come scrivere query in una sessione BigQuery. È destinata agli utenti che hanno già una conoscenza generale Sessioni BigQuery e sapere come per eseguire query in una sessione.

Uno stato dell'archiviazione della sessione. Lo stato creato in una sessione viene mantenuto e può essere utilizzato per l'intera sessione. Pertanto, se crei una tabella temporanea in una voce di query, puoi utilizzarla in altre voci di query per il resto della sessione.

Una sessione include il supporto delle variabili di sessione, delle variabili di sistema di sessione, delle query con più istruzioni e delle transazioni con più istruzioni.

Prima di completare questi passaggi, assicurati di disporre della necessaria autorizzazioni per durante una sessione.

Utilizzare le variabili di sistema in una sessione

Puoi impostare o recuperare i dati a livello di sessione con: variabili di sistema:

  • @@dataset_id: l'ID del set di dati predefinito nel progetto corrente. La è possibile impostare le variabili di sistema @@dataset_project_id e @@dataset_id utilizzati insieme.
  • @@dataset_project_id: l'ID del progetto predefinito per i set di dati utilizzati nella query. Se questa variabile di sistema non è impostata o se è impostata su NULL, viene utilizzato il progetto che esegue la query. Le variabili di sistema @@dataset_project_id e @@dataset_id possono essere impostati e utilizzati insieme.
  • @@query_label: l'etichetta del job per assegnare alla sessione. L'etichetta può essere utilizzata per l'intera sessione, non solo per una query specifica al suo interno.
  • @@session_id: l'ID della sessione corrente.
  • @@time_zone: il fuso orario predefinito da utilizzare in base al fuso orario Funzioni SQL, quando non è specificato un fuso orario come argomento.

Queste variabili di sistema possono essere utilizzate in qualsiasi momento durante la sessione e si trovano per la sessione rimanente. Queste variabili non vengono definite, ma è possibile assegnare loro un nuovo valore con l'istruzione SET.

La dimensione massima di una variabile per sessione è 1 MB e la dimensione massima di tutte le variabili in una sessione è 10 MB

Assegnare un'etichetta a una sessione

Puoi assegnare un'etichetta job a una sessione. In questo modo, tutte le query future della sessione vengono assegnate all'etichetta. Le etichette possono essere utilizzate in qualsiasi momento durante la sessione e sono nell'ambito della sessione rimanente. L'etichetta del job assegnata verrà visualizzata in log di controllo.

Utilizzare le variabili in una sessione

Puoi creare, impostare e recuperare dati a livello di sessione con variables. Le variabili possono essere utilizzate in qualsiasi momento durante la sessione e sono nell'ambito della sessione rimanente.

  • Per creare una variabile basata sulle sessioni, utilizza la classe Istruzione DECLARE al di fuori di un BEGIN...END bloccare.
  • Per impostare una variabile basata sulla sessione dopo la sua creazione, utilizza l'istruzione SET.
  • Una variabile dichiarata all'interno di un blocco BEGIN...END non è basata sulle sessioni .
  • È possibile fare riferimento a una variabile basata sulla sessione all'interno di un blocco BEGIN...END.
  • Una variabile basata sulle sessioni può essere impostata all'interno di un blocco BEGIN...END.

La dimensione massima di una variabile per sessione è 1 MB e la dimensione massima di tutte le variabili in una sessione è 10 MB

Utilizza tabelle temporanee nelle sessioni

Una tabella temporanea consente di salvare i risultati intermedi in una tabella. Una tabella temporanea è visibile a livello di sessione, quindi non è necessario salvarla o gestirla in un set di dati. Viene eliminato automaticamente al termine di una sessione. Ti viene addebitato lo spazio di archiviazione delle tabelle temporanee mentre la sessione è attiva. Per ulteriori informazioni sulle tabelle temporanee, consulta Lavorare con query con più istruzioni.

Utilizzare funzioni temporanee nelle sessioni

Una funzione temporanea è visibile a livello di sessione, quindi non è necessario salvare o e la mantengono in un set di dati. Viene eliminato automaticamente al termine di una sessione.

Lavorare con query con più istruzioni nelle sessioni

Puoi utilizzare query con più istruzioni GoogleSQL in una sessione. Uno script può includere tabelle temporanee e variabili di sistema per in ogni script. Le variabili di sessione e le tabelle temporanee sono visibili agli script. Anche tutte le variabili di primo livello dichiarate in uno script sono variabili di sessione.

Eseguire transazioni multi-query con più query nelle sessioni

Puoi eseguire transazioni con più istruzioni su più query in una sessione. Ad esempio:

La seguente query avvia una transazione.

BEGIN TRANSACTION

All'interno della transazione, la seguente query crea una tabella temporanea denominata Flights e restituisce i dati in questa tabella. Sono incluse due dichiarazioni. nella query.

CREATE TEMP TABLE Flights(total INT64)  AS SELECT * FROM UNNEST([10,23,3,14,55]) AS a;

SELECT * FROM Flights;

La query seguente esegue il commit della transazione.

COMMIT

Puoi trovare una transazione attiva che interessa la tabella Flights:

WITH running_transactions AS (
  SELECT DISTINCT transaction_id
  FROM
    `region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
    WHERE creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
    EXCEPT DISTINCT
    SELECT transaction_id FROM `region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
    WHERE
      creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
      AND statement_type = "COMMIT_TRANSACTION"
      OR statement_type = "ROLLBACK_TRANSACTION"
)
SELECT
  jobs.transaction_id AS transaction_id,
  project_id,
  user_email,
  session_info.session_id,
  query
FROM `region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT AS jobs, running_transactions
  WHERE
  creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
  AND destination_table = ("Flights")
  AND jobs.transaction_id = running_transactions.transaction_id;

Se vuoi annullare una transazione in corso e disponi del ruolo bigquery.admin, puoi emettere un'istruzione di rollback utilizzando l'ID sessione associato alla transazione in Cloud Shell o con una chiamata API. Quando esegui la query, utilizzando l'ID sessione associato alla transazione, questo viene visualizzato nei risultati.

Sessione di esempio

Ecco un esempio del flusso di lavoro della sessione nella console Google Cloud:

  1. Nella console Google Cloud, apri una nuova scheda dell'editor e crea una sessione.

  2. Nella scheda dell'editor, aggiungi la seguente query:

    CREATE TEMP TABLE Flights(total INT64)  AS SELECT * FROM UNNEST([10,23,3,14,55]) AS a;
    SELECT * FROM Flights;
    
  3. Esegui la query. Viene creata una tabella temporanea denominata Flights e tutti i vengono restituiti i dati.

    +-------+
    | total |
    +-------+
    |    55 |
    |    23 |
    |     3 |
    |    14 |
    |    10 |
    +-------+
    
  4. Elimina i contenuti nella scheda dell'editor e aggiungi la seguente query:

    SELECT * FROM Flights LIMIT 2;
    
  5. Esegui la query. Vengono restituiti i risultati per i due record. Anche se hai eliminato la query precedente, le informazioni della query vengono memorizzate nella sessione corrente.

    +-------+
    | total |
    +-------+
    |    55 |
    |    23 |
    +-------+
    
  6. Elimina i contenuti all'interno della scheda dell'editor e aggiungi la seguente query:

    DECLARE x INT64 DEFAULT 10;
    
    SELECT total * x AS total_a FROM Flights LIMIT 2;
    
    BEGIN
      SET x = 100;
      SELECT total * x AS total_b FROM Flights LIMIT 2;
    END;
    
    SELECT total * x AS total_c FROM Flights LIMIT 2;
    
  7. Esegui la query. La variabile basata sulla sessione x viene utilizzata per limitare il numero di risultati restituiti per la tabella Flights. Esamina attentamente il modo in cui la definizione dell'ambito influisce su questa variabile quando viene dichiarata al di fuori di un BEGIN...END impostata all'interno di un'istruzione BEGIN...END e quindi viene fatto riferimento al di fuori dell'istruzione BEGIN...END.

    +---------+
    | total_a |
    +---------+
    |     550 |
    |     230 |
    +---------+
    
    +---------+
    | total_b |
    +---------+
    |    5500 |
    |    2300 |
    +---------+
    
    +---------+
    | total_c |
    +---------+
    |    5500 |
    |    2300 |
    +---------+
    
  8. Elimina i contenuti all'interno della scheda dell'editor e aggiungi la seguente query:

    SELECT STRING(TIMESTAMP "2008-12-20 15:30:00+00", @@time_zone) AS default_time_zone;
    
    SET @@time_zone = "America/Los_Angeles";
    
    SELECT STRING(TIMESTAMP "2008-12-20 15:30:00+00", @@time_zone) AS new_time_zone;
    
  9. Esegui la query. La variabile di sistema con ambito a livello di sessione @@time_zone viene utilizzata per assegnare un fuso orario a un timestamp. La prima istruzione restituisce un timestamp con il fuso orario predefinito (in questo esempio, UTC). L'istruzione successiva assegna @@time_zone a un nuovo valore. La terza istruzione restituisce un timestamp con il nuovo fuso orario.

    +-------------------------------+
    | default_time_zone             |
    +-------------------------------+
    | 2008-12-20 15:30:00+00        |
    +-------------------------------+
    
    +-------------------------------+
    | new_time_zone                 |
    +-------------------------------+
    | 2008-12-20 07:30:00-08        |
    +-------------------------------+
    

Passaggi successivi