Operazioni create

Questo documento mostra come definire operazioni SQL personalizzate in un file SQLX dedicato.

Dataform può eseguire operazioni SQL personalizzate che non rientrano nel modello di pubblicazione di una tabella o scrittura di un'asserzione di Dataform. Puoi definire comandi SQL personalizzati da eseguire in BigQuery.

Prima di iniziare

  1. Nella console Google Cloud , vai alla pagina Dataform.

    Vai alla pagina Dataform

  2. Seleziona o crea un repository.

  3. Seleziona o crea un workspace di sviluppo.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per definire un'operazione SQL personalizzata, chiedi all'amministratore di concederti il ruolo IAM Dataform Editor (roles/dataform.editor) negli spazi di lavoro. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Crea un file per la definizione dell'operazione personalizzata

Archivia i file SQLX di definizione delle operazioni personalizzate nella directory definitions/. Per creare un nuovo file SQLX nella directory definitions/:

  1. Vai al tuo workspace di sviluppo.
  2. Nel riquadro File, accanto a definitions/, fai clic sul menu Altro.
  3. Fai clic su Crea file.
  4. Nel campo Aggiungi un percorso del file, inserisci il nome del file seguito da .sqlx dopo definitions/. Ad esempio: definitions/sample-operation.sqlx.

    I nomi dei file possono includere solo numeri, lettere, trattini e trattini bassi.

  5. Fai clic su Crea file.

Definisci un'operazione SQL personalizzata

Puoi definire un'operazione SQL personalizzata in un file SQLX di type: operations. Puoi scrivere qualsiasi istruzione SQL di BigQuery in un file operations. Dataform esegue le operazioni SQL personalizzate in BigQuery senza modifiche.

Puoi definire più operazioni SQL personalizzate in un unico file SQLX. BigQuery esegue tutte le operazioni in un file nello stesso contesto e crea l'esecuzione SQL unendo tutte le operazioni con un punto e virgola (;).

Per definire più operazioni SQL personalizzate quando utilizzi il framework Dataform open source con un data warehouse diverso da BigQuery, separa le operazioni con ---.

Per definire un'operazione SQL personalizzata in un file SQLX dedicato:

  1. Nell'area di lavoro di sviluppo, seleziona il file SQLX per la definizione dell'operazione personalizzata.
  2. Nel file, inserisci il seguente snippet di codice:

    config { type: "operations" }
    
  3. Al di fuori del blocco config, scrivi l'operazione SQL.

  4. (Facoltativo) Fai clic su Formato.

Il seguente esempio di codice mostra più operazioni SQL personalizzate definite in un file operations:

config { type: "operations" }

DELETE FROM dataset.table WHERE country = 'GB';

DELETE FROM dataset.table WHERE country = 'FR';

Il seguente esempio di codice mostra un'operazione SQL personalizzata che crea manualmente una vista:

config { type: "operations" }
CREATE OR REPLACE VIEW dataset.table AS (SELECT 1 AS TEST)

Crea una tabella di output a cui è possibile fare riferimento

Puoi creare manualmente una tabella in un'operazione SQL personalizzata a cui puoi fare riferimento in altri script. Per creare una tabella disponibile per altri script, devi dichiarare che l'operazione ha un output.

Per fare in modo che il nome della tabella di output corrisponda al nome del file operations, puoi utilizzare la funzione self nell'operazione CREATE.

Per creare una tabella in un'operazione personalizzata e renderla disponibile ad altri script, segui questi passaggi:

  1. Nel tuo workspace di sviluppo, seleziona il file SQLX per la definizione dell'operazione personalizzata.
  2. Nel file SQLX, inserisci il seguente snippet di codice:

    config {
     type: "operations",
     hasOutput: true
    }
    
  3. Per far corrispondere il nome della tabella di output al nome del file, scrivi un'operazione SQL CREATE con la funzione self nel seguente formato:

    CREATE OR REPLACE TABLE ${self()} AS (CUSTOM_SQL_QUERY)
    

    Sostituisci CUSTOM_SQL_QUERY con l'istruzione SQL SELECT di definizione della tabella.

  4. (Facoltativo) Fai clic su Formato.

Fare riferimento a una tabella di output di un'operazione SQL personalizzata

  • Per fare riferimento a una tabella di output di un'operazione SQL personalizzata in una definizione SQLX di una tabella diversa, inserisci il nome del file della tabella di output nella funzione ref.

Il seguente esempio di codice mostra un'operazione SQL personalizzata in un file custom_SQL_operation_table.sqlx che crea una tabella a cui è possibile fare riferimento chiamata custom_SQL_operation_table:

// filename is custom_SQL_operation_table.sqlx
config {
type: "operations",
hasOutput: true
}
CREATE OR REPLACE VIEW ${self()} AS (SELECT 1 AS TEST)

Il seguente esempio di codice mostra il riferimento a custom\_SQL\_operation\_table table in un file SQLX di definizione della tabella:

config { type: "table" }
SELECT * FROM ${ref("custom_SQL_operation_table")}

Crea una tabella vuota

Potresti voler creare una tabella vuota in modo che un altro servizio possa popolarla con i dati. Puoi creare una tabella vuota in un'operazione SQL personalizzata con la funzione CREATE TABLE. Per poter fare riferimento alla tabella vuota in altre definizioni di azioni del flusso di lavoro, ad esempio tabelle e viste, puoi aggiungere la proprietà hasOutput:true al blocco config dell'operazione della tabella vuota.

  • Per creare una tabella vuota, utilizza la funzione CREATE TABLE in un file type: "operations" nel seguente formato:
config {
  type: "operations",
  hasOutput: true  // optional, lets you reference the empty table
}

CREATE TABLE ${self()} (

)

Il seguente esempio di codice mostra un'operazione SQL personalizzata che crea una tabella vuota con una colonna di numeri interi e una colonna di stringhe. La tabella vuota creata non può essere a cui fanno riferimento altre azioni del workflow:

config {
  type: "operations"
}

CREATE TABLE ${self()} (
  x INT64,
  y STRING
)

Passaggi successivi