Dichiarare un'origine dati

Questo documento mostra come dichiarare le origini dati BigQuery con Dataform core.

Puoi dichiarare qualsiasi tipo di tabella BigQuery come origine dati in Dataform. La dichiarazione di origini dati BigQuery esterne a Dataform ti consente di trattarle come oggetti Dataform di prima classe. Dopo aver dichiarato un'origine dati, puoi farvi riferimento o risolverla come qualsiasi altra tabella in Dataform.

Prima di iniziare

Prima di dichiarare un'origine dati, crea e inizializza un'area di lavoro di sviluppo nel repository.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per dichiarare un'origine dati, chiedi all'amministratore di concederti il ruolo IAM Editor Dataform (roles/dataform.editor) per le aree di lavoro. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso.

Potresti anche essere in grado di ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Crea un file SQLX per la dichiarazione dell'origine dati

Archivia i file SQLX per le dichiarazioni delle origini dati nella directory definitions/. Per creare un nuovo file SQLX nella directory definitions/, procedi nel seguente modo:

  1. Nella console Cloud, vai alla pagina Dataform.

    Vai alla pagina Dataform

  2. Seleziona un repository.

  3. Seleziona un'area di lavoro di sviluppo.

  4. Nel riquadro File, accanto a definitions/, fai clic sul menu Altro.

  5. Fai clic su Crea file.

  6. Nel riquadro Crea nuovo file, procedi nel seguente modo:

    1. Nel campo Aggiungi un percorso file, dopo definitions/, inserisci il nome del file seguito da .sqlx. Ad esempio, definitions/dataset-declaration.sqlx.

      I nomi file possono includere solo numeri, lettere, trattini e trattini bassi.

    2. Fai clic su Crea file.

Dichiarare un'origine dati

Puoi dichiarare un'origine dati per ogni file di dichiarazione SQLX. Per dichiarare un'origine dati nel blocco di configurazione di un file SQLX, segui questi passaggi:

  1. Nel riquadro File dell'area di lavoro di sviluppo, fai clic sul file SQLX per la dichiarazione dell'origine dati.
  2. Nel file, inserisci il seguente snippet di codice:

    config {
      type: "declaration",
      database: "DATABASE",
      schema: "SCHEMA",
      name: "NAME",
    }
    

    Sostituisci quanto segue:

    • DATABASE: l'ID del progetto che contiene l'origine dati.
    • SCHEMA: il set di dati BigQuery in cui esiste l'origine dati.
    • NAME: il nome della tabella o della vista che vuoi utilizzare come origine dati. Potrai utilizzarlo in seguito per fare riferimento all'origine dati in Dataform.
  3. (Facoltativo) Fai clic su Formato.

Il seguente esempio di codice mostra una dichiarazione di esempio della tabella shakespeare nel set di dati samples del progetto bigquery-public-data come origine dati:

    config {
      type: "declaration",
      database: "bigquery-public-data",
      schema: "samples",
      name: "shakespeare",
    }

Passaggi successivi