Creare flussi di lavoro
Per richiedere assistenza o fornire feedback in merito a questa funzionalità: invia un'email a bigquery-workflows-preview-feedback@google.com.
Questo documento descrive come creare flussi di lavoro in BigQuery. Workflows sono basati su Dataform.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
- Segui le istruzioni alla pagina Attivare la gestione degli asset di codice per salvare, condividere e gestire versioni degli asset di codice come per i flussi di lavoro.
- Se è la prima volta che crei un asset di codice, imposta la regione predefinita per l'archiviazione degli asset di codice. Non puoi modificare la regione per un asset di codice dopo averlo creato.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare flussi di lavoro, chiedi all'amministratore di concederti seguenti ruoli IAM sul progetto:
-
Per creare flussi di lavoro:
Creatore di codice (
roles/dataform.codeCreator
) -
Per modificare ed eseguire flussi di lavoro:
Editor Dataform (
roles/dataform.editor
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Per ulteriori informazioni su Dataform IAM, consulta Controllo dell'accesso con IAM.
Crea un flusso di lavoro
Per creare un flusso di lavoro:
Vai alla pagina BigQuery.
Nella barra delle schede del riquadro dell'editor, fai clic sul
freccia nel menu a discesa accanto al segno + e fai clic su Flusso di lavoro.(Facoltativo) Per rinominare il flusso di lavoro, fai clic sul nome del flusso di lavoro e digita un nuovo nome.
Fai clic su Inizia, poi vai alla scheda Impostazioni.
Nel campo Account di servizio, seleziona un account di servizio Dataform.
Nella sezione Località, seleziona una regione di elaborazione per il flusso di lavoro.
- Per selezionare una regione specifica, seleziona Regione, poi scegli una regione nel menu a discesa Regione.
- Per selezionare più regioni, seleziona Più regioni e poi seleziona una più regioni nel menu a discesa Più regioni.
La regione di elaborazione del flusso di lavoro non deve corrispondere alla regione di archiviazione predefinita per gli asset di codice.
Se prevedi di aggiungere un notebook al tuo flusso di lavoro:
Nel campo Bucket Cloud Storage, fai clic su Sfoglia e seleziona o crea un bucket Cloud Storage per archiviare l'output dei notebook nel tuo flusso di lavoro.
Segui la procedura descritta in Aggiungere un'entità a un criterio a livello di bucket per aggiungere il tuo account di servizio Dataform personalizzato come entità al bucket Cloud Storage che prevedi di utilizzare per archiviare l'output delle esecuzioni pianificate del flusso di lavoro e concedi a questa entità il ruolo Amministratore dello spazio di archiviazione (
roles/storage.admin
).All'account di servizio Dataform personalizzato selezionato deve essere concesso il ruolo IAM Storage Admin per il bucket selezionato.
Aggiungi un'attività del flusso di lavoro
Per aggiungere un'attività a un flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflows, e seleziona un flusso di lavoro.
Per aggiungere una query SQL o un notebook:
Query SQL
Fai clic su Aggiungi attività e seleziona Query.
(Facoltativo) Nel riquadro Dettagli attività query, nella sezione Esegui dopo seleziona un'attività che precede la query.
La query dipenderà dall'attività precedente.
Per creare la query, fai clic su Crea query.
Nella nuova query, aggiungi la sintassi della query, quindi fai clic su Salva query.
(Facoltativo) Per rinominare la query, fai clic sul nome della query e digita un nuovo nome.
Blocco note
Fai clic su Aggiungi attività, quindi seleziona Blocco note.
(Facoltativo) Nel riquadro Dettagli attività blocco note, nella sezione Esegui dopo seleziona un'attività che precede il blocco note.
Il blocco note dipenderà dall'attività precedente.
Per creare il blocco note, fai clic su Crea blocco note.
Nel nuovo blocco note, aggiungi i contenuti del blocco note e fai clic su Salva.
(Facoltativo) Per rinominare il blocco note, fai clic sul nome del blocco note e digita un nuovo nome.
Modifica un'attività del flusso di lavoro
Per modificare un'attività del flusso di lavoro:
Nella console Google Cloud, vai alla Pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflows, e seleziona un flusso di lavoro.
Fai clic sull'attività selezionata.
Per modificare l'attività precedente, nel menu a discesa Esegui dopo, seleziona un'attività che precederà il blocco note.
Per modificare i contenuti dell'attività selezionata, fai clic su Modifica.
Nella nuova scheda che si apre, modifica i contenuti dell'attività e salvare le modifiche apportate all'attività.
Elimina un'attività di flusso di lavoro
Per eliminare un'attività da un flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Fai clic sull'attività selezionata.
Nel riquadro Dettagli attività, fai clic sull'icona EliminaElimina.
Esegui un flusso di lavoro
Per eseguire manualmente la versione corrente di un flusso di lavoro:
Nella console Google Cloud, vai alla Pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Fai clic su Esegui.
(Facoltativo) Per ispezionare l'esecuzione, visualizza le esecuzioni manuali precedenti.
Passaggi successivi
- Scopri di più sui flussi di lavoro in BigQuery.
- Scopri come gestire i flussi di lavoro.