ワークフローを作成する
この機能に関するサポートをリクエストする場合、またはフィードバックを提供する場合は、bigquery-workflows-preview-feedback@google.com までメールをお送りください。
このドキュメントでは、BigQuery でワークフローを作成する方法について説明します。ワークフローは Dataform を使用します。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
- コードアセット管理を有効にするの手順に沿って、ワークフローなどのコードアセットのバージョンを保存、共有、管理します。
- コードアセットを初めて作成する場合は、コードアセットを保存するデフォルト リージョンを設定します。コードアセットのリージョンを作成後に変更することはできません。
必要なロール
ワークフローの作成に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。
-
ワークフローを作成するには:
コード作成者(
roles/dataform.codeCreator
) -
ワークフローを編集して実行するには:
Dataform 編集者(
roles/dataform.editor
)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
Dataform IAM の詳細については、IAM でのアクセス制御をご覧ください。
ワークフローを作成する
ワークフローを作成する手順は次のとおりです。
[BigQuery] ページに移動します。
エディタペインのタブバーで、+ 記号の横にある
矢印プルダウン メニューをクリックし、[ワークフロー] をクリックします。省略可: ワークフローの名前を変更するには、ワークフロー名をクリックしてから、新しい名前を入力します。
[使ってみる] をクリックし、[設定] タブに移動します。
[サービス アカウント] フィールドで、Dataform サービス アカウントを選択します。
[ロケーション] セクションで、ワークフローの処理リージョンを選択します。
- 特定のリージョンを選択するには、[リージョン] を選択してから、[リージョン] プルダウン メニューでリージョンを選択します。
- マルチリージョンを選択するには、[マルチリージョン] を選択してから、[マルチリージョン] プルダウン メニューでマルチリージョンを選択します。
ワークフローの処理リージョンは、コードアセットのデフォルトのストレージ リージョンと一致する必要はありません。
ワークフローにノートブックを追加する場合は、次の操作を行います。
[Cloud Storage バケット] フィールドで、[参照] をクリックして、ワークフローにノートブックの出力を保存する Cloud Storage バケットを選択または作成します。
バケットレベルのポリシーにプリンシパルを追加するの手順に沿って、カスタム Dataform サービス アカウントをプリンシパルとして、スケジュール設定したワークフロー実行の出力を保存するために使用する Cloud Storage バケットに追加し、このプリンシパルにストレージ管理者(
roles/storage.admin
)のロールを付与します。選択したカスタム Dataform サービス アカウントには、選択したバケットに対するストレージ管理者の IAM ロールを付与する必要があります。
ワークフロー タスクを追加する
ワークフローにタスクを追加する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
SQL クエリまたはノートブックを追加する手順は次のとおりです。
SQL クエリ
[タスクを追加] をクリックしてから、[クエリ] を選択します。
省略可: [Query task details] ペインの [次の後に実行] プルダウン メニューで、クエリの前に実行するタスクを選択します。
クエリは、前のタスクに依存します。
クエリを作成するには、[クエリを作成] をクリックします。
新しいクエリにクエリ構文を追加し、[クエリを保存] をクリックします。
省略可: クエリの名前を変更するには、クエリ名をクリックして新しい名前を入力します。
ノートブック
[タスクを追加] をクリックし、[ノートブック] を選択します。
省略可: [Notebook task details] ペインの [次の後に実行] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。
ノートブックは、前のタスクに依存します。
ノートブックを作成するには、[ノートブックを作成] をクリックします。
新しいノートブックでノートブックのコンテンツを追加してから、[保存] をクリックします。
省略可: ノートブックの名前を変更するには、ノートブック名をクリックして新しい名前を入力します。
ワークフローのタスクを編集する
ワークフローのタスクを編集するには、次の手順を行います。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
選択したタスクをクリックします。
前のタスクを変更するには、[次の後に実行] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。
選択したタスクの内容を編集するには、[編集] をクリックします。
開いた新しいタブでタスクの内容を編集し、タスクの変更を保存します。
ワークフローのタスクを削除する
ワークフローのタスクを削除する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
選択したタスクをクリックします。
[タスクの詳細] ペインで、[ 削除削除] アイコンをクリックします。
ワークフローを実行する
ワークフローの現在のバージョンを手動で実行する手順は次のとおりです。
Google Cloud コンソールで [BigQuery] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。
[実行] をクリックします。
省略可: 実行を検査するには、過去の手動実行を表示します。
次のステップ
- BigQuery のワークフローの詳細を学習する。
- ワークフローを管理する方法を学習する。