ワークフローを作成する

この機能に関するサポートをリクエストする場合、またはフィードバックを提供する場合は、bigquery-workflows-preview-feedback@google.com までメールをお送りください。

このドキュメントでは、BigQuery でワークフローを作成する方法について説明します。ワークフローは Dataform を使用します。

始める前に

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery, Dataform, and Vertex AI APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery, Dataform, and Vertex AI APIs.

    Enable the APIs

  8. コードアセット管理を有効にするの手順に沿って、ワークフローなどのコードアセットのバージョンを保存、共有、管理します。
  9. コードアセットを初めて作成する場合は、コードアセットを保存するデフォルト リージョンを設定します。コードアセットのリージョンを作成後に変更することはできません。

必要なロール

ワークフローの作成に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼してください。

  • ワークフローを作成するには: コード作成者roles/dataform.codeCreator
  • ワークフローを編集して実行するには: Dataform 編集者roles/dataform.editor

ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

Dataform IAM の詳細については、IAM でのアクセス制御をご覧ください。

ワークフローを作成する

ワークフローを作成する手順は次のとおりです。

  1. [BigQuery] ページに移動します。

    [BigQuery] に移動

  2. エディタペインのタブバーで、+ 記号の横にある 矢印プルダウン メニューをクリックし、[ワークフロー] をクリックします。

  3. 省略可: ワークフローの名前を変更するには、ワークフロー名をクリックしてから、新しい名前を入力します。

  4. [使ってみる] をクリックし、[設定] タブに移動します。

  5. [サービス アカウント] フィールドで、Dataform サービス アカウントを選択します。

  6. [ロケーション] セクションで、ワークフローの処理リージョンを選択します。

    1. 特定のリージョンを選択するには、[リージョン] を選択してから、[リージョン] プルダウン メニューでリージョンを選択します。
    2. マルチリージョンを選択するには、[マルチリージョン] を選択してから、[マルチリージョン] プルダウン メニューでマルチリージョンを選択します。

    ワークフローの処理リージョンは、コードアセットのデフォルトのストレージ リージョンと一致する必要はありません。

  7. ワークフローにノートブックを追加する場合は、次の操作を行います。

    1. [Cloud Storage バケット] フィールドで、[参照] をクリックして、ワークフローにノートブックの出力を保存する Cloud Storage バケットを選択または作成します。

    2. バケットレベルのポリシーにプリンシパルを追加するの手順に沿って、カスタム Dataform サービス アカウントをプリンシパルとして、スケジュール設定したワークフロー実行の出力を保存するために使用する Cloud Storage バケットに追加し、このプリンシパルにストレージ管理者(roles/storage.admin)のロールを付与します。

      選択したカスタム Dataform サービス アカウントには、選択したバケットに対するストレージ管理者の IAM ロールを付与する必要があります。

ワークフロー タスクを追加する

ワークフローにタスクを追加する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. SQL クエリまたはノートブックを追加する手順は次のとおりです。

    SQL クエリ

    1. [タスクを追加] をクリックしてから、[クエリ] を選択します。

    2. 省略可: [Query task details] ペインの [次の後に実行] プルダウン メニューで、クエリの前に実行するタスクを選択します。

      クエリは、前のタスクに依存します。

    3. クエリを作成するには、[クエリを作成] をクリックします。

    4. 新しいクエリにクエリ構文を追加し、[クエリを保存] をクリックします。

    5. 省略可: クエリの名前を変更するには、クエリ名をクリックして新しい名前を入力します。

    ノートブック

    1. [タスクを追加] をクリックし、[ノートブック] を選択します。

    2. 省略可: [Notebook task details] ペインの [次の後に実行] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。

      ノートブックは、前のタスクに依存します。

    3. ノートブックを作成するには、[ノートブックを作成] をクリックします。

    4. 新しいノートブックでノートブックのコンテンツを追加してから、[保存] をクリックします。

    5. 省略可: ノートブックの名前を変更するには、ノートブック名をクリックして新しい名前を入力します。

ワークフローのタスクを編集する

ワークフローのタスクを編集するには、次の手順を行います。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. 選択したタスクをクリックします。

  4. 前のタスクを変更するには、[次の後に実行] プルダウン メニューで、ノートブックの前に実行するタスクを選択します。

  5. 選択したタスクの内容を編集するには、[編集] をクリックします。

  6. 開いた新しいタブでタスクの内容を編集し、タスクの変更を保存します。

ワークフローのタスクを削除する

ワークフローのタスクを削除する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. 選択したタスクをクリックします。

  4. [タスクの詳細] ペインで、[ 削除削除] アイコンをクリックします。

ワークフローを実行する

ワークフローの現在のバージョンを手動で実行する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [ワークフロー] フォルダを開き、ワークフローを選択します。

  3. [実行] をクリックします。

  4. 省略可: 実行を検査するには、過去の手動実行を表示します。

次のステップ