本番環境の実行をスケジュールする
このクイックスタートでは、Dataform で本番環境実行をスケジュールするための次の手順について説明します。
- Dataform リポジトリの作成
- Dataform に BigQuery へのアクセス権を付与します。
-
production
コンパイル結果の作成頻度でproduction
リリース構成を作成します。 本番環境での実行をスケジュールするワークフロー構成を作成します。
production
ワークフロー構成を作成し、production
リリース構成を選択し、production
コンパイル結果の実行スケジュールを設定します。
準備
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
必要なロール
このチュートリアルのすべてのタスクに必要な権限を取得するには、次の IAM ロールを付与するよう管理者に依頼してください。
-
リポジトリの Dataform 管理者(
roles/dataform.admin
) -
ワークスペースと workflowInvocations に対する Dataform 編集者(
roles/dataform.editor
)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
Dataform リポジトリを作成する
Google Cloud コンソールの [Dataform] ページに移動します。
[リポジトリを作成] をクリックします。
[リポジトリの作成] ページで、次の操作を行います。
[リポジトリ ID] フィールドに「
quickstart-production
」と入力します。[リージョン] リストで
europe-west4
を選択します。[作成] をクリックします。
[完了] をクリックします。
Dataform に BigQuery へのアクセス権を付与する
BigQuery でワークフローを実行するには、Dataform サービス アカウントに次のロールが必要です。
- Dataform が読み取りと書き込みの両方のアクセス権を必要とするプロジェクトに対する BigQuery データ編集者。 通常は、Dataform リポジトリをホストするプロジェクトが含まれます。
- Dataform が読み取り専用アクセス権を必要とするプロジェクトに対する BigQuery データ閲覧者。
- Dataform リポジトリをホストするプロジェクトに対する BigQuery ジョブユーザー。
これらのロールを付与するには、次の手順に沿って操作します。
Google Cloud コンソールの [IAM] ページに移動します。
[追加] をクリックします。
[新しいプリンシパル] フィールドに、Dataform サービス アカウント ID を入力します。
[ロールを選択] プルダウン リストで、[BigQuery ジョブユーザー] ロールを選択します。
[別のロールを追加] をクリックし、[ロールを選択] プルダウン リストで [BigQuery データ編集者] ロールを選択します。
[別のロールを追加] をクリックし、[ロールを選択] プルダウン リストで [BigQuery データ閲覧者] ロールを選択します。
[保存] をクリックします。
リリース構成を作成する
quickstart-production
リポジトリの本番環境のコンパイル結果を作成する手順は次のとおりです。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[リリース構成] をクリックしてから、[新しいリリース構成] をクリックします。
[リリース構成を作成] ペインで、次の設定を構成します。
[リリース ID] フィールドに「
production
」と入力します。[Git commitish] 欄はデフォルト値の
main
のままにします。[頻度] プルダウンで、[カスタム] を選択します。
[カスタム スケジュール] フィールドに「
0 16 * * *
」と入力します。[タイムゾーン] プルダウンで、[グリニッジ標準時(GMT)] などの UTC+1 タイムゾーンを選択します。
毎日午後 4 時(UTC+1)に、Dataform は
quickstart-production
リポジトリをコンパイルし、このリリース構成で構成されたコンパイル設定を適用して、production
のコンパイル結果を作成します。[作成] をクリックします。
production
リリース構成は、毎日午後 4 時(UTC+1)に quickstart-production
リポジトリ全体のコンパイル結果を作成します。
ワークフロー構成を作成する
production
テーブルの実行をスケジュールするには、次の手順を行います。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[ワークフロー構成] をクリックし、[新しいワークフロー構成] をクリックします。
[ワークフロー構成を作成] ペインの [構成 ID] フィールドに、「
production
」と入力します。[リリース構成] プルダウンで
production
を選択します。[頻度] フィールドに「
0 17 * * *
」と入力します。[タイムゾーン] プルダウンで、[グリニッジ標準時(GMT)] などの UTC+1 タイムゾーンを選択します。
Dataform は、毎日午後 5 時(UTC+1)に
quickstart-production
リポジトリの最新のproduction
コンパイル結果を実行します。Dataform が対応するリリース構成で最新のコンパイル結果を確実に実行するには、コンパイル結果の作成時刻とスケジュールされた実行時刻の間に少なくとも 1 時間の間隔を設けます。
[すべてのアクション] をクリックします。
Dataform は、
production
のコンパイル結果ですべての SQL ワークフロー アクションを実行します。[作成] をクリックします。
production
ワークフロー構成では、production
リリース構成によって毎日午後 4 時(UTC+1)に作成された最新のコンパイル結果全体を実行します。
過去の production
コンパイル結果を表示する
過去のスケジュールされた production
コンパイル結果を表示するには、次の手順を行います。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[リリース構成] をクリックします。
[
production
] をクリックします。
過去の production
ワークフローの実行を表示する
過去の production
ワークフローの実行を表示する手順は次のとおりです。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[ワークフロー構成] をクリックします。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
BigQuery で作成したデータセットを削除する
BigQuery アセットの料金が発生しないようにするには、次の手順で dataform_production
というデータセットを削除します。
Google Cloud コンソールで BigQuery ページに移動します。
[エクスプローラ] パネルでプロジェクトを開き、[
dataform_production
] を選択します。[アクション] メニューをクリックして、[削除] を選択します。
データセットの削除のダイアログで「delete」と入力し、[ Delete ] をクリックします。
Dataform リリース構成を削除する
Dataform リリース構成の作成に関連する費用は発生しません。ただし、production
リリース構成を削除する場合は、次の手順を行います。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[リリース構成] をクリックします。
production
リリース構成の場合は、 [その他] メニューをクリックしてから [削除] をクリックします。[リリース構成の削除] ダイアログで、[削除] をクリックします。
Dataform ワークフロー構成を削除する
BigQuery アセットの料金が発生しないようにするには、次の手順で Dataform production
ワークフロー構成を削除します。
Google Cloud コンソールの [Dataform] ページに移動します。
[
quickstart-production
] をクリックします。[ワークフロー構成] をクリックします。
production
ワークフロー構成で、 [その他] メニューをクリックして、[削除] をクリックします。[リリース構成の削除] ダイアログで、[削除] をクリックします。
Dataform リポジトリの削除
Dataform リポジトリの作成に伴う費用は発生しません。ただし、リポジトリとそのすべてのコンテンツを削除するには、次の手順を行います。
Google Cloud コンソールの [Dataform] ページに移動します。
quickstart-production
から、 [その他] メニューをクリックし、[削除] を選択します。[リポジトリの削除] ウィンドウで、リポジトリの名前を入力して削除を確定します。
[削除] をクリックして確定します。
次のステップ
Dataform のコード ライフサイクルの詳細については、Dataform のコード ライフサイクルの概要をご覧ください。
Dataform のコード ライフサイクルのベスト プラクティスの詳細については、コード ライフサイクルの管理をご覧ください。
Dataform のリリース構成の詳細については、リリース構成を作成するをご覧ください。
Dataform のワークフロー構成の詳細については、ワークフロー構成で実行をスケジュールするをご覧ください。