データ準備をスケジュールする

このドキュメントでは、データ準備パイプラインのスケジュールを設定し、手動で実行する方法について説明します。

データ準備は Dataform を使って行います。各データ準備のスケジュールは、Google アカウントのユーザー認証情報またはスケジュールまたはテスト実行を構成するときに選択した Dataform サービス アカウントを使用して実行されます。

データ準備ステップに加えた変更は自動保存されません。その変更をスケジュールで実行するには、変更を保存してデプロイする必要があります。スケジュールでは、常にデプロイされた最新バージョンのデータ準備が実行されます。開発中のデプロイされていない変更は実行されません。

始める前に

始める前に、データ準備を作成します。

必要なロール

開発環境でデータ準備を手動で実行する場合や、データ準備をスケジュールする場合に、サービス アカウントでデータ準備を認可するには、データ準備の実行に使用するサービス アカウントにロールを付与する必要があります。詳細については、Dataform サービス アカウントにアクセス権を付与するをご覧ください。

データ準備を開発する

データ準備の開発時には、変更を本番環境にデプロイする前に、手順を手動で実行して、出力を検査することができます。現在開発中のバージョンをデータでテストできます。その間、BigQuery では、スケジュールに従って、デプロイ済みの最新バージョンを引き続き実行します。データ準備を実行する前に、宛先を構成し、検証エラーを修正する必要があります。

開発環境でデータ準備を手動で実行する

データ準備の手順をテストし、宛先テーブルの結果を検証するには、データ準備をデータ準備エディタから手動で実行します。

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。実行するデータ準備の名前をクリックします。

  3. データ準備エディタのツールバーで、[その他] > [今すぐ実行エクスペリエンスを構成] をクリックします。

  4. [認証] セクションで、Google アカウントのユーザー認証情報またはサービス アカウントを使用してデータ準備を認可します。

    • Google アカウントのユーザー認証情報(プレビュー)を使用するには、[自分のユーザー認証情報で実行] を選択します。これはデフォルトのオプションです。
    • サービス アカウントを使用するには、[選択したサービス アカウントで実行] を選択し、サービス アカウントを選択します。サービス アカウントに追加の権限が必要な場合は、[すべて付与] をクリックして必要なロールを付与します。
  5. [保存] をクリックします。

  6. 表示された検証エラーを修正します。

  7. データ準備エディタのツールバーで [実行] をクリックします。

  8. [今すぐ実行] ダイアログで [確認] をクリックして、この手動実行で宛先テーブルにデータが書き込まれることを確認します。このテーブルは、スケジュール設定された実行でも使用できます。

    認証方法に [自分のユーザー認証情報で実行] を選択した場合は、Google アカウントを認可する必要があります(プレビュー)。

    実行すると、ステップが実行され、出力が宛先に読み込まれます。

  9. 省略可: 実行が完了すると、[実行] ペインに実行の詳細が表示されます。

データ準備をデプロイする

データ準備のバージョンの実行をスケジュールするには、まずそのバージョンをデプロイする必要があります。スケジュールでは、最新のデプロイ済みバージョンが実行されます。

データ準備をデプロイする手順は次のとおりです。

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。選択したデータ準備の名前をクリックします。

    データ準備エディタが開きます。

  3. データ準備エディタのツールバーで [デプロイ] をクリックします。

スケジュールを作成

デプロイされたデータ準備の手順を実行し、準備されたデータを宛先テーブルに読み込むスケジュールを作成するには、まずデータ準備の実行をスケジュールする必要があります。実行をスケジュールするには、宛先を構成し、検証エラーを修正する必要があります。

データ準備のスケジュールを作成する手順は次のとおりです。

[エクスプローラ] ペイン

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。スケジュールするデータ準備の名前をクリックします。

  3. データ準備エディタのツールバーで [スケジュール] をクリックします。

  4. スケジュールの名前を入力します。

  5. [認証] セクションで、Google アカウントのユーザー認証情報またはサービス アカウントを使用してデータ準備を認可します。

    • Google アカウントのユーザー認証情報(プレビュー)を使用するには、[自分のユーザー認証情報で実行] を選択します。
    • サービス アカウントを使用するには、[選択したサービス アカウントで実行] を選択し、サービス アカウントを選択します。
  6. 頻度を設定します。

  7. [スケジュールを作成] をクリックします。認証方法に [自分のユーザー認証情報で実行] を選択した場合は、Google アカウントを認可する必要があります(プレビュー)。

[スケジュール設定] ページ

  1. Google Cloud コンソールで [スケジュール設定] ページに移動します。

    [スケジュール設定] に移動

  2. [作成] をクリックし、メニューから [データ準備のスケジュール] を選択します。

  3. [データ準備のスケジュール設定] ペインの [データ準備] フィールドで、スケジュールを設定するデータ準備を選択します。

  4. [スケジュール名] フィールドに、スケジュールの名前を入力します。

  5. [認証] セクションで、Google アカウントのユーザー認証情報またはサービス アカウントを使用してデータ準備を認可します。

    • Google アカウントのユーザー認証情報(プレビュー)を使用するには、[自分のユーザー認証情報で実行] を選択します。
    • サービス アカウントを使用するには、[選択したサービス アカウントで実行] を選択し、サービス アカウントを選択します。
  6. [スケジュールの頻度] セクションで、次の操作を行います。

    1. [繰り返し] メニューで、データ準備の実行頻度を選択します。
    2. [時刻] フィールドに、データ準備の実行スケジュールを設定する時刻を入力します。
    3. [タイムゾーン] メニューで、スケジュールのタイムゾーンを選択します。
  7. [スケジュールを作成] をクリックします。認証方法に [自分のユーザー認証情報で実行] を選択した場合は、Google アカウントを認可する必要があります(プレビュー)。

Google アカウントを認可する

Google アカウントのユーザー認証情報でリソースを認証するには、BigQuery パイプラインが Google アカウントのアクセス トークンを取得し、ユーザーに代わってソースデータにアクセスするための権限を手動で付与する必要があります。OAuth ダイアログ インターフェースで、手動で承認できます。

BigQuery パイプラインに権限を付与する必要があるのは 1 回のみです。

付与した権限を取り消すには、次の手順に沿って操作します。

  1. Google アカウント ページにアクセスします。
  2. [BigQuery パイプライン] をクリックします。
  3. [アクセス権を削除] をクリックします。

新しい Google アカウントのオーナーが以前にスケジュールを作成したことがない場合、認証情報を更新してデータ準備のスケジュール オーナーを変更するには、手動での承認が必要になります。

スケジュールされたデータ準備を手動で実行する

選択したスケジュールでデータ準備を手動で実行すると、BigQuery ではスケジュールとは別に、データ準備が 1 回実行されます。

スケジュールされたデータ準備を手動で実行する手順は次のとおりです。

  1. Google Cloud コンソールで [スケジュール設定] ページに移動します。

    [スケジュール設定] に移動

  2. 選択したデータ準備のスケジュールの名前をクリックします。

  3. [スケジュールの詳細] ページで [実行] をクリックします。

スケジュールを表示する

データ準備のスケジュールは、データ準備エディタまたは [スケジュール設定] ページで確認できます。

データ準備エディタ

データ準備のスケジュールを表示する手順は次のとおりです。

  1. データ準備エディタのツールバーで、スケジュール [スケジュールを見る] をクリックします。
  2. 省略可: スケジュールの履歴を表示するには、[過去の実行を表示] をクリックします。

[スケジュール設定] ページ

プロジェクト内のすべてのデータ準備スケジュールを表示する手順は次のとおりです。

  1. Google Cloud コンソールで [スケジュール設定] ページに移動します。

    [スケジュール設定] に移動

  2. 省略可: 選択したスケジュールの実行履歴と詳細を表示するには、スケジュールの名前をクリックします。手動実行の履歴は表示されません。

スケジュールを編集する

スケジュールは、データ準備エディタまたは [スケジュール設定] ページで編集できます。

データ準備エディタ

スケジュールを編集する手順は次のとおりです。

  1. データ準備エディタのツールバーで、スケジュール [スケジュールを見る] をクリックします。
  2. [データ準備のスケジュール] ダイアログで [編集] をクリックし、スケジュールを更新します。
  3. [スケジュールを更新] をクリックします。

[スケジュール設定] ページ

スケジュールを編集する手順は次のとおりです。

  1. Google Cloud コンソールで [スケジュール設定] ページに移動します。

    [スケジュール設定] に移動

  2. 選択したデータ準備のスケジュールの名前をクリックします。

  3. [スケジュールの詳細] ページで、[編集] をクリックします。

  4. [スケジュールを表示] をクリックします。

  5. [データ準備のスケジュール] ダイアログで [編集] をクリックし、スケジュールを更新します。

  6. [スケジュールを更新] をクリックします。

スケジュールを削除する

選択したデータ準備のスケジュールを完全に削除する手順は次のとおりです。

  1. Google Cloud コンソールで [スケジュール設定] ページに移動します。

    [スケジュール設定] に移動

  2. スケジュールを含む行で、more_vert [アクション] > [削除] をクリックします。

次のステップ