データ準備を管理する

このドキュメントでは、データ準備のデプロイとスケジュール設定など、BigQuery でのデータ準備を管理する方法について説明します。データ準備は、Dataform を活用した BigQuery リソースです。

始める前に

必要なロール

Dataform サービス アカウントに BigQuery でのデータ準備に必要な権限があることを確認するには、Dataform サービス アカウントに必要なロールをご覧ください。

BigQuery でのデータ準備に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。

ロールの付与については、プロジェクト、フォルダ、組織へのアクセスを管理するをご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

既存のデータ準備を表示する

既存のデータ準備のリストを表示する手順は次のとおりです。

  1. [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
  2. プロジェクトを開きます。
  3. [データの準備] リストを開きます。

データ準備をスケジュールする

データ準備のスケジュールは、データ準備エディタで作成し、BigQuery の [オーケストレーション] ページで管理できます。

スケジュールを作成する

データ準備ステップを実行し、準備したデータを宛先テーブルに読み込むスケジュールを作成するには、1 回限りまたは定期的なデータ準備実行をスケジュールします。

  1. データ準備のツールバーで [スケジュール] をクリックします。
  2. スケジュールの名前を入力します。
  3. 実行に関連付けられているサービス アカウント名を入力します。
  4. 頻度を設定します。
  5. [スケジュールを作成] をクリックします。

スケジュールを表示する

プロジェクト内のすべてのデータ準備スケジュールを表示する手順は次のとおりです。

  1. Google Cloud コンソールの [オーケストレーション] ページに移動します。

    [オーケストレーション] に移動

  2. 省略可: 選択したスケジュールと過去の実行の詳細を表示するには、スケジュールの名前をクリックします。

スケジュールを削除する

選択したデータ準備のスケジュールを完全に削除する手順は次のとおりです。

  1. Google Cloud コンソールの [オーケストレーション] ページに移動します。

    [オーケストレーション] に移動

  2. スケジュールを含む行で、 (アクション)> [削除] をクリックします。

データを増分処理してデータ準備を最適化する

準備されたデータを宛先テーブルに書き込む方法を構成する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    [BigQuery] に移動

  2. [アクティビティ] ペインで、データ準備を選択します。

  3. データ準備のツールバーで、[さらに表示] > [書き込みモード] を選択します。

  4. 次のいずれかのオプションを選択します。詳細については、書き込みモードをご覧ください。

  5. [保存] をクリックします。

データ準備のバージョン

BigQuery のデータ準備では、データ準備のバージョンの表示、比較、復元はサポートされていません。

データ準備のバージョンを時系列で確認する手順は次のとおりです。

  1. [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
  2. データ準備を選択します。バージョンは、[エクスプローラ] ペインの [アクティビティ] タブに表示されます。

データ準備をダウンロードする

データ準備を YAML ファイルでダウンロードする手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。ダウンロードするデータ準備の名前をクリックします。

  3. [ダウンロード] をクリックします。データ準備は YAML ファイル形式(NAME data preparation.dp.yaml など)で保存されます。

データ準備をアップロードする

YAML ファイルからデータ準備をアップロードする手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    [BigQuery] に移動

  2. [エクスプローラ] ペインでプロジェクトを開きます。

  3. [データの準備] フォルダに移動し、more_vert メニュー > [データ準備へのアップロード] をクリックします。

  4. [データ準備へのアップロード] ダイアログで、アップロードするファイルを選択するか、データ準備の URL を入力します。

  5. データ準備の名前を入力します。

  6. リソースが管理および保存されるデータ準備の場所を選択します。

  7. [アップロード] をクリックします。

次のステップ