データ準備を管理する
このドキュメントでは、データ準備のデプロイとスケジュール設定など、BigQuery でのデータ準備を管理する方法について説明します。データ準備は、Dataform を活用した BigQuery リソースです。
始める前に
- Gemini in BigQuery API が有効になっていることを確認します。
必要なロール
Dataform サービス アカウントに BigQuery でのデータ準備に必要な権限があることを確認するには、Dataform サービス アカウントに必要なロールをご覧ください。
BigQuery でのデータ準備に必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。
- BigQuery データ編集者(
roles/bigquery.dataEditor
) -
Service Usage ユーザー(
roles/serviceusage.serviceUsageConsumer
)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセスを管理するをご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
既存のデータ準備を表示する
既存のデータ準備のリストを表示する手順は次のとおりです。
- [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
- プロジェクトを開きます。
- [データの準備] リストを開きます。
データ準備をスケジュールする
データ準備のスケジュールは、データ準備エディタで作成し、BigQuery の [オーケストレーション] ページで管理できます。
スケジュールを作成する
データ準備ステップを実行し、準備したデータを宛先テーブルに読み込むスケジュールを作成するには、1 回限りまたは定期的なデータ準備実行をスケジュールします。
- データ準備のツールバーで [スケジュール] をクリックします。
- スケジュールの名前を入力します。
- 実行に関連付けられているサービス アカウント名を入力します。
- 頻度を設定します。
- [スケジュールを作成] をクリックします。
スケジュールを表示する
プロジェクト内のすべてのデータ準備スケジュールを表示する手順は次のとおりです。
Google Cloud コンソールの [オーケストレーション] ページに移動します。
省略可: 選択したスケジュールと過去の実行の詳細を表示するには、スケジュールの名前をクリックします。
スケジュールを削除する
選択したデータ準備のスケジュールを完全に削除する手順は次のとおりです。
Google Cloud コンソールの [オーケストレーション] ページに移動します。
スケジュールを含む行で、> [削除] をクリックします。
(アクション)
データを増分処理してデータ準備を最適化する
準備されたデータを宛先テーブルに書き込む方法を構成する手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[アクティビティ] ペインで、データ準備を選択します。
データ準備のツールバーで、[さらに表示] > [書き込みモード] を選択します。
次のいずれかのオプションを選択します。詳細については、書き込みモードをご覧ください。
[保存] をクリックします。
データ準備のバージョン
BigQuery のデータ準備では、データ準備のバージョンの表示、比較、復元はサポートされていません。
データ準備のバージョンを時系列で確認する手順は次のとおりです。
- [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
- データ準備を選択します。バージョンは、[エクスプローラ] ペインの [アクティビティ] タブに表示されます。
データ準備をダウンロードする
データ準備を YAML ファイルでダウンロードする手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。ダウンロードするデータ準備の名前をクリックします。
[ダウンロード] をクリックします。データ準備は YAML ファイル形式(
NAME data preparation.dp.yaml
など)で保存されます。
データ準備をアップロードする
YAML ファイルからデータ準備をアップロードする手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[エクスプローラ] ペインでプロジェクトを開きます。
[データの準備] フォルダに移動し、more_vert メニュー > [データ準備へのアップロード] をクリックします。
[データ準備へのアップロード] ダイアログで、アップロードするファイルを選択するか、データ準備の URL を入力します。
データ準備の名前を入力します。
リソースが管理および保存されるデータ準備の場所を選択します。
[アップロード] をクリックします。
次のステップ
- BigQuery でのデータ準備について詳細を学習する。
- データ準備の作成方法について学習する。