データ準備を管理する
このドキュメントでは、データ準備のデプロイとスケジュール設定など、BigQuery でのデータ準備を管理する方法について説明します。データ準備は、Dataform を活用した BigQuery リソースです。
始める前に
- BigQuery API の Gemini が有効になっていることを確認します。
必要なロール
Dataform サービス アカウントに BigQuery でデータの準備に必要な権限があることを確認するには、Dataform サービス アカウントに必要なロールをご覧ください。
BigQuery でデータを準備するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。
-
BigQuery データ編集者(
roles/bigquery.dataEditor
) -
Service Usage ユーザー(
roles/serviceusage.serviceUsageConsumer
)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセスを管理するをご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
既存のデータ準備を表示する
既存のデータ準備のリストを表示する手順は次のとおりです。
- [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
- プロジェクトを開きます。
- [データの準備] リストを開きます。
データ準備のスケジュール
スケジュールはデータ準備エディタで作成し、BigQuery の [オーケストレーション] ページで管理できます。
スケジュールを作成
データ準備ステップを実行し、準備したデータを宛先テーブルに読み込むスケジュールを作成するには、1 回限りまたは定期的なデータ準備実行をスケジュールします。
- データ準備ツールバーで [スケジュール] をクリックします。
- スケジュール名を入力します。
- 実行に関連付けられているサービス アカウント名を入力します。
- 頻度をスケジュールします。
- [スケジュールを作成] をクリックします。
スケジュールを表示
プロジェクト内のすべてのデータ準備スケジュールを表示する手順は次のとおりです。
Google Cloud コンソールの [オーケストレーション] ページに移動します。
省略可: 選択したスケジュールと過去の実行の詳細を表示するには、スケジュールの名前をクリックします。
スケジュールの削除
選択したデータ準備のスケジュールを完全に削除する手順は次のとおりです。
Google Cloud コンソールの [オーケストレーション] ページに移動します。
スケジュールを含む行で、> [削除] をクリックします。
[アクション]
データを増分処理してデータ準備を最適化する
準備されたデータを宛先テーブルに書き込む方法を構成する手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[アクティビティ] ペインで、データ準備を選択します。
データ準備のツールバーで、[その他] > [書き込みモード] を選択します。
いずれかのオプションを選択します。詳細については、書き込みモードをご覧ください。
[保存] をクリックします。
候補の改善に協力する
プレビュー版の機能に送信したプロンプト データを Google と共有することで、Gemini の候補の改善にご協力いただけます。プロンプト データを共有する手順は次のとおりです。
- BigQuery でデータ準備エディタを開きます。
- データ準備ツールバーで、設定アイコン その他をクリックします。
- [データを共有して Gemini in BigQuery を改善します] を選択します。
データ共有設定はプロジェクト全体に適用されます。これは、serviceusage.services.enable
と serviceusage.services.list
の IAM 権限を持つプロジェクト管理者のみ設定できます。Trusted Tester プログラムでのデータの使用について詳しくは、Google Cloud Trusted Tester プログラムの Gemini をご覧ください。
データ準備のバージョン
BigQuery データ準備では、データ準備のバージョンの表示、比較、復元はサポートされていません。
データ準備のバージョンを時系列で確認する手順は次のとおりです。
- [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
- データ準備を選択します。バージョンは、[エクスプローラ] ペインの [アクティビティ] タブに表示されます。
データ準備をダウンロードする
YAML ファイルでデータ準備をダウンロードする手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。ダウンロードするデータ準備の名前をクリックします。
[ダウンロード] をクリックします。データ準備は、YAML ファイル形式(
NAME data preparation.dp.yaml
など)で保存されます。
データ準備をアップロードする
YAML ファイルからデータ準備をアップロードする手順は次のとおりです。
Google Cloud コンソールで [BigQuery Studio] ページに移動します。
[エクスプローラ] ペインでプロジェクト を展開します。
[データ準備] フォルダに移動し、more_vert メニュー > [データ準備にアップロード] をクリックします。
[データ準備をアップロード] ダイアログで、アップロードするファイルを選択するか、データ準備の URL を入力します。
データ準備の名前を入力します。
リソースが管理および保存されるデータ準備場所を選択します。
[アップロード] をクリックします。
次のステップ
- 詳しくは、BigQuery でのデータの準備をご覧ください。
- データ準備を作成する方法を学びます。