データ準備を管理する

このドキュメントでは、データ準備のデプロイとスケジュール設定など、BigQuery でのデータ準備を管理する方法について説明します。データ準備は、Dataform を活用した BigQuery リソースです。

始める前に

必要なロール

Dataform サービス アカウントに BigQuery でデータの準備に必要な権限があることを確認するには、Dataform サービス アカウントに必要なロールをご覧ください。

BigQuery でデータを準備するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。

ロールの付与については、プロジェクト、フォルダ、組織へのアクセスを管理するをご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

既存のデータ準備を表示する

既存のデータ準備のリストを表示する手順は次のとおりです。

  1. [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
  2. プロジェクトを開きます。
  3. [データの準備] リストを開きます。

データ準備のスケジュール

スケジュールはデータ準備エディタで作成し、BigQuery の [オーケストレーション] ページで管理できます。

スケジュールを作成

データ準備ステップを実行し、準備したデータを宛先テーブルに読み込むスケジュールを作成するには、1 回限りまたは定期的なデータ準備実行をスケジュールします。

  1. データ準備ツールバーで [スケジュール] をクリックします。
  2. スケジュール名を入力します。
  3. 実行に関連付けられているサービス アカウント名を入力します。
  4. 頻度をスケジュールします。
  5. [スケジュールを作成] をクリックします。

スケジュールを表示

プロジェクト内のすべてのデータ準備スケジュールを表示する手順は次のとおりです。

  1. Google Cloud コンソールの [オーケストレーション] ページに移動します。

    [オーケストレーション] に移動

  2. 省略可: 選択したスケジュールと過去の実行の詳細を表示するには、スケジュールの名前をクリックします。

スケジュールの削除

選択したデータ準備のスケジュールを完全に削除する手順は次のとおりです。

  1. Google Cloud コンソールの [オーケストレーション] ページに移動します。

    [オーケストレーション] に移動

  2. スケジュールを含む行で、 [アクション] > [削除] をクリックします。

データを増分処理してデータ準備を最適化する

準備されたデータを宛先テーブルに書き込む方法を構成する手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    BigQuery に移動

  2. [アクティビティ] ペインで、データ準備を選択します。

  3. データ準備のツールバーで、[その他] > [書き込みモード] を選択します。

  4. いずれかのオプションを選択します。詳細については、書き込みモードをご覧ください。

  5. [保存] をクリックします。

候補の改善に協力する

プレビュー版の機能に送信したプロンプト データを Google と共有することで、Gemini の候補の改善にご協力いただけます。プロンプト データを共有する手順は次のとおりです。

  1. BigQuery でデータ準備エディタを開きます
  2. データ準備ツールバーで、設定アイコン その他をクリックします。
  3. [データを共有して Gemini in BigQuery を改善します] を選択します。

データ共有設定はプロジェクト全体に適用されます。これは、serviceusage.services.enableserviceusage.services.list の IAM 権限を持つプロジェクト管理者のみ設定できます。Trusted Tester プログラムでのデータの使用について詳しくは、Google Cloud Trusted Tester プログラムの Gemini をご覧ください。

データ準備のバージョン

BigQuery データ準備では、データ準備のバージョンの表示、比較、復元はサポートされていません。

データ準備のバージョンを時系列で確認する手順は次のとおりです。

  1. [BigQuery Studio] ページで、[エクスプローラ] ペインに移動します。
  2. データ準備を選択します。バージョンは、[エクスプローラ] ペインの [アクティビティ] タブに表示されます。

データ準備をダウンロードする

YAML ファイルでデータ準備をダウンロードする手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインで、プロジェクトと [データ準備] フォルダを開きます。ダウンロードするデータ準備の名前をクリックします。

  3. [ダウンロード] をクリックします。データ準備は、YAML ファイル形式(NAME data preparation.dp.yaml など)で保存されます。

データ準備をアップロードする

YAML ファイルからデータ準備をアップロードする手順は次のとおりです。

  1. Google Cloud コンソールで [BigQuery Studio] ページに移動します。

    BigQuery に移動

  2. [エクスプローラ] ペインでプロジェクト を展開します。

  3. [データ準備] フォルダに移動し、more_vert メニュー > [データ準備にアップロード] をクリックします。

  4. [データ準備をアップロード] ダイアログで、アップロードするファイルを選択するか、データ準備の URL を入力します。

  5. データ準備の名前を入力します。

  6. リソースが管理および保存されるデータ準備場所を選択します。

  7. [アップロード] をクリックします。

次のステップ