Dataform リポジトリの作成

このドキュメントでは、リポジトリの作成、リポジトリのサービス アカウントの設定と編集、Dataform でリポジトリを削除する方法について説明します。

Dataform リポジトリを作成するときは、次のリポジトリ設定を設定する必要があります。

リポジトリ ID
リポジトリの一意の ID。ID には数字、英字、ハイフン、アンダースコアのみを使用できます。
リージョン

リポジトリとそのコンテンツを保存するための Dataform リージョン。

このストレージ リージョンは、Dataform がコードを処理して実行の出力を保存する処理リージョンと異なる場合があります。デフォルトでは、処理リージョンはデフォルトの BigQuery データセット リージョンに設定されています。処理リージョンは、リポジトリの作成後に dataform.json ファイルで編集できます。詳細については、Dataform の設定を構成するをご覧ください。

サービス アカウント

リポジトリに関連付けられているサービス アカウント。デフォルトの Dataform サービス アカウント、Google Cloud プロジェクトに関連付けられたサービス アカウントを選択することも、別のサービス アカウントを手動で入力することもできます。 デフォルトでは、Dataform はプロジェクト番号から派生した次の形式のサービス アカウントを使用します。

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform は、すべてのリポジトリ オペレーションにデフォルトのサービス アカウントを使用します。別のサービス アカウントを使用してリポジトリでワークフローを実行することができますが、他のすべてのリポジトリ オペレーションにはデフォルトのサービス アカウントが引き続き使用されます。

リポジトリを作成したら、GitHub または GitLab に接続できます。

準備

  1. Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Google Cloud プロジェクトで課金が有効になっていることを確認します

  4. BigQuery and Dataform API を有効にします。

    API を有効にする

  5. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  6. Google Cloud プロジェクトで課金が有効になっていることを確認します

  7. BigQuery and Dataform API を有効にします。

    API を有効にする

必要なロール

リポジトリの作成と削除に必要な権限を取得するには、リポジトリに対する Dataform 管理者 roles/dataform.admin)IAM ロールの付与を管理者に依頼してください。ロールの付与の詳細については、アクセスの管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

デフォルトの Dataform サービス アカウント以外のサービス アカウントを使用するには、デフォルト以外のサービス アカウントへのアクセスを許可します。

Dataform リポジトリの作成

Dataform リポジトリを作成するには、次の手順に従います。

  1. Google Cloud コンソールの [Dataform] ページに移動します。

    Dataform に移動

  2. [リポジトリを作成] をクリックします。

  3. [リポジトリの作成] ページの [リポジトリ ID] フィールドに、一意の ID を入力します。

    ID には数字、英字、ハイフン、アンダースコアのみを使用できます。

  4. [リージョン] プルダウン リストで、リポジトリとそのコンテンツを保存する Dataform リージョンを選択します。自身のロケーションに最も近い Dataform リージョンを選択してください。

    使用可能な Dataform リージョンの一覧については、ロケーションをご覧ください。リポジトリ リージョンは、BigQuery データセットのロケーションと一致する必要はありません。

    dataform.json ファイルでは、Dataform がコードを処理して実行の出力を保存する処理リージョンを設定できます。処理リージョンは、BigQuery データセットのロケーションと一致する必要がありますが、リポジトリ リージョンと一致する必要はありません。詳細については、 Dataform の設定を構成するをご覧ください。

  5. [サービス アカウント] プルダウンで、リポジトリのサービス アカウントを選択します。

    プルダウンでは、デフォルトの Dataform サービス アカウントか、アクセス可能な Google Cloud プロジェクトに関連付けられたサービス アカウントを選択できます。デフォルト以外のサービス アカウントはワークフローの実行にのみ使用されます。他のすべてのリポジトリ オペレーションは、デフォルトの Dataform サービス アカウントによって引き続き実行されます。

    1. (省略可)プルダウンに表示されないサービス アカウントを選択するには、[手動で入力] をクリックしてサービス アカウント ID を入力します。
  6. [作成]、[完了] の順にクリックします。

サービス アカウントを編集する

デフォルト以外のサービス アカウントを Dataform リポジトリに関連付けると、ワークフローを実行できます。その他のリポジトリ オペレーションはすべて、デフォルトの Dataform サービス アカウントによって引き続き実行されます。

Dataform リポジトリのサービス アカウントを編集する手順は次のとおりです。

  1. Google Cloud コンソールの [Dataform] ページに移動します。

    Dataform に移動

  2. リポジトリを選択して、[設定] をクリックします。

  3. [サービス アカウント] フィールドで、 [サービス アカウントを編集] をクリックします。

  4. [サービス アカウント] プルダウンで、リポジトリのサービス アカウントを選択します。

    プルダウンでは、デフォルトの Dataform サービス アカウントか、アクセス可能な Google Cloud プロジェクトに関連付けられたサービス アカウントを選択できます。

    1. (省略可)プルダウンに表示されないサービス アカウントを選択するには、[手動で入力] をクリックしてサービス アカウント ID を入力します。
  5. [保存] をクリックします。

Dataform リポジトリの削除

リポジトリとそのすべてのコンテンツを削除する方法は次のとおりです。

  1. Google Cloud コンソールの [Dataform] ページに移動します。

    Dataform に移動

  2. 削除するリポジトリで、 [その他] メニューをクリックし、[削除] を選択します。

  3. [リポジトリの削除] ウィンドウで、リポジトリの名前を入力して削除を確定します。

  4. [削除] をクリックします。

次のステップ