建立開發環境

本快速入門導覽課程會逐步說明如何在 Dataform 中建立個別開發環境,讓每位開發人員都能在自己的開發環境中工作:

事前準備

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Enable the APIs

  8. 必要的角色

    如要取得執行本教學課程所有工作所需的權限,請要求管理員在專案中授予您下列 IAM 角色:

    • Dataform 管理員 (roles/dataform.admin) - 存放區
    • Dataform 編輯者 (roles/dataform.editor) - 工作區和工作流程調用

    如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

    您或許還可透過自訂角色或其他預先定義的角色取得必要權限。

    建立 Dataform 存放區

    1. 前往 Google Cloud 控制台的「Dataform」頁面。

      前往 Dataform

    2. 按一下 「建立存放區」

    3. 在「建立存放區」頁面中執行下列操作:

      1. 在「Repository ID」(存放區 ID) 欄位中輸入 quickstart-dev

      2. 在「Region」(區域) 清單中選取「europe-west4」。

      3. 按一下「Create」(建立)

    4. 按一下 [完成]

    為 Dataform 授予 BigQuery 存取權

    如要在 BigQuery 中執行工作流程,Dataform 服務帳戶或 Google 帳戶 (搶先版) 必須具備下列必要角色:

    • Dataform 需要讀取和寫入權限的專案,請授予「BigQuery 資料編輯者」角色。通常包括代管 Dataform 存放區的專案。
    • 在 Dataform 需要唯讀存取權的專案中,授予 BigQuery 資料檢視者角色。
    • Dataform 存放區代管專案的 BigQuery 工作使用者

    如要授予這些角色,請按照下列步驟操作:

    1. 前往 Google Cloud 控制台的「IAM」IAM頁面。

      前往「IAM」頁面

    2. 按一下「新增」

    3. 在「新增主體」欄位中,輸入 Dataform 服務帳戶 ID 或 Google 帳戶電子郵件地址 (預覽版)。

    4. 在「Select a role」(選取角色) 選單中,選取「BigQuery Job User」(BigQuery 工作使用者) 角色。

    5. 點選「新增其他角色」,然後在「請選擇角色」選單中,選取「BigQuery 資料編輯者」角色。

    6. 點選「新增其他角色」,然後在「請選擇角色」選單中,選取「BigQuery 資料檢視者」角色。

    7. 按一下 [儲存]

    建立工作區編譯覆寫設定

    如要使用 Dataform 工作區編譯覆寫功能來建立獨立的開發環境,請按照下列步驟操作:

    1. 前往 Google Cloud 控制台的「Dataform」頁面。

      前往 Dataform

    2. 按一下「quickstart-dev」。

    3. 按一下「Settings」(設定),然後按一下「Edit」(編輯)

    4. 在「Workspace compilation overrides」(工作區編譯覆寫設定) 窗格中的「Schema suffix」(結構定義後置字串) 欄位中輸入 ${workspaceName}

      在工作區中觸發執行作業時,Dataform 會以工作區名稱做為後置字串,附加至工作流程設定中設定的預設結構定義。本快速入門導覽課程會使用具 dataform 預設結構定義的預設 Dataform 設定。

    5. 按一下 [儲存]

    Dataform 會將工作區編譯覆寫設定套用到存放區中的所有工作區。

    完成這項設定後,在工作區中手動執行工作流程時,Dataform 會透過工作區編譯覆寫來執行該工作流程。因此,Dataform 會在 BigQuery 的 dataform_workspaceName 結構定義中執行工作流程,將工作區轉換為獨立的開發環境。

    舉例來說,當您在 sasha 工作區中手動觸發執行作業時,Dataform 會在 BigQuery 的 dataform_sasha 結構定義中執行工作流程。

    如要在沒有工作區編譯覆寫的情況下執行工作流程,但保留開發環境的工作區編譯覆寫,您可以建立版本設定來設置其他執行環境,例如 stagingproduction

    清除所用資源

    如要避免系統向您的 Google Cloud 帳戶收取本頁所用資源的費用,請按照下列步驟操作。

    刪除在 BigQuery 中建立的資料集

    如要避免系統依 BigQuery 資產收取費用,請刪除名稱開頭為 dataform 的資料集,例如 dataform-sasha

    1. 前往 Google Cloud 控制台的「BigQuery」頁面。

      前往 BigQuery

    2. 在「Explorer」面板中展開專案並選取資料集。

    3. 按一下 「Actions」(動作) 選單,然後選取「Delete」(刪除)。

    4. 在「Delete dataset」(刪除資料集) 對話方塊中,在欄位輸入 delete,然後按一下「Delete」(刪除)

    刪除 Dataform 存放區

    建立 Dataform 存放區不會產生任何費用。不過,如果您想刪除存放區和當中所有內容,可以按照下列步驟操作:

    1. 前往 Google Cloud 控制台的「Dataform」頁面。

      前往 Dataform

    2. quickstart-dev 旁邊,按一下 「More」(更多) 選單,然後選取「Delete」(刪除)

      1. 在「Delete repository」(刪除存放區) 視窗中,輸入存放區名稱來確認刪除。
    3. 按一下「Delete」(刪除) 確認操作。

    後續步驟