本頁面說明如何建立 Cloud Data Fusion 執行個體。
事前準備
- 啟用 Cloud Data Fusion API。
- 需具備
instances.create
權限,才能建立 Cloud Data Fusion 執行個體。詳情請參閱「存取權控管」。 - 系統會以 Compute Engine 預設服務帳戶的身分執行 Cloud Data Fusion 執行個體。如要瞭解可用的類型和角色,請參閱「服務帳戶」一文。
- 根據預設,Cloud Data Fusion 會使用專案中的 Dataproc 叢集執行管道。請確認專案符合 Dataproc 網路需求。
- 新專案一開始即設有預設網路。預設網路會預先填入防火牆規則 default-allow-ssh,允許從任何來源透過 TCP 通訊埠 22 連線到網路中的任何執行個體。在 6.2.0 以下版本中,如果 Cloud Data Fusion 執行個體使用的網路中沒有允許在 TCP 通訊埠 22 上傳入的規則,則必須建立此規則。
建立執行個體
控制台
若您已啟用 API, Google Cloud 主控台的 Cloud Data Fusion 區段即會顯示「Instances」(執行個體) 頁面,可供您建立及管理 Cloud Data Fusion 執行個體。
- 前往控制台的 Cloud Data Fusion 頁面。
- 依序按一下「Instances」和「Create an instance」。
- 輸入「Instance name」(執行個體名稱)。
- 輸入執行個體的說明。
- 指定要建立執行個體的「Region」(區域)。
- 指定 Cloud Data Fusion 版本。
- 選取版本。預設值為「Basic」(基本)。
- 選用:按一下「Add accelerators」,選取要用於執行個體的加速器。
- 指定要在 Dataproc 中執行 Cloud Data Fusion 管道時使用的 Dataproc 服務帳戶。預設為 Compute Engine 帳戶。無論版本為何,請確認服務帳戶具有適當的身分與存取權管理角色,以滿足您的需求。詳情請參閱「授予服務帳戶使用者權限」。
選用:指定任何進階選項。如果您未指定任何值,系統會使用下列預設值:
類別 設定 說明 預設 私人 IP 啟用內部 IP 位址 使用內部 IP 位址建立 Cloud Data Fusion 執行個體。 已停用 進階監控與記錄功能 啟用 Dataproc Cloud Logging
啟用 Dataproc Cloud Monitoring
在 Cloud Logging 中查看進階管道記錄檔。 已停用 Dataplex 通用目錄資料歷程整合 啟用或停用 Dataplex 通用目錄資料歷程整合功能 在 Dataplex 通用目錄中查看歷程。 已停用 加密 使用客戶自行管理的加密金鑰 (CMEK) 在 6.5 以上版本中使用 角色型存取權控管。 已停用 標籤 鍵/值組合 用來加註任一相關基礎資源 (如 Compute Engine VM) 的執行個體資源標籤。標籤鍵和標籤值只能包含英文字母、數字、破折號和底線。標籤鍵開頭必須是字母或數字。 無 維護 啟用維護期間 設定 Cloud Data Fusion 可在執行個體上執行維護作業的時間範圍。詳情請參閱「 設定維護期間」。 已停用 按一下「建立」,執行個體建立程序最多需要 30 分鐘才能完成。
在 Cloud Data Fusion 建立執行個體時,「Instances」頁面會在執行個體名稱旁顯示進度輪盤。完成後,這個圖示會變成綠色的勾號圖案,代表您可以開始使用這個執行個體。
API
建立執行個體:
如要使用 Cloud Data Fusion REST API 建立 Cloud Data Fusion 執行個體,請建構 instances.create
API 要求,並在 Instance
資源中填入設定資訊。
後續步驟
- 進一步瞭解 Cloud Data Fusion。
- 逐步完成教學課程。