部署複製作業後,您就無法編輯或新增資料表。請改為將資料表新增至新的或複製的複寫工作。
方法 1:建立新的複寫工作
將資料表新增至新工作是最簡單的方法。這麼做可避免重新載入所有歷來資料表,並避免資料不一致的問題。
缺點是管理多個複製工作所需的額外負擔,以及消耗更多運算資源,因為每個工作預設會在個別的暫時性 Dataproc 叢集中執行。針對後者,您可以為兩項工作使用共用的靜態 Dataproc 叢集,在某種程度上減輕這類問題。
如要進一步瞭解如何建立新工作,請參閱複製教學課程。
如要進一步瞭解如何在 Cloud Data Fusion 中使用靜態 Dataproc 叢集,請參閱「對現有的 Dataproc 叢集執行管道」一文。
方法 2:停止目前的複製作業並建立複本
如果您複製複製工作來新增資料表,請考慮下列事項:
在從頭載入所有資料表的歷史記錄中,為重複的工作結果啟用快照。如果您無法使用前述的選項 (執行個別工作),建議採用此選項。
停用快照以避免歷史資料載入,可能會導致資料遺失,因為舊管道停止運作和新管道開始運作之間可能會遺漏事件。我們不建議您建立重疊的資料表來緩解這個問題,因為這麼做也可能導致資料遺失,因為新資料表的歷來資料不會複製。
如要建立重複複寫工作,請按照下列步驟操作:
停止現有的管道。
在「複製工作」頁面中找出要複製的工作,然後按一下
和「複製」。啟用快照:
- 前往「設定來源」。
- 在「複製現有資料」欄位中,選取「是」。
在「選取表格和轉換」視窗中新增表格,然後按照精靈指示部署複製管道。
後續步驟
- 進一步瞭解複製功能。