在複製工作中新增資料表

部署複製作業後,您就無法編輯或新增資料表。請改為將資料表新增至新的或複製的複寫工作。

方法 1:建立新的複寫工作

將資料表新增至新工作是最簡單的方法。這麼做可避免重新載入所有歷來資料表,並避免資料不一致的問題。

缺點是管理多個複製工作所需的額外負擔,以及消耗更多運算資源,因為每個工作預設會在個別的暫時性 Dataproc 叢集中執行。針對後者,您可以為兩項工作使用共用的靜態 Dataproc 叢集,在某種程度上減輕這類問題。

如要進一步瞭解如何建立新工作,請參閱複製教學課程

如要進一步瞭解如何在 Cloud Data Fusion 中使用靜態 Dataproc 叢集,請參閱「對現有的 Dataproc 叢集執行管道」一文。

方法 2:停止目前的複製作業並建立複本

如果您複製複製工作來新增資料表,請考慮下列事項:

  • 在從頭載入所有資料表的歷史記錄中,為重複的工作結果啟用快照。如果您無法使用前述的選項 (執行個別工作),建議採用此選項。

  • 停用快照以避免歷史資料載入,可能會導致資料遺失,因為舊管道停止運作和新管道開始運作之間可能會遺漏事件。我們不建議您建立重疊的資料表來緩解這個問題,因為這麼做也可能導致資料遺失,因為新資料表的歷來資料不會複製。

如要建立重複複寫工作,請按照下列步驟操作:

  1. 停止現有的管道。

  2. 在「複製工作」頁面中找出要複製的工作,然後按一下 和「複製」

  3. 啟用快照:

    1. 前往「設定來源」
    2. 在「複製現有資料」欄位中,選取「是」
  4. 在「選取表格和轉換」視窗中新增表格,然後按照精靈指示部署複製管道。

後續步驟