設定遷移資源
本頁面說明遷移程序的準備工作,也就是設定遷移作業的資源。
在這個階段,您將執行下列操作:
- 安裝指令列工具,以便在遷移程序後續階段執行指令。
- 設定與 MongoDB 相容的 Firestore 資料庫。
- (選用) 調整 MongoDB 相容來源的作業記錄 (oplog) 設定。
- 建立 Cloud Storage bucket,用於儲存中繼資料。
設定 IAM 權限
您的帳戶必須在遷移程序中使用的所有服務中,具備適當的 IAM 角色:
安裝指令列工具
遷移程序會使用 gcloud CLI 設定及執行遷移步驟。如有需要,請按照「安裝 gcloud CLI」頁面的操作說明安裝 gcloud CLI。
來源專屬設定
Compute Engine 上的 MongoDB
在自我管理的叢集中,於 Compute Engine VM 上執行的 MongoDB 資料庫通常不會公開至網際網路。遷移程序會使用 Datastream 中的 Private Service Connect,將 Datastream 管道連線至來源資料庫。
請執行下列步驟:
按照「建立私人連線設定」一文中的說明,設定 Datastream 私人連線。
請記下所建立設定的
Configuration ID
參數。您會在後續階段使用此檔案,設定必要的環境變數。
Azure Cosmos DB
確認電腦已安裝 Azure CLI。
Amazon DocumentDB
Amazon DocumentDB 叢集無法直接從 Amazon VPC 網路外部存取。如要連線至 DocumentDB 叢集,您必須在 Amazon VPC 網路中佈建 EC2 執行個體,並將該執行個體做為 SSH 通道的防禦主機。
如需設定 EC2 執行個體,以便從外部連線至 DocumentDB 的操作說明,請參閱「Connecting to an Amazon DocumentDB cluster from outside an Amazon VPC」(從 Amazon VPC 外部連線至 Amazon DocumentDB 叢集) 開發人員指南。
如要連線至 DocumentDB 叢集,您必須取得 EC2 執行個體的私密安全殼層金鑰,以及叢集部署所在區域的適當憑證套件。前往「依 AWS 區域提供的憑證套裝組合」資源頁面,下載 PEM 格式的適當套裝組合。
請注意,憑證組合包含多個憑證。您必須擷取單一憑證,才能設定 Datastream 連線。建議您手動驗證 DocumentDB 連線,確保您擁有有效的 SSH 金鑰和有效的 DocumentDB 憑證 (來自區域套件)。DocumentDB 開發人員指南提供指令列範例,說明如何從虛擬私有雲外部建立直接連線。
設定目的地 Firestore 與 MongoDB 相容資料庫
請確認專案具有與 MongoDB 相容的 Firestore 資料庫,您將從來源 MongoDB 資料庫遷移資料。如要進一步瞭解如何建立資料庫,請參閱「建立及管理資料庫」。
為進行這項遷移作業,建議您建立使用者名稱和密碼,供與 MongoDB 相容的 Firestore 資料庫使用,並搭配 SCRAM-SHA-256 驗證通訊協定。遷移作業完成後,您可以安全地刪除這個使用者名稱,也可以選擇繼續使用這些憑證,將 MongoDB 用戶端連線至新的 Firestore (與 MongoDB 相容) 資料庫。
您會在後續步驟中使用這個與 MongoDB 相容的 Firestore 資料庫名稱和使用者憑證。
調整來源資料庫的 oplog 視窗大小
建議您將來源 MongoDB 資料庫的 oplog 視窗調整為 3 天,以涵蓋寫入這個資料庫的總流量。如果寫入流量的速率超過 Datastream 從資料庫取用變更的速率,這項調整措施可避免資料遺失。
視流量模式和尖峰流量大小而定,您可能需要進一步調整值。舉例來說,如果短時間內寫入一週的流量,Datastream 可能無法在變更超出 oplog 視窗前,快速擷取 oplog 的變更。在這種情況下,您可能需要將 oplog 視窗大小調整為 7 天的總寫入流量。
建立 Cloud Storage 值區
請按照下列方式建立新的 Cloud Storage bucket:
選擇要執行遷移管道的 Cloud Storage 區域。建議使用目的地 Firestore (與 MongoDB 相容) 資料庫所在的區域。
選擇這個值區的名稱。例如:
mongo-migration-bucket
。您將在後續步驟中使用這個名稱。按照 Cloud Storage 說明文件「建立 bucket」頁面中的指示,以所選名稱在所選區域建立新的 Cloud Storage bucket。
後續步驟
請繼續設定環境變數。