配置资源以进行迁移
本页介绍了迁移流程的准备部分,您可以在其中配置迁移资源。
在此阶段,您将执行以下操作:
- 安装在迁移过程的后续阶段运行命令所需的命令行工具。
- 配置与 MongoDB 兼容的 Firestore 数据库。
- (可选)调整 MongoDB 兼容来源上的操作日志 (oplog) 设置。
- 创建一个 Cloud Storage 存储桶,用于存储中间数据。
配置 IAM 权限
您的账号需要在迁移过程中使用的所有服务中拥有适当的 IAM 角色:
安装命令行工具
迁移过程使用 gcloud CLI 来配置和执行迁移步骤。如果需要,请按照安装 gcloud CLI 页面上的说明安装 gcloud CLI。
特定于来源的配置
Compute Engine 上的 MongoDB
在自行管理的集群中的 Compute Engine 虚拟机上运行的 MongoDB 数据库通常不会向公共互联网公开。迁移过程将使用 Datastream 中的 Private Service Connect 将 Datastream 管道连接到源数据库。
执行以下操作:
按照创建专用连接配置中所述的说明配置 Datastream 专用连接。
记下所创建配置的
Configuration ID
参数。您将在后续阶段使用它来设置所需的环境变量。
Azure Cosmos DB
确保您的计算机上安装了 Azure CLI。
配置目标 Firestore(与 MongoDB 兼容)数据库
确保您的项目具有与 MongoDB 兼容的 Firestore 数据库,您将从源 MongoDB 数据库迁移数据到该数据库。如需详细了解如何创建数据库,请参阅创建和管理数据库。
为了便于迁移,我们建议为与 MongoDB 兼容的 Firestore 数据库创建用户名和密码,以便与 SCRAM-SHA-256 身份验证协议搭配使用。迁移完成后,您可以安全地删除此用户名,也可以选择继续使用这些凭据将 MongoDB 客户端连接到新的与 MongoDB 兼容的 Firestore 数据库。
您将在后续步骤中使用此与 MongoDB 兼容的 Firestore 数据库的名称和用户凭据。
调整源数据库的 oplog 窗口大小
我们建议您将源 MongoDB 数据库的 oplog 窗口调整为该数据库 3 天的总写入流量。如果写入流量的速率超过 Datastream 从数据库中提取更改的速率,此调整将有助于防止数据丢失。
您可能需要根据流量模式和峰值流量进一步调整该值。例如,如果在一小段时间内写入了一周的流量,那么在更改超出 oplog 窗口之前,Datastream 可能无法足够快地从 oplog 中捕获更改。在这种情况下,您可能需要将 oplog 窗口的大小调整为相当于 7 天的总写入流量。
创建 Cloud Storage 存储桶
按以下方式创建新的 Cloud Storage 存储桶:
选择迁移流水线将运行的 Cloud Storage 区域。建议使用目标 Firestore(具有 MongoDB 兼容性)数据库所在的区域。
为此存储桶选择名称。示例:
mongo-migration-bucket
。您将在后续步骤中使用此名称。按照 Cloud Storage 文档中创建存储桶页面上提供的说明,使用所选名称在所选区域中创建新的 Cloud Storage 存储桶。
后续步骤
继续配置环境变量。