配置资源以进行迁移

本页介绍了迁移流程的准备部分,您可以在其中配置迁移资源。

在此阶段,您将执行以下操作:

  1. 安装在迁移过程的后续阶段运行命令所需的命令行工具。
  2. 配置与 MongoDB 兼容的 Firestore 数据库。
  3. (可选)调整 MongoDB 兼容来源上的操作日志 (oplog) 设置。
  4. 创建一个 Cloud Storage 存储桶,用于存储中间数据。

配置 IAM 权限

您的账号需要在迁移过程中使用的所有服务中拥有适当的 IAM 角色:

安装命令行工具

迁移过程使用 gcloud CLI 来配置和执行迁移步骤。如果需要,请按照安装 gcloud CLI 页面上的说明安装 gcloud CLI。

特定于来源的配置

Compute Engine 上的 MongoDB

在自行管理的集群中的 Compute Engine 虚拟机上运行的 MongoDB 数据库通常不会向公共互联网公开。迁移过程将使用 Datastream 中的 Private Service Connect 将 Datastream 管道连接到源数据库。

执行以下操作:

  1. 按照创建专用连接配置中所述的说明配置 Datastream 专用连接。

  2. 记下所创建配置的 Configuration ID 参数。您将在后续阶段使用它来设置所需的环境变量。

Azure Cosmos DB

确保您的计算机上安装了 Azure CLI

配置目标 Firestore(与 MongoDB 兼容)数据库

  1. 确保您的项目具有与 MongoDB 兼容的 Firestore 数据库,您将从源 MongoDB 数据库迁移数据到该数据库。如需详细了解如何创建数据库,请参阅创建和管理数据库

  2. 为了便于迁移,我们建议为与 MongoDB 兼容的 Firestore 数据库创建用户名和密码,以便与 SCRAM-SHA-256 身份验证协议搭配使用。迁移完成后,您可以安全地删除此用户名,也可以选择继续使用这些凭据将 MongoDB 客户端连接到新的与 MongoDB 兼容的 Firestore 数据库。

您将在后续步骤中使用此与 MongoDB 兼容的 Firestore 数据库的名称和用户凭据。

调整源数据库的 oplog 窗口大小

我们建议您将源 MongoDB 数据库的 oplog 窗口调整为该数据库 3 天的总写入流量。如果写入流量的速率超过 Datastream 从数据库中提取更改的速率,此调整将有助于防止数据丢失。

您可能需要根据流量模式和峰值流量进一步调整该值。例如,如果在一小段时间内写入了一周的流量,那么在更改超出 oplog 窗口之前,Datastream 可能无法足够快地从 oplog 中捕获更改。在这种情况下,您可能需要将 oplog 窗口的大小调整为相当于 7 天的总写入流量。

创建 Cloud Storage 存储桶

按以下方式创建新的 Cloud Storage 存储桶:

  1. 选择迁移流水线将运行的 Cloud Storage 区域。建议使用目标 Firestore(具有 MongoDB 兼容性)数据库所在的区域。

  2. 为此存储桶选择名称。示例:mongo-migration-bucket。您将在后续步骤中使用此名称。

  3. 按照 Cloud Storage 文档中创建存储桶页面上提供的说明,使用所选名称在所选区域中创建新的 Cloud Storage 存储桶。

后续步骤

继续配置环境变量