预览数据

本页面介绍了如何在 Cloud Data Fusion Studio 中预览数据, 以便在部署和运行流水线之前调试错误。

如果遇到错误,可以在流水线仍处于“草稿”状态时进行修复 模式。

Cloud Data Fusion 使用源数据集的前 100 行 生成预览。

预览模式下,Studio 页面会显示预览作业的状态和时长。您可以随时停止预览作业。你还可以监控 日志事件。

控制台

  1. 检查并确保每个来源、转换和接收器都没有错误。接收者 验证它们,请在 Cloud Data Fusion Studio 页面上转到 依次点击 Properties > 验证
  2. Studio 页面上查看流水线,然后点击 Preview。 切换到开启位置。RunDurationLogs 选项 会显示在 Studio 页面画布的顶部。
  3. 可选:在运行预览作业之前,更新以下设置 点击配置

    1. 运行时参数:如需了解详情,请参阅 设置运行时参数
    2. 预览配置:更新要预览的行数。
    3. 高级选项:更新流水线和引擎配置。 如需了解详情,请参阅管理流水线配置
  4. 如需启动预览作业,请点击运行。运行预览作业时,系统不会将任何数据写入接收器,但您可以在部署流水线时检查数据是否按预期读取和写入。

  5. 可选:运行预览作业后,查看数据的显示效果 请点击 Cloud Build 中节点上的 Preview data(预览数据), 用于处理数据的流水线,例如来源、接收器和 转换。

  6. 预览完数据后,点击 将预览开关切换到关闭位置。

后续步骤