预览数据

本页介绍了如何在 Cloud Data Fusion Studio 中预览数据,以便您在部署和运行流水线之前调试错误。

如果您遇到错误,可以在流水线仍处于草稿模式时进行修正。

Cloud Data Fusion 会使用源数据集的前 100 行生成预览。

预览模式下,Studio 页面会显示预览作业的状态和时长。您可以随时停止预览作业。您还可以在预览作业运行时监控日志事件。

控制台

  1. 检查每个源、转换和接收器是否没有错误。如需对其进行验证,请在 Cloud Data Fusion 的 Studio 页面上,前往每个插件对应的节点,然后依次点击属性 > 验证
  2. Studio 页面上查看您的流水线,然后点击预览切换开关将其切换到开启状态。运行时长日志选项会显示在 Studio 页面画布顶部。
  3. 可选:在运行预览作业之前,请点击配置更新以下设置。

    1. 运行时参数:如需了解详情,请参阅设置运行时参数
    2. 预览配置:更新要预览的行数。
    3. 高级选项:更新流水线和引擎配置。 如需了解详情,请参阅管理数据流配置
  4. 如需启动预览作业,请点击运行。预览作业运行时,系统不会将任何数据写入接收器,但您可以在部署流水线时检查数据是否按预期读取和写入。

  5. 可选:运行预览作业后,如需查看数据在流水线的每个阶段的显示方式,请点击流水线中处理数据的节点(例如来源、接收器和转换)上的预览数据

  6. 预览完数据后,点击预览切换开关将其切换到关闭状态,退出预览模式。

后续步骤