Cloud Dataprep by Trifacta

智能的云端数据服务,让您可以直观地探索、清理和准备数据,以备分析和机器学习之用。

智能数据准备

智能数据准备

Cloud Dataprep by Trifacta 是一项智能的数据服务,让您可以直观地探索、清理和准备结构化数据及非结构化数据,以备分析、报告和机器学习之用。由于 Cloud Dataprep 是一款无服务器工具,您可以处理任意规模的数据,而无需部署或管理任何基础架构。Dataprep 会根据您在界面中的每项输入,建议和预测接下来最合适的数据转换操作,您无需编写代码。此外,借助对架构、数据类型、潜在联接和异常的自动检测功能,您可以跳过耗时的数据画像工作,专注于数据分析。

无服务器带来简单性

无服务器带来简单性

Cloud Dataprep 是一项由 Trifacta 负责运营的集成式合作伙伴服务,以该公司领先业界的数据准备解决方案 Trifacta Wrangler 为基础打造而成。Google 与 Trifacta 密切合作,不要求用户预先安装任何软件、没有单独的许可费用或持续运营开销,可为用户提供流畅的使用体验。Cloud Dataprep 是一项全托管式服务,可按需扩缩,以满足您日益增加的数据准备需求,让您持续专注于分析。

快速探索和异常检测

快速探索和异常检测

直观的数据分布图可帮助您即时了解和探索数据。Cloud Dataprep 会自动检测架构、数据类型、潜在联接及异常(如值缺失、离群值和重复),让您可以跳过耗时的数据画像工作,直接进行数据探索和分析。

简单而强大的数据准备

简单而强大的数据准备

您在界面中每执行一项操作,Cloud Dataprep 都会自动建议和预测接下来最合适的数据转换操作。您定义好转换序列后,Cloud Dataprep 会在后台使用 Cloud Dataflow 来转换数据,让您轻松点击几下就能处理任何规模的结构化或非结构化数据集,省去了编写代码的麻烦。

Cloud Dataprep 客户

Cloud Dataprep 使我们能够快速探索新的数据集,它灵活多变,可以满足我们所有的数据转换需求。Merkle 现在几分钟就能完成数据准备工作,而不用花上几个小时或几天,这使数据准备时间缩短了 90%。

Henry Culver,Merkle IT 架构师

Cloud Dataprep 架构

Cloud Dataprep 架构

Cloud Dataprep 特性

预测性转换

Cloud Dataprep 采用专有的推理算法来解读用户在数据选择过程中体现出的数据转换意图。然后它会根据数据选择情况,自动生成一组经过排序的建议和模式。

参数化

参数化一个变量来替换文件路径中随每次刷新而变化的部分,从而在相同数据集的多个实例中执行同一个配方。该变量可根据需要在运行作业的过程中修改。

协作

在团队环境中,如果能让多个用户处理同一项资源,或者能复制优质工作成果并将其作为模板提供给其他用户参考,很可能大有益处。利用 Cloud Dataprep,用户可以实时协同处理同一个流对象,或者创建副本供其他人单独使用。

模式匹配

利用列式模式匹配,识别您感兴趣的数据模式并在界面中呈现,以便用来构建配方。此外,在配方步骤中,您可以用正则表达式或 Cloud Dataprep 模式来寻找数据模式,并转换数据集中的匹配数据。

直观剖析

通过交互式的直观数据分布图查看并探索数据,推进数据发现、清理和转换工作。直观的展示形式有助于解读大量数据,Cloud Dataprep 采用创新性分析方法,能够以动态、清晰明了的格式实现关键统计信息的可视化。

采样

为了优化性能,Cloud Dataprep 会自动生成一个或多个数据样本,供您在客户端应用中进行显示和操作。不过,您可以轻松更改样本大小、样本范围以及创建样本的方法。

时间安排

您可以重复或根据需要安排定时执行流中的配方。安排的作业成功执行后,您可以在指定的输出位置收集经过整理的输出数据,输出位置可在您指定的发布表单中找到。

目标匹配

您可以根据导入或创建的数据集,定义目标架构并将其分配给现有配方,以系统化并加速您的整理工作。目标会显示在“转换器”页面中,并可以应用于需要进行整理的整个数据集或数据集的选定列。

常见数据类型

转换以 CSV、JSON 或关系型表格式存储的结构化和非结构化数据集,从 MB 到 PB 级的任意规模,皆可轻松简单地进行处理。

与 Google Cloud Platform 集成

处理存储在 Cloud Storage、BigQuery 或桌面设备上的数据,然后将经过优化的数据导出至 BigQuery 或 Cloud Storage,以进行存储、分析、可视化或机器学习。借助 Cloud Identity and Access Management 无缝管理用户访问权限和数据安全。

Cloud Dataprep 价格

Cloud Dataprep 是一款交互式 Web 应用,让用户可通过与其数据样本交互来定义数据准备规则。使用该应用探索样本数据、定义转换步骤以及导出转换后的样本不会产生任何费用。如果要在完整数据集上执行流,则相应的流可以作为 Cloud Dataprep 作业(使用 Google Cloud Dataflow)执行。如需了解详情或查看完整的详细信息,请参阅我们的价格指南

资源

Google Cloud

开始

学习和构建

刚接触 GCP?您可以领取 $300 赠金,免费开始使用任意 GCP 产品。

需要更多帮助?

我们的专家会根据您的需求,帮您打造合适的解决方案,或帮您寻找合适的合作伙伴。

发送以下问题的反馈:

此网页
Cloud Dataprep by Trifacta