使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

参加 4 月 6 日的 Google 数据云峰会,了解分析、AI、商业智能和数据库方面的最新创新成果。

数据集

借助由 BigQueryCloud StorageEarth Engine 和其他 Google Cloud 服务提供支持的预构建数据解决方案和宝贵数据集、增强您的分析和 AI 计划。

拓展数据生态系统

使用外部数据增强分析或 AI 计划时,可以增加数据资产的价值。发现并访问来自 Google、公共或商业提供商的独特且有价值的数据集和预构建的解决方案。借助全代管式数据流水线,您可以持续专注于最重要的工作:提供数据洞见和业务价值。

详细了解我们的公共数据集

类别 精选数据集 示例查询、使用场景和解决方案
Google 数据集

使用此数据集查看过去 30 天内 Google 趋势中最热门的 25 个查询和搜索量上升最快的 25 个查询。每个字词都包括美国 210 个特定媒体市场区域 (DMA) 的 5 年历史数据。

 • 我的新闻/电台广播区域中的听众最关注什么?

 • 根据最新可用数据,美国最热门的搜索字词是什么?

 • 该区域中用户搜索的最热门零售商品是什么?

社区人员流动情况报告

该数据集旨在深入了解为应对旨在对抗 COVID-19 的政策而发生的变化。它按地理区域报告了一段时间内不同类别场所的移动趋势,例如零售和娱乐场所、杂货店和药房、公园、中转站、工作场所和住宅。

 • 旧金山的就地避难令对零售访问量有何影响?

 • 使用场景:确定周末零售流量的差异

Google Analytics(分析)示例

该数据集提供了来自 Google Merchandise Store 的 12 个月(2016 年 8 月至 2017 年 8 月)的模糊 Google Analytics 360 数据,Google Merchandise Store 是一家销售 Google 品牌商品的真实电子商务商店。该数据是电子商务网站将看到的典型数据,包括流量源数据、内容数据和交易数据。

Google 专利研究

Google 专利研究数据包含 Google 专利 (patents.google.com) 中使用的大部分数据分析工作的输出,包括来自 Google 翻译的标题和摘要的机器翻译、嵌入向量、提取的热门术语、类似文档和前向参考。

 • 最近申请的 20 项专利是什么?

 • 2017 年到 2019 年期间,哪些《财富》500 强公司申请了专利?

公共数据集
强风暴事件详情

风暴事件数据库是一个综合数据库,涵盖了美国从 1950 年到今年的恶劣天气事件,其中包含有关风暴事件的位置、方位角、距离、影响和严重程度的信息,包括财产和农作物的损失成本。

人口普查局美国边界

这些是全分辨率边界文件,源自 TIGER/Line Shapefiles,这是美国人口普查局完全支持的核心地理产品。其中包括 50 个州、哥伦比亚特区、波多黎各和离岛地区的信息。

 • 美国哪些城市在其市区 10 英里范围内拥有最多的公共机场?

 • 使用场景:为零售商开发城市化索引

美国社区调查

美国社区调查 (ACS) 是一项持续进行的调查,通过联系全国超过 350 万个家庭,每年提供有关我们国家及其人民的重要信息。由此产生的数据提供了在美国各个地理级别汇总的极其详细的人口统计信息。

 • 租金占收入中位数的比例如何逐年变化?  

 • 使用场景:人口增长趋势作为设施/地点选择分析的输入

所有公共数据集

搜索并访问 Google Cloud Marketplace 中列出的 200 多个数据集。

 • 哪些数据集可以帮助为我们的分析或 AI 工作流程提供更深层次的上下文?

商业数据集
Crux Informatics

Crux Deliver 是一项用于数据工程和运营的代管式服务。Crux 代表其客户连接所有传统和替代数据提供商,并管理入职、数据工程和运营的所有方面。每个数据集都经过验证,因此我们只提供干净且可操作的数据。

 • Crux 可以帮助我加入我的数据生态系统的数据集有哪些?

HouseCanary

即时访问 1 亿套房屋的可靠财产、贷款和估价信息。机器学习算法处理数百个数据源,为 381 个地铁、18,300 个邮政编码和 400 万个街区提供房屋价格指数,覆盖美国住宅市场的 95% 以上。根据 40 年历史波动率信息和 3 年预测做出投资决策。

 • 预计明年哪些邮政编码的房价将上涨 3% 或更多?

 • 特定财产的价值是多少?

Earth Engine 数据集
Earth Engine

Earth Engine 的公共数据档案包括四十多年的历史图像和科学数据集,每天更新并可用于在线分析。

 • 过去 30 年地表温度的变化情况如何?

 • 2000 年之前这个区域是什么样的?

Kaggle 数据集
Kaggle 数据集

在 Kaggle 中,您可以找到完成数据科学工作需要的所有代码和数据。使用超过 8 万个公共数据集和 40 万个公共笔记本来快速执行任何分析。

 • 您能解决数据科学中一些最令人烦恼和挑衅的问题吗?

合成数据集
Cymbal Investments

合成数据代表由虚构的 Cymbal Investments 集团运营的自动交易机器人的交易,每个机器人都使用单一算法来指导其交易决策。这些记录源自加载到 BigQuery 中的 FIX 协议(4.4 版)交易捕获报告

 • 贸易商从每笔交易中获得了多少收入?

研究数据集

Google 的数据集搜索计划已索引了来自网络的近 2500 万个数据集,让您可以在一个地方搜索数据集并查找数据所在位置的链接。按新近度、格式、主题等过滤。

 • <您感兴趣的关键字> 包含哪些数据集?

 • 去年哪些可持续数据集可免费商用?

类别

感觉备受启发?让我们协力解决您面临的挑战。

了解 Google Cloud 数据集如何利用数据和预构建的解决方案改变您的业务运营方式。
与销售人员联系
如果您希望看到已参与的公共数据集,请联系 public-data-help@google.com。

借助 BigQuery 沙盒,您可以在没有结算帐号或信用卡的情况下尝试完整的 BigQuery 体验。

数据合作伙伴和客户案例

从数据集生态系统的双方了解更多信息:数据提供者和数据消费者。