Netezza 到 BigQuery 迁移指南

本文档为从 Netezza 迁移到 BigQuery 的组织提供了简要指导,其中介绍了一些方法,供组织重新考虑其现有的数据模型以及提取、转换和加载 (ETL) 流程,以便充分利用 BigQuery。

简介

数十年来,大型组织依赖于 Netezza 等系统来帮助存储和分析大量数据。虽然这些系统功能强大,但它们在硬件、维护和许可方面需要进行大量投资。此外,随着数据源数量和数据量的增加,组织面临着节点管理、每个来源的数据量、归档费用和系统整体可扩缩性等挑战。

因此,越来越多的组织评估 BigQuery 来满足其基于云的企业数据仓库的需求。BigQuery 是 Google 为数据分析提供的全代管式 PB 级无服务器企业数据仓库 (EDW)。您没有需要管理的基础架构,也不需要数据库管理员。您可以专心分析数据,使用熟悉的 SQL 发掘有意义的数据洞见。

BigQuery 可在几十秒内扫描数十亿行,而不使用索引。BigQuery 是一种基于云的大规模并行查询服务(该服务共享 Google 的基础架构),因此可以并行处理每个查询,并在数以万计的服务器上同时运行查询。BigQuery 有别于其他产品的两项核心技术是列式存储和树形架构:

  • 列式存储:数据按列(而不是按行)存储,从而实现极高的压缩率和扫描吞吐量。
  • 树形架构:系统在几秒钟内通过数以千计的机器调度查询并汇总结果。

如需详细了解 BigQuery 的技术架构,请参阅 Google BigQuery 揭秘

如需阅读完整文档,请点击以下按钮:

下载 PDF