加载、转换和分析数据,以提供商业智能数据洞见。

探索 Google Cloud 中的数据分析和流水线

阅读有关数据分析和流水线产品、功能和流程的文档和 Cloud Architecture Center 文章。

将数据加载到 BigQuery:简介

了解如何将数据批量加载或流式传输到 BigQuery 中。

数据和分析资源

利用关于各种数据和分析主题的架构中心资源规划您的方法。(转到架构中心。)

数据分析设计模式

为实际数据分析解决方案规划设计模式。(转到架构中心。)

快速起步解决方案:分析湖仓一体

规划如何设计分析湖仓一体来存储、处理和激活数据。(转到架构中心。)

培训、博文等

转到培训课程、博文和其他相关资源。

数据分析师学习路径

学习对数据分析师角色至关重要的 Google Cloud 技术。(转到 Skills Boost 培训。)

“使用 Looker 的 BI 和分析”学习路线

学习如何在 Looker 中探索数据以及为您的用户设置自助分析。(转到 Skills Boost 培训。)

用于数据和分析工作负载的决策树

查看决策树,以选择用于运行数据和分析工作负载的服务。(转到 Google Cloud 博客。)

数据分析和流水线产品(按应用场景)

展开各个部分或使用过滤条件查找适用于典型使用场景的产品和指南。

数据分析和流水线平台和产品套件

利用机器学习和 AI 工具分析本地和外部数据,然后安全地共享并直观呈现数据洞见,而无需管理基础设施。

BigQuery

使用内置机器学习技术且扩缩能力极强的全托管式数据仓库来理解数据。

BigQuery 中的 BigLake

使用委托访问权限功能来查询外部数据存储区中的结构化数据。

BigQuery 存储

使用针对大型数据集运行分析查询以及高吞吐量流式注入和高吞吐量读取进行了优化的存储空间。

迁移到 BigQuery 简介

使用可在迁移的各个阶段(包括评估和规划、10 多种方言的 SQL 转换、数据传输和数据验证)为你提供帮助的各种免费工具将数据仓库迁移到 BigQuery。

数据分析

使用 SQL、地理空间分析以及支持临时和程序化分析与数据共享的 BI 工具来查询大型数据集。

Analytics Hub

一个数据交换平台,可让您在强大的安全和隐私框架内跨组织边界大规模共享数据和数据洞见。

BigQuery 分析

在对大型数据集运行分析查询时,最大限度地发挥数据分析投资的作用。

BigQuery ML

您可以使用 GoogleSQL 查询创建和运行机器学习 (ML) 模型,还可以使用 LLM 和 Cloud AI API 来执行人工智能 (AI) 任务,例如文本生成或机器翻译。

Dataproc

使用托管式 Apache Spark 和 Hadoop 服务执行批处理、查询和流式处理。

Earth Engine

Google Earth Engine 是一种地理空间处理服务。借助 Earth Engine,您可以利用 Google Cloud Platform 大规模执行地理空间处理。

Looker

访问、分析和处理最新的可信数据版本

Looker Studio

直观呈现数据,推动更明智的业务决策。

数据治理

在组织内外共享数据时,在数据的整个生命周期内控制和管理数据质量。

Data Catalog

利用可伸缩的全托管式数据发现和元数据管理服务,发现和理解您的数据。

Dataplex

将数据整理到数据湖和数据可用区中,并自动管理和治理这些数据,以支持大规模分析。

Sensitive Data Protection

发现并隐去敏感数据。

BigQuery 中的数据治理简介

实施并强制执行 BigQuery 数据治理政策。

数据注入

将数据迁移、流式传输以及批量加载到无服务器、高吞吐量的存储架构中。

Apache Kafka for BigQuery

一种托管式云服务,使您可以将 Kafka 数据流直接注入 Google Cloud。

BigQuery Data Transfer Service

按计划以托管方式将数据自动移至 BigQuery。您的分析团队无需编写任何代码,就可以为建立 BigQuery 数据仓库奠定基础。

Cloud Data Fusion

使用具有图形界面的全托管式无代码数据集成服务,快速构建和管理数据流水线。

Dataflow

开发实时进行批量数据处理和流式数据处理的流水线。

Dataproc

使用托管式 Apache Spark 和 Hadoop 服务执行批处理、查询和流式处理。

Dataproc Metastore

使用在 Google Cloud 上运行的全托管式 Apache Hive Metastore (HMS) 来管理数据湖和元数据,并在您使用的各种数据处理引擎和工具之间提供互操作性。

Dataproc Serverless

使用 Dataproc Serverless 运行 Spark 批处理工作负载,而无需预配和管理您自己的集群。

Datastream

这是一项无服务器且易于使用的变更数据捕获 (CDC) 和复制服务。

Pub/Sub

从任何位置、以任意规模提取事件流。

Storage Transfer Service

在 Cloud Storage 服务(例如 AWS S3 和 Cloud Storage)之间转移数据。

Transfer Appliance

使用机架式存储系统,将大量数据发送至 Google Cloud。

数据编排

通过跨数据源和流程的无缝连接,整理和优化工作负载管理链。

Cloud Composer

使用基于 Apache Airflow 构建的全托管式工作流编排服务,创建、调度、监控和管理工作流。

Dataform

Dataform 提供端到端体验,可帮助数据团队在 BigQuery 中对 SQL 工作流进行构建、版本控制和编排。

数据处理

利用强大的 ETL、SQL 工作流和 DML 工具转换数据。

Dataflow

开发实时进行批量数据处理和流式数据处理的流水线。

Dataproc

使用托管式 Apache Spark 和 Hadoop 服务执行批处理、查询和流式处理。

什么是 Vertex AI?

了解 Vertex AI 机器学习 (ML) 平台,该平台可用于训练和部署 ML 模型和 AI 应用,以及自定义大语言模型 (LLM),以在依托 AI 技术的应用中使用。

区块链分析

获取通过 BigQuery 提供的索引区块链数据,以便通过 SQL 轻松进行分析。

Dataprep by Trifacta

探索、清理和准备数据,以备分析之用。 (转到外部网站。)