什么是图数据库？

基于图的 NoSQL 数据库（通常称为图数据库或 GDB）将数据组织为节点和边，旨在表示和查询数据点之间的关系。

与使用结构化表的传统关系型数据库不同，图数据库以一种能够捕获数据点之间关系的方式来组织数据。这种结构与现实世界中的某些网络类似，例如社交网络中的人员、供应链中的产品，或金融欺诈网络中的交易，从而使图数据库在辅助分析关联方面尤为强大。当然，并非所有数据都呈现这种形式，但当关系处于核心地位时，图数据库能让分析并发现有意义的关联变得更加容易。

5:40

Spanner：持续在线、规模近乎无限的数据库

要点总结

图数据库是一类 NoSQL 数据库，专为对关系进行建模和查询而构建，利用节点和边的图结构来表示实体及其关联。下面简要介绍其关键特性和优势：

关系查询：与依赖表和 JOIN 操作的关系型数据库不同，图数据库侧重于以关系为核心的查询，使其在探索关联数据时非常高效
灵活性：其灵活的架构以及与图算法的兼容性，使您能够发现模式、优化网络，并从复杂的数据集中获得更深入的分析洞见
应用场景多样：常见应用场景包括支持社交媒体图谱、通过异常连接检测欺诈，以及优化物流或路线规划

什么是图？

图是一种对实体间关系进行建模的数据模型。它有两个关键组成部分：

节点：代表人物、商品、地点或事件等实体。这些即是您的数据。
边：代表节点之间的关系，例如社交平台上的好友关系、买家与所购商品之间的关联，或供应链链路。边还可以包含时间戳或权重等属性，从而为关系增添上下文。

图数据库的工作原理

不妨将图数据库想象成一个大型连点成线游戏。它将您的信息存储为一个个独立的点（节点），并利用线（边）直接展示并存储这些点之间的关联方式。

图数据库具备极高的灵活性，能够表示多种连接形态，涵盖层级结构（如家谱或组织结构图）、集群网络（如电子商务产品推荐），以及对社交网络中具有影响力的节点的识别。

专用算法可通过以下方式增强图数据提供的分析洞见：

最短路径：优化导航和物流路线
社区发现：寻找那些与网络其余部分相比，彼此间关联更为紧密的节点群组，这有助于社交媒体细分或欺诈检测
网页排名：根据指向节点的链接数量和质量计算其重要性

借助此类算法，图数据库有助于将复杂的关系转化为可操作的策略。

图数据库与关系型数据库

关系型数据库将数据整理成结构化表，而图数据库则侧重于关系。以下是一些关键区别：

特性	关系型数据库	图形数据库
数据结构	使用具有预定义属性的严格架构中的行和列。添加新关系需要重构。	将数据建模为节点和边，从而支持无需预定义架构的灵活关系。
查询效率	依赖 JOIN 操作来联接表，随着关系数量的增加，会导致速度变慢且复杂度增加。	直接遍历边，从而使以关系为核心的查询变得更快、更直观。
查询语言	结构化查询语言 (SQL) 及其衍生语言。	Graph Query Language (GQL)、Cypher 和 Gremlin。
使用场景	在金融系统或库存管理等结构化、可预测的环境中表现出色。	非常适合社交网络、欺诈检测或路线优化等关系处于核心地位的应用。

特性

关系型数据库

图形数据库

数据结构

使用具有预定义属性的严格架构中的行和列。添加新关系需要重构。

将数据建模为节点和边，从而支持无需预定义架构的灵活关系。

查询效率

依赖 JOIN 操作来联接表，随着关系数量的增加，会导致速度变慢且复杂度增加。

直接遍历边，从而使以关系为核心的查询变得更快、更直观。

查询语言

结构化查询语言 (SQL) 及其衍生语言。

Graph Query Language (GQL)、Cypher 和 Gremlin。

使用场景

在金融系统或库存管理等结构化、可预测的环境中表现出色。

非常适合社交网络、欺诈检测或路线优化等关系处于核心地位的应用。

图数据库的关键应用场景

对于理解数据点之间的关系十分关键的应用，图数据库通常表现出色。以下是一些典型的应用场景：

图数据库驱动着好友推荐、影响力人物识别和社区发现等功能。通过分析社交图谱以及用户、帖子和互动之间的关联，平台能够提供个性化体验并挖掘关键洞见。

欺诈检测

在金融和电子商务领域，图数据库可以通过映射交易、账号和设备来帮助检测欺诈模式。它们擅长揭示隐蔽关联，例如共享 IP 地址或信用卡详细信息的账号。当一个节点与已知的欺诈节点存在高度关联时，就会引起怀疑。

路线优化

运输和物流公司依靠图数据库来优化配送路线。通过分析节点（地点）和边（路线），他们可以最大限度地缩短行程时间、降低成本并提高效率。

产品推荐引擎

对于电子商务零售商而言，图数据库通过将用户与其互动过（购买、浏览、评分）的商品相关联，并基于这些互动在用户与其他相似的商品或用户之间建立关联，从而增强个性化推荐。

主要图数据库比较

市面上有多家图数据库供应商，其产品具备不同的特性，能够满足特定图应用场景的需求。

除了专用图数据库供应商外，市面上还有一些针对传统数据库定制的图扩展程序。例如，Spanner Graph 是 Google Cloud 的一款图数据库产品，它是基于全球级规模的 Spanner 关系型数据库构建而成的。它结合了强一致性、横向扩缩能力以及多区域部署能力。

Neo4j

Neo4j 是一款在 Google Cloud 上提供的专用图数据库，能够为最短路径计算和社区发现等复杂查询提供高性能。它采用针对图优化的查询语言，适合直观呈现关系，以获得可据此采取行动的数据洞见。

AWS Neptune

AWS Neptune 是 Amazon Web Services 提供的一项图数据库服务。它支持属性图和 RDF 图等主流图模型。

Enterprise Knowledge Graph

企业知识图谱 (EKG) 本身不是数据库，而是 Google Cloud 提供的一项解决方案，它利用图原理来整合、标准化和协调来自各种来源的零散企业数据。它有助于构建统一且语义丰富的组织知识图模型，进而用于驱动高级 AI 应用和上下文搜索，并提供对客户或产品等实体的完整 360 度全景视图。

Spanner Graph

Google Cloud 的 Spanner 数据库通过 Spanner Graph 融合了关系型数据库与图数据库的能力，在提供全球一致性和横向扩缩能力的同时，支持在统一环境中灵活管理图数据与关系型数据，这使其成为多样化大规模部署的理想选择。

您可以根据自身需求采用不同类型的图数据库。Neo4j 或 AWS Neptune 等专用解决方案专注于图原生操作，而 Spanner Graph 等多模型数据库则在同一系统中融合了关系模型与图模型，可灵活满足多样化的数据要求。

开始免费试用 Google Cloud Spanner

关于图数据库的常见问题解答

在图数据库中，“节点”和“边”指什么？

节点表示个人、商品或地点等单个实体。边是指这些节点之间的关联或关系，例如好友关系、购买行为，或两个地点之间的路线。

为何我要选择图数据库而非关系型数据库？

如果数据间的关系与数据本身同等重要，使用图数据库将大有裨益。对于社交网络、推荐引擎和欺诈检测等需要分析复杂关联的应用场景，图数据库不仅速度显著更快，而且更加直观。

我需要同时使用关系型数据库和图数据库吗？

对于许多现代应用，您可能需要同时使用这两种数据库。将关系型数据库（如 PostgreSQL 或 MySQL）视为数据架构的坚实基础。它在存储业务的核心事实（比如您的客户、产品和交易）方面非常可靠，并具备强大的数据完整性。

如果您还需要理解这些事实之间复杂多变的关系，图数据库便能派上用场。它旨在回答关系型数据库难以处理的关联类问题，例如“哪些客户受到了此次营销活动的影响？”

这两类数据库可以形成强大的组合。关系型数据库存储“是什么”（客户、产品），而图数据库则探索“如何”（该客户如何与其他客户及产品相关联）。

利用 Google Cloud 解决业务难题

新客户可获得 $300 赠金，用于抵扣 Google Cloud 的费用。

图表数据库的优势

图数据库专为处理高度关联的数据而设计，其具备的优势使其成为以关系为核心的应用中不可或缺的组件。以下是一些关键优势：

更快地查询关联数据

图数据库通过直接遍历边，而非依赖开销巨大的 JOIN 操作，为关系密集型查询（例如发现最短路径或检测集群）提供了更快、更高效的性能。

具备可伸缩性，可满足不断增长的网络需求

图数据库可以无缝处理不断演变的大型数据集，非常适合社交媒体、金融和电信等数据模型动态变化的行业。

数据结构灵活

得益于无架构设计，图数据库能够便捷地添加或更改节点和边，而无需进行大规模重组。这种灵活性使其能够适应数据关系性质频繁变化的场景。

专业分析和数据洞见

图表数据库支持高级算法（例如社区检测和链接分析算法），可从复杂关系中提取富有实用价值的分析洞见。这些功能非常有价值，可用于发现隐藏的模式和做出数据驱动的决策。

直观进行关系建模

图表数据库使用节点和边缘来反映现实世界中的关系，从而更轻松地表示和分析复杂网络，例如社交互动、供应链或推荐系统。

增强上下文感知能力

图表数据库不仅存储数据，还存储关系的含义和类型，因此系统（尤其是在 AI 领域的系统）可以更深入地理解数据，这对于准确进行上下文搜索和以可验证的事实来为 AI 模型建立依据等任务至关重要。

更进一步

获享 $300 赠金以及 20 多种提供“始终免费”用量的产品，开始在 Google Cloud 上构建项目。

不知从何入手，需要一点帮助？
与销售人员联系
与值得信赖的合作伙伴携手
寻找合作伙伴
继续浏览
查看所有产品