使用路径

本页面介绍了如何在 Spanner Graph 中处理图路径。

在图数据库中，图路径数据类型表示与边交织的节点序列，并显示这些节点和边的关系。如需详细了解路径数据类型，请参阅图路径类型。

借助 Spanner Graph Language (GQL)，您可以构建图表路径并对其执行查询。本文档中的示例使用与设置和查询 Spanner Graph 页面上相同的 Spanner Graph 架构。

构建图表路径

您可以在图模式中创建路径变量，也可以使用 PATH 函数来构建图路径。

我们建议使用路径变量来构建图表路径。创建路径变量的格式如下：

MATCH p = PATH_PATTERN

如需了解详情，请参阅图表模式。

示例

在以下示例中，查询会查找 FinGraph 内的账号之间资金转移模式。

GRAPH FinGraph
MATCH p = (src:Account {id: 16})-[t:Transfers]->{2}(dst:Account {id: 7})
RETURN TO_JSON(p) AS full_path;

结果

full_path
[{"identifier": ..., "properties": {"id": 16, ...}, ...}, {"identifier": ..., "properties": {"amount": 300.0, ...}, ...}, ...]

结果表明，查询在数据库中找到了 Account -> Transfers -> Account 模式。

查询图表路径

您可以使用以下特定于路径的函数来查询图路径。如需详细了解 Spanner Graph 查询，请参阅查询概览。

`EDGES`

EDGES 函数会返回图路径中的所有边。如需了解详细语义，请参阅 EDGES。

示例

此查询用于查找两个账号之间经过中间账号的路径。它会返回路径中第二个 Transfers 边的量，该边可能位于 src 和 mid 之间，也可能位于 mid 和 dst 之间。

GRAPH FinGraph
MATCH p = (src:Account {id: 7})-[t1:Transfers]->{1,3}(mid:Account)-[t2:Transfers]->
  {1,3}(dst:Account {id: 16})
LET second_edge = EDGES(p)[1]
RETURN DISTINCT src.id AS src, dst.id AS dst, second_edge.amount AS second_edge_amount;

结果

src	dst	second_edge_amount
7	16	300

`NODES`

NODES 函数会返回图路径中的所有节点。如需了解详细语义，请参阅 NODES。

示例

此查询会查找两次转账的图路径，然后返回表示该路径的 JSON 列表。

GRAPH FinGraph
MATCH p = (src:Account)-[t:Transfers]->{2}(dst:Account)
RETURN TO_JSON(NODES(p)) AS nodes;

结果

节点
[{"identifier": "...", "properties": {"id": 16}, ...}, {"identifier": "...", "properties": {"id": 20, ...}, ...]
…

`PATH_FIRST`

PATH_FIRST 函数用于查找图路径中的第一个节点。如需了解详细语义，请参阅 PATH_FIRST。

示例

此查询用于查找包含两次转移的图路径中的第一个节点。它会返回 Account 节点的标签和账号的昵称。

GRAPH FinGraph
MATCH p = -[:Transfers]->{1,3}(dst:Account{id: 7})
RETURN DISTINCT PATH_FIRST(p).id AS can_reach_target;

结果

can_reach_target
7
16
20

`PATH_LAST`

PATH_LAST 函数用于查找图路径中的最后一个节点。如需了解详细语义，请参阅 PATH_LAST。

示例

此查询用于查找包含两次转移的图路径中的最后一个节点。它会返回 Account 节点的标签和账号的昵称。

GRAPH FinGraph
MATCH p =(start:Account{id: 7})-[:Transfers]->{1,3}
RETURN DISTINCT PATH_LAST(p).id as can_reach_target;

结果

can_reach_target
7
16
20

`PATH_LENGTH`

PATH_LENGTH 函数用于查找图路径中的边数。如需了解详细语义，请参阅 PATH_LENGTH。

示例

此查询用于查找包含 1 到 3 次换乘的图路径中的边数。

GRAPH FinGraph
MATCH p = (src:Account)-[e:Transfers]->{1,3}(dst:Account)
RETURN PATH_LENGTH(p) AS num_transfers, COUNT(*) AS num_paths;

结果

num_transfers	num_paths
1	5
2	7
3	11

`IS_ACYCLIC`

IS_ACYCLIC 函数用于检查图路径是否包含重复节点。如果找到重复项，则返回 TRUE；否则返回 FALSE。如需了解详细语义，请参阅 IS_ACYCLIC。

示例

此查询用于检查相应图路径是否包含重复节点。

GRAPH FinGraph
MATCH p = (src:Account)-[t:Transfers]->{2}(dst:Account)
RETURN IS_ACYCLIC(p) AS is_acyclic_path,
       ARRAY_TRANSFORM(NODES(p), n->n.id) AS account_ids;

结果

is_acyclic_path	account_ids
TRUE	16,20,7
TRUE	20,7,16
TRUE	20,7,16
FALSE	16,20,16
TRUE	7,16,20
TRUE	7,16,20
FALSE	20,16,20

`IS_TRAIL`

IS_TRAIL 函数用于检查图路径是否具有重复的边。如果找到重复项，则返回 TRUE；否则返回 FALSE。如需了解详细语义，请参阅 IS_TRAIL。

示例

此查询用于检查相应图路径是否具有重复的边。

GRAPH FinGraph
MATCH p = (src:Account)-[t:Transfers]->{3}(dst:Account)
WHERE src.id < dst.id
RETURN IS_TRAIL(p) AS is_trail_path,
       ARRAY_TRANSFORM(t, t->t.id) AS transfer_ids

结果

is_trail_path	transfer_ids
FALSE	16,20,16
TRUE	7,16,20
TRUE	7,16,20

路径模式

在 Spanner Graph 中，默认行为是返回所有路径，包括具有重复节点和边的路径。您可以使用以下路径模式来包含或排除具有重复节点和边的路径。如需了解详细的语义，请参阅路径模式文档。

`WALK`

WALK 路径模式会返回所有路径，包括包含重复节点和边的路径。WALK 是默认的路径模式。

示例

以下查询演示了如何在量化路径模式中使用 WALK 路径模式。结果中的第一个路径具有重复的边。

GRAPH FinGraph
MATCH p = WALK (src:Account)-[t:Transfers]->{3}(dst:Account)
WHERE src.id < dst.id
RETURN ARRAY_TRANSFORM(t, t->t.id) AS transfer_ids

结果

transfer_ids
16,20,16
7,16,20
7,16,20

`ACYCLIC`

ACYCLIC 路径模式会过滤掉具有重复节点的路径。

示例

以下查询演示了如何在量化路径模式中使用 ACYCLIC 路径模式。具有相同 src 和 dst 节点的路径会被过滤掉。

GRAPH FinGraph
MATCH p = ACYCLIC (src:Account)-[t:Transfers]->{2}(dst:Account)
RETURN ARRAY_TRANSFORM(NODES(p), n->n.id) AS account_ids

结果

account_ids
16,20,7
20,7,16
20,7,16
7,16,20
7,16,20

`TRAIL`

TRAIL 路径模式会过滤掉具有重复边的路径。

示例

以下查询演示了如何在量化路径模式中使用 TRAIL 路径模式。系统会过滤掉具有重复边的路径。

GRAPH FinGraph
MATCH p = TRAIL (src:Account)-[t:Transfers]->{3}(dst:Account)
WHERE src.id < dst.id
RETURN ARRAY_TRANSFORM(t, t->t.id) AS transfer_ids

结果

transfer_ids
7,16,20
7,16,20

路径搜索前缀

您可以使用路径搜索前缀来限制路径模式，以返回每个数据分区的最短路径。如需了解详细语义，请参阅路径搜索前缀。

`ANY SHORTEST`

ANY SHORTEST 路径搜索前缀会返回与每个数据分区中的模式匹配的最短路径（边数最少的路径）。如果每个分区有多个最短路径，则返回其中任意一个。

示例

以下查询会匹配每对 [a, b] 之间的任何路径。

GRAPH FinGraph
MATCH p = ANY SHORTEST (a:Account {is_blocked:true})-[t:Transfers]->{1,4}(b:Account)
LET total_amount = SUM(t.amount)
RETURN a.id AS account1_id, total_amount, b.id AS account2_id;

结果

account1_id	total_amount	account2_id
16	500	16
16	800	7
16	300	20

转换规则

如需了解详情，请参阅 GRAPH_PATH 转换规则。

应用场景示例

在以下用例示例中，您将找到从账号 ID 20 开始，通过 1 到 3 个账号进行路由的所有账号。

GRAPH FinGraph
MATCH p = (start:Account {id: 20})-[:Transfers]->{1,3}(dst:Account)
RETURN DISTINCT dst.id AS dst;

结果

dst
7
16
20

不过，返回账号 ID 20 的查询可能过于宽泛，因为它以账号 ID 20 开头。如需显示更具体的结果，您可以强制查询仅显示不含任何重复节点的无环图路径。为此，您可以：

使用 MATCH p = ACYCLIC <path_pattern>；或者
在查询中应用 IS_ACYCLIC(p) 过滤条件

以下查询使用 MATCH p = ACYCLIC PATH_PATTERN：

GRAPH FinGraph
MATCH p = ACYCLIC (start:Account {id: 20})-[:Transfers]->{1,3}(dst:Account)
RETURN DISTINCT dst.id AS dst;

结果

dst
7
16

如果您想知道资金首次转移所经过的账号，可以运行以下查询：

GRAPH FinGraph
MATCH p = ACYCLIC (start:Account {id: 20})(-[:Transfers]->
  (nexts:Account)){1,3}(dst:Account)
RETURN dst.id AS dst, ARRAY_AGG(DISTINCT nexts[0].id) AS unique_starts;

此查询之所以非常规，是因为它在量化路径内引入了一个新变量，并使用 nexts 来获取结果。使用路径变量，您可以简化查询：

GRAPH FinGraph
MATCH p = ACYCLIC (start:Account {id: 20})-[:Transfers]->{1,3}(dst:Account)
RETURN dst.id AS dst, ARRAY_AGG(DISTINCT NODES(p)[OFFSET(1)].id) AS unique_starts;

使用 NODES(p) 会返回路径中的所有节点。由于第一个节点账号指定为 start，因此下一个节点账号（位于第一个偏移量）是资金转移所经过的第一个账号。

结果

dst	unique_starts
7	16, 7

当存在多个量化路径时，路径会更有用。您可以添加一项限制，规定从 start 找到的路径必须经过账号 ID 7：

GRAPH FinGraph
MATCH p = ACYCLIC (start:Account {id: 20})-[:Transfers]->
  {1,3}(mid:Account {id: 7})-[:Transfers]->{1,3}(dst:Account)
RETURN dst.id AS dst,
  ARRAY_AGG(DISTINCT NODES(p)[OFFSET(1)].id) AS unique_starts;

虽然 MATCH 语句发生了变化，但查询的其余部分无需更改。如果不使用路径变量，在某些情况下，Spanner 无法静态地知道要检查哪个量化路径。

使用路径变量，您可以获取所有转移的总和：

GRAPH FinGraph
MATCH p = ACYCLIC (start:Account {id: 20})-[:Transfers]->
  {1,3}(mid:Account {id: 7})-[:Transfers]->{1,3}(dst:Account)
LET all_transfers = EDGES(p)
LET transfer_amounts = SUM(all_transfers.amount)
RETURN dst.id AS dst,
  ARRAY_AGG(DISTINCT NODES(p)[OFFSET(1)].id) AS participating_neighbor_nodes, transfer_amounts;

结果

dst	participating_neighbor_nodes	transfer_amounts
16	7	600
16	7	800

使用路径

构建图表路径

示例

结果

查询图表路径

EDGES

示例

结果

NODES

示例

结果

PATH_FIRST

示例

结果

PATH_LAST

示例

结果

PATH_LENGTH

示例

结果

IS_ACYCLIC

示例

结果

IS_TRAIL

示例

结果