Visão geral do esquema do Spanner Graph

Este documento descreve o esquema do Spanner Graph e fornece exemplos para ilustrar os principais conceitos. Para saber mais sobre o Spanner Graph, consulte a visão geral do Spanner Graph.

Modelo de dados do gráfico de propriedades

Um gráfico de propriedades permite modelar dados conectados. Ele representa informações como uma rede de nós e arestas. Os nós simbolizam entidades no cenário de dados, como clientes, produtos ou locais. As arestas mostram as conexões entre esses nós, capturando relações como "adquirido", "segue" ou "localizado em".

Os nós e as arestas podem incluir as seguintes informações:

  • Rótulos, que classificam nós e arestas em conjuntos, por exemplo, Cidade.
  • Propriedades, que são pares de chave-valor, por exemplo, população.

O exemplo na Figura 1 mostra como projetar um gráfico para modelar atividades financeiras. Esse gráfico inclui os seguintes tipos de entidades modeladas como nós:

  • Pessoa:representa um indivíduo envolvido em transações financeiras.
  • Conta:representa uma conta bancária usada para transações.

Essas entidades são conectadas por diferentes tipos de relacionamentos, que são representados pelos seguintes arestas dirigidas:

  • Possui:uma pessoa tem uma ou mais contas.
  • Transferências:o dinheiro é transferido de uma conta para outra.

Cada aresta dirigida indica uma relação unidirecional, que flui de um nó de origem para um nó de destino. Por exemplo, uma aresta Transfers conecta uma origem Account a um destino Account, indicando o fluxo de dinheiro.

Diagrama de visão geral do esquema do Spanner Graph.

Figura 1. Exemplo de gráfico com vários nós e bordas dirigidas.

Os nós e as arestas podem conter outras informações nas propriedades. Cada propriedade tem um nome e um valor.

  • Os nós Pessoa têm as seguintes propriedades:
    • name (STRING)
    • id (INT64)
  • As transferências têm a seguinte propriedade:
    • amount (FLOAT64)

Arestas dirigidas e não dirigidas

O exemplo de gráfico usa arestas direcionadas, que indicam uma direção específica na relação entre entidades. No entanto, alguns relacionamentos, como o de amigo em uma rede social, são não direcionados e representam uma conexão recíproca sem uma origem ou um endpoint distintos. Nesse caso, você pode modelar arestas não direcionadas como duas arestas direcionadas, uma em cada direção.

Design de esquema do Spanner Graph

O Spanner Graph permite criar um gráfico usando tabelas com a instrução CREATE PROPERTY GRAPH. As tabelas usadas para criar gráficos são chamadas de tabelas de entrada. Essa abordagem é baseada em SQL/PGQ (Property Graph Queries), que faz parte dos padrões SQL:2023.

Como definir um nó em um gráfico de property

Para definir um nó, adicione uma definição de nó na cláusula NODE TABLES. A forma mais simples de definição de nó contém apenas um nome de tabela de entrada. As linhas da tabela de entrada são mapeadas para nós do gráfico.

No exemplo abaixo, você usa a cláusula NODE TABLES para definir o nó Account no gráfico de propriedades FinGraph. A definição do nó contém a tabela de entrada Account.

-- First, create an Account table.
CREATE TABLE Account (
  id           INT64 NOT NULL,
  create_time  TIMESTAMP,
) PRIMARY KEY (id);

-- Next, use the Account table as input table of Account node definition.
CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    Account
  );

Rótulo e propriedades padrão

Por padrão, todos os nós usam o nome da tabela de entrada como rótulo, e todas as colunas da tabela de entrada são expostas como propriedades de nó.

No exemplo anterior,

  • Cada nó de conta tem o rótulo Account.
  • Cada nó de conta tem propriedades [id, create_time] criadas com base nas colunas da tabela Account.

Chave do elemento

Uma definição de nó também define a chave de elemento, que identifica de forma exclusiva um nó do gráfico.

  • Por padrão, a chave do elemento é a chave primária da tabela de entrada.
  • As chaves de elemento podem ser definidas explicitamente pela cláusula KEY.
  • Colunas com restrições de unicidade UNIQUE INDEX podem ser usadas como chaves de elementos.

O exemplo a seguir define os nós Account e Person.

  • O nó Account usa a chave primária da tabela Account como chave de elemento por padrão.
  • O nó Person, por outro lado, especifica explicitamente o id como a chave do elemento com a cláusula KEY.
CREATE TABLE Person (
  id           INT64 NOT NULL,
  name         STRING(MAX),
) PRIMARY KEY (id);

CREATE TABLE Account (
  id           INT64 NOT NULL,
  create_time  TIMESTAMP,
) PRIMARY KEY (id);

CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    Person KEY (id),
    Account
  );

Como associar uma linha na tabela de entrada a um nó no gráfico

  • Cada linha com uma chave de elemento não nula é associada a um nó exclusivo no gráfico, identificado pela chave de elemento.
  • As linhas com uma chave de elemento nula são ignoradas.

Como definir uma aresta em um gráfico de property

Para definir uma aresta, adicione uma definição de aresta à cláusula EDGE TABLES. A forma mais simples de definição de aresta contém apenas um nome de tabela de entrada. As linhas da tabela de entrada são mapeadas para as arestas do gráfico.

Referência do nó de origem e destino

No exemplo a seguir, você cria um gráfico de propriedades FinGraph com o seguinte:

  • Nós Person e Account
  • Borda PersonOwnAccount
CREATE TABLE Person (
 id            INT64 NOT NULL,
 name          STRING(MAX),
) PRIMARY KEY (id);

CREATE TABLE Account (
 id            INT64 NOT NULL,
 create_time   TIMESTAMP,
) PRIMARY KEY (id);

CREATE TABLE PersonOwnAccount (
 id            INT64 NOT NULL,
 account_id    INT64 NOT NULL,
 create_time   TIMESTAMP,
 FOREIGN KEY (account_id) REFERENCES Account (id)
) PRIMARY KEY (id, account_id),
  INTERLEAVE IN PARENT Person;

CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    Person,
    Account
  )
  EDGE TABLES (
    PersonOwnAccount
      SOURCE KEY (id) REFERENCES Person (id)
      DESTINATION KEY (account_id) REFERENCES Account (id)
  );

Uma definição de borda precisa definir a referência do nó de origem e destino usando as cláusulas SOURCE KEY, DESTINATION KEY e REFERENCES. O exemplo a seguir usa a definição de borda de PersonOwnAccount para ilustrar esse conceito:

EDGE TABLES (
  PersonOwnAccount
    SOURCE KEY (id) REFERENCES Person (id)
    DESTINATION KEY (account_id) REFERENCES Account (id)
)

Cada borda PersonOwnAccount conecta um Person (origem) a um nó Account (destino).

  • O nó de origem de uma aresta é um nó Person cujo id é igual ao id da aresta.
  • O nó de destino de uma aresta é um nó Account cujo id é igual ao account_id da aresta.

Além disso, o seguinte é verdadeiro para a borda PersonOwnAccount:

  • A chave do elemento é a chave primária da tabela PersonOwnAccount, ou seja, (id, account_id).
  • Cada borda tem o mesmo conjunto de propriedades das colunas da tabela PersonOwnAccount.
  • Cada aresta tem o rótulo PersonOwnAccount padrão.

Como associar uma linha em uma tabela de entrada de arestas a arestas no gráfico

  • Cada linha na tabela de entrada de aresta, cuja chave de elemento não é nula, geralmente é associada a uma aresta exclusiva no gráfico.
  • Uma linha pode corresponder a zero ou mais arestas no gráfico, por exemplo, quando a referência do nó de origem corresponde a zero ou mais nós na tabela de nós de origem.
  • A mesma tabela de entrada pode ser usada em diferentes definições de nó ou aresta para criar diferentes conjuntos de nós ou arestas. Para mais informações, consulte Mesclar tabelas de entrada de arestas e nós.

Personalizar rótulos e propriedades

Use as cláusulas LABEL e PROPERTIES para personalizar rótulos e propriedades.

No exemplo abaixo, há dois nós definidos, Person e Account.

  • Os nós Person expõem a propriedade address pelo rótulo Customer. A propriedade address é definida pela expressão CONCAT(city, ", ", country),, que se refere à coluna city e country da tabela de entrada Person.
  • Para Account, o nó Account expõe as propriedades id e create_time pelo rótulo Account.
  • Person e Account têm o rótulo Entity com as propriedades [id, name].
    • Para Person, as propriedades id e name vêm das colunas da tabela de entrada.
    • Para Account, a propriedade name se refere à coluna nick_name da tabela de entrada.
CREATE TABLE Person (
 id               INT64 NOT NULL,
 name             STRING(MAX),
 birthday         TIMESTAMP,
 country          STRING(MAX),
 city             STRING(MAX),
) PRIMARY KEY (id);

CREATE TABLE Account (
 id               INT64 NOT NULL,
 create_time      TIMESTAMP,
 is_blocked       BOOL,
 nick_name        STRING(MAX),
) PRIMARY KEY (id);

CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    Person KEY (id)
      LABEL Customer
        PROPERTIES (CONCAT(city, ", ", country) AS address)
      LABEL Entity PROPERTIES (id, name),
    Account KEY (id)
      LABEL Account PROPERTIES (id, create_time)
      LABEL Entity PROPERTIES (id, nick_name AS name)
  );

Consistência de rótulos e propriedades

Em um gráfico, os rótulos e as propriedades são identificados de forma exclusiva pelos nomes. Rótulos e propriedades com o mesmo nome podem aparecer em várias definições de nó ou aresta. No entanto, rótulos e propriedades com o mesmo nome precisam seguir estas regras:

  • Propriedades com o mesmo nome precisam ter o mesmo tipo de valor.
  • Rótulos com o mesmo nome precisam expor a mesma lista de propriedades.

No exemplo anterior, o rótulo Entity é definido nos nós Person e Account. Em ambas as definições, elas têm o mesmo conjunto de nomes de propriedades [id, name] com tipos de valor idênticos.

Dependências entre gráficos e outros objetos de esquema

O gráfico criado por CREATE PROPERTY GRAPH tem uma dependência de outros objetos do esquema, como as tabelas de entrada das definições de nó e aresta e as colunas da tabela referenciadas pelas propriedades. Se uma mudança de esquema quebrar uma dessas dependências, a mudança não será permitida.

A instrução a seguir cria uma dependência de FinGraph para a tabela Account e as colunas id e create_time.

CREATE OR REPLACE PROPERTY GRAPH FinGraph
  NODE TABLES (
    Account PROPERTIES (id, create_time)
  );

Confira abaixo exemplos de mudanças de esquema que não são permitidas:

No entanto, é possível fazer as seguintes mudanças no esquema:

  • Modifique a tabela Account e o esquema das colunas id e create_time, desde que sejam permitidos por outros requisitos de esquema. Para mais informações, consulte Fazer atualizações de esquema.

A seguir