Gestire i dati senza schema

Questa pagina spiega come gestire i dati senza schema in Spanner Graph. Fornisce inoltre best practice e suggerimenti per la risoluzione dei problemi. Ti consigliamo di acquisire familiarità con lo schema e le query di Spanner Graph.

La gestione dei dati senza schema consente di creare una definizione di grafico flessibile. Puoi aggiungere, aggiornare o eliminare le definizioni dei tipi di nodi e archi senza modifiche allo schema. Questo approccio supporta lo sviluppo iterativo e riduce l'overhead di gestione dello schema, preservando al contempo la familiare esperienza di query del grafico.

La gestione dei dati senza schema è utile per i seguenti scenari:

  • Gestione di grafici con modifiche frequenti, ad esempio aggiornamenti e aggiunte di etichette e proprietà degli elementi.

  • Grafici con molti tipi di nodi e archi, il che rende complessa la creazione e la gestione delle tabelle di input.

Per saperne di più su quando utilizzare la gestione dei dati senza schema, consulta Considerazioni per la gestione dei dati senza schema.

Modellare dati senza schema

Spanner Graph ti consente di creare un grafico dalle tabelle che mappa le righe a nodi e archi. Anziché utilizzare tabelle separate per ogni tipo di elemento, la modellazione dei dati senza schema in genere utilizza una singola tabella dei nodi e una singola tabella degli archi con una colonna STRING per l'etichetta e una colonna JSON per le proprietà.

Creare tabelle di input

Puoi creare una singola tabella GraphNode e una singola tabella GraphEdge per archiviare i dati senza schema, come mostrato nell'esempio seguente. I nomi delle tabelle sono a scopo illustrativo. Puoi scegliere quelli che preferisci.

CREATE TABLE GraphNode (
  id INT64 NOT NULL,
  label STRING(MAX) NOT NULL,
  properties JSON,
) PRIMARY KEY (id);

CREATE TABLE GraphEdge (
  id INT64 NOT NULL,
  dest_id INT64 NOT NULL,
  edge_id INT64 NOT NULL,
  label STRING(MAX) NOT NULL,
  properties JSON,
) PRIMARY KEY (id, dest_id, edge_id),
  INTERLEAVE IN PARENT GraphNode;

Questo esempio esegue le seguenti azioni:

  • Memorizza tutti i nodi in una singola tabella, GraphNode, identificati da un id univoco.

  • Memorizza tutti gli archi in una singola tabella, GraphEdge, identificati da una combinazione univoca di origine (id), destinazione (dest_id) e dal proprio identificatore (edge_id). Un edge_id è incluso nella chiave primaria per consentire più di un arco da una coppia id a una coppia dest_id.

Entrambe le tabelle dei nodi e degli archi hanno le proprie colonne label e properties. Queste colonne sono di tipo STRING e JSON, rispettivamente.

Per saperne di più sulle scelte delle chiavi per la gestione dei dati senza schema, vedi Definizioni delle chiavi primarie per nodi e archi.

Creare un grafico delle proprietà

L'istruzione CREATE PROPERTY GRAPH mappa le tabelle di input nella sezione precedente come nodi e archi. Utilizza le seguenti clausole per definire etichette e proprietà per i dati senza schema:

  • DYNAMIC LABEL: crea l'etichetta di un nodo o di un arco da una colonna STRING della tabella di input.
  • DYNAMIC PROPERTIES: crea proprietà di un nodo o di un arco da una colonna JSON della tabella di input.

Il seguente esempio mostra come creare un grafico utilizzando queste clausole:

CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNode
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  )
  EDGE TABLES (
    GraphEdge
      SOURCE KEY (id) REFERENCES GraphNode(id)
      DESTINATION KEY (dest_id) REFERENCES GraphNode(id)
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  );

Definire le etichette dinamiche

La clausola DYNAMIC LABEL designa una colonna di tipo di dati STRING per memorizzare i valori delle etichette.

Ad esempio, in una riga GraphNode, se la colonna label ha un valore person, viene mappata a un nodo Person all'interno del grafico. Allo stesso modo, in una riga GraphEdge, se la colonna dell'etichetta ha un valore owns, viene mappata a un arco Owns all'interno del grafico.

Mappare un'etichetta GraphNode a un'etichetta GraphEdge

Per ulteriori informazioni sulle limitazioni quando utilizzi le etichette dinamiche, vedi Limitazioni.

Definisci le proprietà dinamiche

La clausola DYNAMIC PROPERTIES designa una colonna di tipo di dati JSON per archiviare le proprietà. Le chiavi JSON rappresentano i nomi delle proprietà e i valori JSON rappresentano i valori delle proprietà.

Ad esempio, quando la colonna properties di una riga GraphNode ha il valore JSON '{"name": "David", "age": 43}', Spanner lo mappa a un nodo che ha le proprietà age e name con 43 e "David" come rispettivi valori.

Considerazioni sulla gestione dei dati senza schema

Potresti non voler utilizzare la gestione dei dati senza schema nei seguenti scenari:

  • I tipi di nodi e archi per i dati del grafico sono ben definiti oppure le relative etichette e proprietà non richiedono aggiornamenti frequenti.
  • I tuoi dati sono già archiviati in Spanner e preferisci creare grafici da tabelle esistenti anziché introdurre nuove tabelle di nodi e archi dedicate.
  • I limiti dei dati senza schema ne impediscono l'adozione.

Inoltre, se il tuo carico di lavoro è molto sensibile alle prestazioni di scrittura, soprattutto quando le proprietà vengono aggiornate di frequente, l'utilizzo di proprietà definite dallo schema con tipi di dati primitivi come STRING o INT64 è più efficace dell'utilizzo di proprietà dinamiche con il tipo JSON.

Per ulteriori informazioni su come definire lo schema del grafico senza utilizzare etichette e proprietà dei dati dinamici, consulta la panoramica dello schema del grafico di Spanner.

Eseguire query sui dati del grafico senza schema

Puoi eseguire query sui dati del grafo senza schema utilizzando Graph Query Language (GQL). Puoi utilizzare le query di esempio nella panoramica delle query Spanner Graph e nel riferimento GQL con modifiche limitate.

Corrispondenza di nodi e archi utilizzando le etichette

Puoi abbinare nodi e archi utilizzando l'espressione dell'etichetta in GQL.

La seguente query corrisponde a nodi e archi connessi che hanno i valori account e transfers nella colonna delle etichette.

GRAPH FinGraph
MATCH (a:Account {id: 1})-[t:Transfers]->(d:Account)
RETURN COUNT(*) AS result_count;

Proprietà di accesso

Spanner modella le chiavi e i valori di primo livello del tipo di dati JSON come proprietà, ad esempio age e name nell'esempio seguente.

JSON document Properties

   {
     "name": "Tom",
     "age": 43,
   }
"name": "Tom"
"age": 34

L'esempio seguente mostra come accedere alla proprietà name dal nodo Person.

GRAPH FinGraph
MATCH (person:Person {id: 1})
RETURN person.name;

La query restituisce risultati simili ai seguenti:

JSON"Tom"

Convertire i tipi di dati delle proprietà

Spanner considera le proprietà come valori del tipo di dati JSON. In alcuni casi, ad esempio per i confronti con i tipi SQL, devi prima convertire le proprietà in un tipo SQL.

Nell'esempio riportato di seguito, la query esegue le seguenti conversioni dei tipi di dati:

  • Converte la proprietà is_blocked in un tipo booleano per valutare l'espressione.
  • Converte la proprietà order_number_str in un tipo di stringa e la confronta con il valore letterale "302290001255747".
  • Utilizza la funzione LAX_INT64 per convertire in modo sicuro order_number_str in un numero intero come tipo restituito.
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->()
WHERE BOOL(a.is_blocked) AND STRING(t.order_number_str) = "302290001255747"
RETURN LAX_INT64(t.order_number_str) AS order_number_as_int64;

Vengono restituiti risultati simili ai seguenti:

+-----------------------+
| order_number_as_int64 |
+-----------------------+
| 302290001255747       |
+-----------------------+

Nelle clausole come GROUP BY e ORDER BY, devi anche convertire il tipo di dati JSON. L'esempio seguente converte la proprietà city in un tipo stringa, che ti consente di utilizzarla per il raggruppamento.

GRAPH FinGraph
MATCH (person:Person {country: "South Korea"})
RETURN STRING(person.city) as person_city, COUNT(*) as cnt
LIMIT 10

Suggerimenti per la conversione dei tipi di dati JSON in tipi di dati SQL:

  • I convertitori rigorosi, come INT64, eseguono controlli rigorosi su tipi e valori. Utilizza convertitori rigorosi quando il tipo di dati JSON è noto e applicato, ad esempio utilizzando vincoli dello schema per applicare il tipo di dati della proprietà.
  • I convertitori flessibili, ad esempio LAX_INT64, converte il valore in modo sicuro quando possibile e restituisce NULL quando la conversione non è fattibile. Utilizza convertitori flessibili quando non è necessario un controllo rigoroso o i tipi sono difficili da applicare.

Per ulteriori informazioni sulla conversione dei dati, consulta i suggerimenti per la risoluzione dei problemi.

Filtrare per valori delle proprietà

Nei filtri delle proprietà, Spanner considera i parametri del filtro come valori del tipo di dati JSON. Ad esempio, nella seguente query, Spanner considerais_blocked come un JSON boolean e order_number_str come un JSON string.

GRAPH FinGraph
MATCH (a:Account {is_blocked: false})-[t:Transfers {order_number_str:"302290001255747"}]->()
RETURN a.id AS account_id;

Vengono restituiti risultati simili ai seguenti:

+-----------------------+
| account_id            |
+-----------------------+
| 7                     |
+-----------------------+

Il parametro del filtro deve corrispondere al tipo e al valore della proprietà. Ad esempio, quando il parametro di filtro order_number_str è un numero intero, Spanner non trova corrispondenze perché la proprietà è un string JSON.

GRAPH FinGraph
MATCH (a:Account {is_blocked: false})-[t:Transfers {order_number_str: 302290001255747}]->()
RETURN t.order_number_str;

Accedere alle proprietà JSON nidificate

Spanner non modella chiavi e valori JSON nidificati come proprietà. Nel seguente esempio, Spanner non modella le chiavi JSON city, state e country come proprietà perché sono nidificate in location. Tuttavia, puoi accedervi con un operatore di accesso ai campi JSON o un operatore di indice JSON.

JSON document Properties

   {
     "name": "Tom",
     "age": 43,
     "location": {
       "city": "New York",
       "state": "NY",
       "country": "USA",
     }
   }
"name": "Tom"
"age": 34
"location": {
  "city": "New York",
  "state": "NY",
  "country": "USA",
}

L'esempio seguente mostra come accedere alle proprietà nidificate con l'operatore di accesso del campo JSON.

GRAPH FinGraph
MATCH (person:Person {id: 1})
RETURN STRING(person.location.city);

Vengono restituiti risultati simili ai seguenti:

"New York"

Modificare i dati senza schema

Spanner Graph mappa i dati delle tabelle in nodi e archi del grafico. Quando modifichi i dati della tabella di input, questa modifica causa direttamente mutazioni ai dati del grafico corrispondenti. Per ulteriori informazioni sulla mutazione dei dati del grafico, vedi Inserire, aggiornare o eliminare i dati di Spanner Graph.

Esempi di query

Questa sezione fornisce esempi che mostrano come creare, aggiornare ed eliminare i dati del grafico.

Inserire i dati del grafico

L'esempio seguente inserisce un nodo person. I nomi delle etichette e delle proprietà devono essere in minuscolo.

INSERT INTO GraphNode (id, label, properties)
VALUES (4, "person", JSON'{"name": "David", "age": 43}');

Aggiornare i dati del grafico

L'esempio seguente aggiorna un nodo Account e utilizza la funzione JSON_SET per impostare la relativa proprietà is_blocked.

UPDATE GraphNode
SET properties = JSON_SET(
  properties,
  '$.is_blocked', false
)
WHERE label = "account" AND id = 16;

L'esempio seguente aggiorna un nodo person con un nuovo insieme di proprietà.

UPDATE GraphNode
SET properties = JSON'{"name": "David", "age": 43}'
WHERE label = "person" AND id = 4;

L'esempio seguente utilizza la funzione JSON_REMOVE per rimuovere la proprietà is_blocked da un nodo Account. Dopo l'esecuzione, tutte le altre proprietà esistenti rimangono invariate.

UPDATE GraphNode
SET properties = JSON_REMOVE(
  properties,
  '$.is_blocked'
)
WHERE label = "account" AND id = 16;

Elimina i dati del grafico

Il seguente esempio elimina il collegamento Transfers sui nodi Account che sono stati trasferiti ad account bloccati.

DELETE FROM GraphEdge
WHERE label = "transfers" AND id IN {
  GRAPH FinGraph
  MATCH (a:Account)-[:Transfers]->{1,2}(:Account {is_blocked: TRUE})
  RETURN a.id
}

Limitazioni note

Questa sezione elenca le limitazioni dell'utilizzo della gestione dei dati senza schema.

Requisito di una singola tabella per le etichette dinamiche

Puoi avere una sola tabella dei nodi se nella sua definizione viene utilizzata un'etichetta dinamica. Questa limitazione si applica anche alla tabella degli archi. Spanner non consente quanto segue:

  • Definizione di una tabella dei nodi con un'etichetta dinamica insieme a qualsiasi altra tabella dei nodi.
  • Definizione di una tabella degli archi con un'etichetta dinamica insieme a qualsiasi altra tabella degli archi.
  • Definizione di più tabelle dei nodi o più tabelle degli archi che utilizzano ciascuna un'etichetta dinamica.

Ad esempio, il seguente codice non riesce a creare più nodi del grafico con etichette dinamiche.

CREATE OR REPLACE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNodeOne
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties),
    GraphNodeTwo
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties),
    Account
      LABEL Account PROPERTIES(create_time)
  )
  EDGE TABLES (
    ...
  );

I nomi delle etichette devono essere minuscoli

Per la corrispondenza, devi memorizzare i valori delle stringhe delle etichette in minuscolo. Ti consigliamo di applicare questa regola nel codice dell'applicazione o utilizzando i vincoli dello schema.

Sebbene i valori delle stringhe delle etichette debbano essere memorizzati in minuscolo, non sono sensibili alle maiuscole quando li fai riferimento in una query.

Il seguente esempio mostra come inserire etichette in valori minuscoli:

INSERT INTO GraphNode (id, label) VALUES (1, "account");
INSERT INTO GraphNode (id, label) VALUES (2, "account");

Puoi utilizzare etichette senza distinzione tra maiuscole e minuscole per trovare corrispondenze con GraphNode o GraphEdge.

GRAPH FinGraph
MATCH (accnt:Account {id: 1})-[:Transfers]->(dest_accnt:Account)
RETURN dest_accnt.id;

I nomi delle proprietà devono essere in minuscolo

Devi memorizzare i nomi delle proprietà in lettere minuscole. Ti consigliamo di applicare questa regola nel codice dell'applicazione o utilizzando i vincoli dello schema.

Anche se i nomi delle proprietà devono essere memorizzati in minuscolo, non sono sensibili alle maiuscole quando li fai riferimento nella query.

L'esempio seguente inserisce le proprietà name e age utilizzando le lettere minuscole.

INSERT INTO GraphNode (id, label, properties)
VALUES (25, "person", JSON '{"name": "Kim", "age": 27}');

Nel testo della query, i nomi delle proprietà non fanno distinzione tra maiuscole e minuscole. Ad esempio, puoi utilizzare Age o age per accedere alla proprietà.

GRAPH FinGraph
MATCH (n:Person {Age: 27})
RETURN n.id;

Limitazioni aggiuntive

  • I modelli Spanner utilizzano solo le chiavi di primo livello del tipo di dati JSON come proprietà.
  • I tipi di dati delle proprietà devono essere conformi alle specifiche del tipo JSON di Spanner.

Best practice per i dati senza schema

Questa sezione descrive le best practice che ti aiutano a modellare i dati senza schema.

Definisci le chiavi primarie per nodi e archi

La chiave di un nodo deve essere univoca in tutti i nodi del grafico. Ad esempio, come colonna INT64 o stringa UUID.

Se esistono più archi tra due nodi, introduci un identificatore univoco per l'arco. L'esempio di schema utilizza una colonna INT64 edge_id della logica dell'applicazione.

Quando crei lo schema per le tabelle dei nodi e degli archi, includi facoltativamente la colonna label come colonna di chiave primaria se il valore è immutabile. Se lo fai, la chiave composita formata da tutte le colonne chiave deve essere univoca in tutti i nodi o gli archi. Questa tecnica migliora le prestazioni per le query filtrate solo per etichetta.

Per saperne di più sulla scelta della chiave primaria, vedi Scegliere una chiave primaria.

Crea un indice secondario per una proprietà a cui si accede di frequente

Per migliorare il rendimento delle query per una proprietà utilizzata spesso nei filtri, crea un indice secondario in base a una colonna della proprietà generata. Poi, utilizzalo in uno schema e nelle query del grafico.

L'esempio seguente mostra come aggiungere una colonna age generata alla tabella GraphNode per un nodo person. Il valore è NULL per i nodi senza l'etichetta person.

ALTER TABLE GraphNode
ADD COLUMN person_age INT64 AS
(IF (label = "person", LAX_INT64(properties.age), NULL));

La seguente istruzione DDL crea quindi un NULL FILTERED INDEX per person_age e lo interleave nella tabella GraphNode per l'accesso locale.

CREATE NULL_FILTERED INDEX IdxPersonAge
ON GraphNode(id, label, person_age), INTERLEAVE IN GraphNode;

La tabella GraphNode include nuove colonne disponibili come proprietà dei nodi del grafico. Per riflettere questo aspetto nella definizione del grafico delle proprietà, utilizza l'istruzione CREATE OR REPLACE PROPERTY GRAPH. In questo modo, la definizione viene ricompilata e include la nuova colonna person_age come proprietà.

Per ulteriori informazioni, consulta la sezione Aggiornamento delle definizioni di nodi o archi esistenti.

La seguente istruzione ricompila la definizione e include la nuova colonna person_age come proprietà.

CREATE OR REPLACE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNode
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  )
  EDGE TABLES (
    GraphEdge
      SOURCE KEY (id) REFERENCES GraphNode (id)
      DESTINATION KEY (dest_id) REFERENCES GraphNode (id)
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  );

L'esempio seguente esegue una query con la proprietà indicizzata.

GRAPH FinGraph
MATCH (person:Person {person_age: 43})
RETURN person.id, person.name;

(Facoltativo) Esegui il comando ANALYZE dopo la creazione dell'indice in modo che l'ottimizzatore delle query venga aggiornato con le statistiche del database più recenti.

Utilizzare i vincoli di controllo per l'integrità dei dati

Spanner supporta oggetti schema come i vincoli di controllo per applicare l'integrità dei dati di etichette e proprietà. Questa sezione elenca i suggerimenti per i vincoli di controllo che puoi utilizzare con i dati senza schema.

Applica valori etichetta

Ti consigliamo di utilizzare NOT NULL nella definizione della colonna delle etichette per evitare valori delle etichette non definiti.

CREATE TABLE GraphNode (
  id INT64 NOT NULL,
  label STRING(MAX) NOT NULL,
  properties JSON,
) PRIMARY KEY (id);

Applica nomi di proprietà e valori etichetta in minuscolo

Poiché i nomi delle etichette e delle proprietà devono essere memorizzati come valori in minuscolo, esegui una delle seguenti operazioni:

  • Applica il controllo nella logica dell'applicazione.
  • Crea vincoli check nello schema.

Al momento della query, il nome dell'etichetta e della proprietà non fa distinzione tra maiuscole e minuscole.

L'esempio seguente mostra come aggiungere un vincolo di etichetta del nodo alla tabella GraphNode per garantire che l'etichetta sia in minuscolo.

ALTER TABLE GraphNode ADD CONSTRAINT NodeLabelLowerCaseCheck
CHECK(LOWER(label) = label);

L'esempio seguente mostra come aggiungere un vincolo di controllo al nome della proprietà edge. Il controllo utilizza JSON_KEYS per accedere alle chiavi di primo livello. COALESCE converte l'output in un array vuoto se JSON_KEYS restituisce NULL e poi verifica che ogni chiave sia in minuscolo.

ALTER TABLE GraphEdge ADD CONSTRAINT EdgePropertiesLowerCaseCheck
CHECK(NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));

Imponi l'esistenza delle proprietà

Crea un vincolo che controlla se esiste una proprietà per un'etichetta.

Nell'esempio seguente, il vincolo verifica se un nodo person ha una proprietà name.

ALTER TABLE GraphNode
ADD CONSTRAINT NameMustExistForPersonConstraint
CHECK (IF(label = 'person', properties.name IS NOT NULL, TRUE));

Imporre proprietà univoche

Crea vincoli basati sulle proprietà che controllano se la proprietà di un nodo o di un arco è univoca tra i nodi o gli archi con la stessa etichetta. Per farlo, utilizza un UNIQUE INDEX rispetto alle colonne generate delle proprietà.

Nell'esempio seguente, l'indice univoco verifica che le proprietà name e country combinate siano univoche per qualsiasi nodo person.

  1. Aggiungi una colonna generata per PersonName.

    ALTER TABLE GraphNode
    ADD COLUMN person_name STRING(MAX)
    AS (IF(label = 'person', STRING(properties.name), NULL)) Hidden;
    
  2. Aggiungi una colonna generata per PersonCountry.

    ALTER TABLE GraphNode
    ADD COLUMN person_country STRING(MAX)
    AS (IF(label = 'person', STRING(properties.country), NULL)) Hidden;
    
  3. Crea un indice univoco NULL_FILTERED in base alle proprietà PersonName e PersonCountry.

    CREATE UNIQUE NULL_FILTERED INDEX NameAndCountryMustBeUniqueForPerson
    ON GraphNode (person_name, person_country);
    

Forzare il tipo di dati della proprietà

Forza un tipo di dati della proprietà utilizzando un vincolo del tipo di dati su un valore della proprietà per un'etichetta, come mostrato nell'esempio seguente. Questo esempio utilizza la funzione JSON_TYPE per verificare che la proprietà name dell'etichetta person utilizzi il tipo STRING.

ALTER TABLE GraphNode
ADD CONSTRAINT PersonNameMustBeStringTypeConstraint
CHECK (IF(label = 'person', JSON_TYPE(properties.name) = 'string', TRUE));

Combinare etichette definite e dinamiche

Spanner consente ai nodi nel grafico delle proprietà di avere sia etichette definite (nello schema) sia etichette dinamiche (derivate dai dati). Personalizza le etichette per sfruttare questa flessibilità.

Considera lo schema seguente che mostra la creazione della tabella GraphNode:

CREATE OR REPLACE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNode
      LABEL Entity -- Defined label
      DYNAMIC LABEL (label) -- Dynamic label from data column 'label'
      DYNAMIC PROPERTIES (properties)
  );

In questo caso, ogni nodo creato da GraphNode ha l'etichetta defined Entity. Inoltre, ogni nodo ha un'etichetta dinamica determinata dal valore nella colonna dell'etichetta.

Poi, scrivi query che corrispondono ai nodi in base al tipo di etichetta. Ad esempio, la seguente query trova i nodi utilizzando l'etichetta Entity definita:

GRAPH FinGraph
MATCH (node:Entity {id: 1}) -- Querying by the defined label
RETURN node.name;

Anche se questa query utilizza l'etichetta definita Entity, ricorda che il nodo corrispondente contiene anche un'etichetta dinamica in base ai suoi dati.

Esempi di schema

Utilizza gli esempi di schema in questa sezione come modelli per creare i tuoi schemi. I componenti chiave dello schema includono:

Il seguente esempio mostra come creare tabelle di input e un grafico delle proprietà:

CREATE TABLE GraphNode (
  id INT64 NOT NULL,
  label STRING(MAX) NOT NULL,
  properties JSON
) PRIMARY KEY (id);

CREATE TABLE GraphEdge (
  id INT64 NOT NULL,
  dest_id INT64 NOT NULL,
  edge_id INT64 NOT NULL,
  label STRING(MAX) NOT NULL,
  properties JSON
) PRIMARY KEY (id, dest_id, edge_id),
  INTERLEAVE IN PARENT GraphNode;

CREATE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNode
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  )
  EDGE TABLES (
    GraphEdge
      SOURCE KEY (id) REFERENCES GraphNode(id)
      DESTINATION KEY (dest_id) REFERENCES GraphNode(id)
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  );

L'esempio seguente utilizza un indice per migliorare l'attraversamento degli archi inversi. La clausola STORING (properties) include una copia delle proprietà dei bordi, il che velocizza le query che filtrano in base a queste proprietà. Puoi omettere la clausola STORING (properties) se le tue query non ne traggono vantaggio.

CREATE INDEX R_EDGE ON GraphEdge (dest_id, id, edge_id) STORING (properties),
INTERLEAVE IN GraphNode;

Il seguente esempio utilizza un indice delle etichette per velocizzare la corrispondenza dei nodi in base alle etichette.

CREATE INDEX IDX_NODE_LABEL ON GraphNode (label);

L'esempio seguente aggiunge vincoli che impongono etichette e proprietà in lettere minuscole. Gli ultimi due esempi utilizzano la funzione JSON_KEYS. Se vuoi, puoi applicare il controllo delle lettere minuscole nella logica dell'applicazione.

ALTER TABLE GraphNode ADD CONSTRAINT node_label_lower_case
CHECK(LOWER(label) = label);

ALTER TABLE GraphEdge ADD CONSTRAINT edge_label_lower_case
CHECK(LOWER(label) = label);

ALTER TABLE GraphNode ADD CONSTRAINT node_property_keys_lower_case
CHECK(
  NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));

ALTER TABLE GraphEdge ADD CONSTRAINT edge_property_keys_lower_case
CHECK(
  NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));

Ottimizzare gli aggiornamenti batch delle proprietà dinamiche con DML

La modifica delle proprietà dinamiche utilizzando funzioni come JSON_SET e JSON_REMOVE comporta operazioni di lettura, modifica e scrittura. Ciò può comportare un costo maggiore rispetto all'aggiornamento delle proprietà di tipo STRING o INT64.

Se i carichi di lavoro comportano aggiornamenti batch alle proprietà dinamiche utilizzando DML, segui i consigli riportati di seguito per ottenere prestazioni migliori:

  • Aggiorna più righe in una singola istruzione DML anziché elaborare le righe singolarmente.

  • Quando aggiorni un intervallo di chiavi ampio, raggruppa e ordina le righe interessate in base alle chiavi primarie. L'aggiornamento di intervalli non sovrapposti con ogni DML riduce la contesa di blocco.

  • Utilizza i parametri di query nelle istruzioni DML anziché codificarli in modo rigido per migliorare il rendimento.

In base a questi suggerimenti, l'esempio seguente mostra come aggiornare la proprietà is_blocked per 100 nodi in un'unica istruzione DML. I parametri della query includono:

  1. @node_ids: chiavi delle righe GraphNode, memorizzate in un parametro ARRAY. Se applicabile, il raggruppamento e l'ordinamento tra i DML consentono di ottenere prestazioni migliori.

  2. @is_blocked_values: i valori corrispondenti da aggiornare, archiviati in un parametro ARRAY.

UPDATE GraphNode
SET properties = JSON_SET(
  properties,
  '$.is_blocked',
  CASE id
    WHEN @node_ids[OFFSET(0)] THEN @is_blocked_values[OFFSET(0)]
    WHEN @node_ids[OFFSET(1)] THEN @is_blocked_values[OFFSET(1)]
    ...
    WHEN @node_ids[OFFSET(99)] THEN @is_blocked_values[OFFSET(99)]
  END,
  create_if_missing => TRUE)
WHERE id IN UNNEST(@node_ids)

Risoluzione dei problemi

Questa sezione descrive come risolvere i problemi relativi ai dati senza schema.

La proprietà compare più volte nel risultato TO_JSON

Problema

Il seguente nodo modella le proprietà birthday e name come proprietà dinamiche nella colonna JSON. Le proprietà birthday e name duplicate vengono visualizzate nel risultato JSON dell'elemento del grafico.

GRAPH FinGraph
MATCH (n: Person {id: 14})
RETURN SAFE_TO_JSON(n) AS n;

Vengono restituiti risultati simili ai seguenti:

{
  ,
  "properties": {
    "birthday": "1991-12-21 00:00:00",
    "name": "Alex",
    "id": 14,
    "label": "person",
    "properties": {
      "birthday": "1991-12-21 00:00:00",
      "name": "Alex"
    }
  }
  
}

Possibile causa

Per impostazione predefinita, tutte le colonne della tabella di base sono definite come proprietà. L'utilizzo di TO_JSON o SAFE_TO_JSON per restituire elementi del grafico genera proprietà duplicate. Ciò si verifica perché la colonna JSON (properties) è una proprietà definita dallo schema, mentre le chiavi di primo livello di JSON sono modellate come proprietà dinamiche.

Soluzione consigliata

Per evitare questo comportamento, utilizza la clausola PROPERTIES ALL COLUMNS EXCEPT per escludere la colonna properties quando definisci le proprietà nello schema, come mostrato nell'esempio seguente:

CREATE OR REPLACE PROPERTY GRAPH FinGraph
  NODE TABLES (
    GraphNode
      PROPERTIES ALL COLUMNS EXCEPT (properties)
      DYNAMIC LABEL (label)
      DYNAMIC PROPERTIES (properties)
  );

Dopo la modifica dello schema, gli elementi del grafico restituiti del tipo di dati JSON non hanno duplicati.

GRAPH FinGraph
MATCH (n: Person {id: 1})
RETURN TO_JSON(n) AS n;

Questa query restituisce quanto segue:

{
  
  "properties": {
    "birthday": "1991-12-21 00:00:00",
    "name": "Alex",
    "id": 1,
    "label": "person",
  }
}

Problemi comuni quando i valori delle proprietà non vengono convertiti correttamente

Per risolvere i seguenti problemi, utilizza sempre le conversioni del valore della proprietà quando utilizzi una proprietà all'interno di un'espressione di query.

Confronto dei valori delle proprietà senza conversione

Problema

No matching signature for operator = for argument types: JSON, STRING

Possibile causa

La query non converte correttamente i valori delle proprietà. Ad esempio, la proprietà name non viene convertita nel tipo STRING nel confronto:

GRAPH FinGraph
MATCH (p:Person)
WHERE p.name = "Alex"
RETURN p.id;

Soluzione consigliata

Per risolvere il problema, utilizza una conversione di valori prima del confronto.

GRAPH FinGraph
MATCH (p:Person)
WHERE STRING(p.name) = "Alex"
RETURN p.id;

Vengono restituiti risultati simili ai seguenti:

+------+
| id   |
+------+
| 1    |
+------+

In alternativa, utilizza un filtro delle proprietà per semplificare i confronti di uguaglianza in cui la conversione del valore avviene automaticamente. Tieni presente che il tipo di valore ("Alex") deve corrispondere esattamente al tipo STRING della proprietà in JSON.

GRAPH FinGraph
MATCH (p:Person {name: 'Alex'})
RETURN p.id;

Vengono restituiti risultati simili ai seguenti:

+------+
| id   |
+------+
| 1    |
+------+

Utilizzo del valore della proprietà RETURN DISTINCT senza conversione

Problema

Column order_number_str of type JSON cannot be used in `RETURN DISTINCT

Possibile causa

Nell'esempio seguente, order_number_str non è stato convertito prima di essere utilizzato nell'istruzione RETURN DISTINCT:

GRAPH FinGraph
MATCH -[t:Transfers]->
RETURN DISTINCT t.order_number_str AS order_number_str;

Soluzione consigliata

Per risolvere il problema, utilizza una conversione di valore prima del giorno RETURN DISTINCT.

GRAPH FinGraph
MATCH -[t:Transfers]->
RETURN DISTINCT STRING(t.order_number_str) AS order_number_str;

Vengono restituiti risultati simili ai seguenti:

+-----------------+
| order_number_str|
+-----------------+
| 302290001255747 |
| 103650009791820 |
| 304330008004315 |
| 304120005529714 |
+-----------------+

Proprietà utilizzata come chiave di raggruppamento senza conversione

Problema

Grouping by expressions of type JSON is not allowed.

Possibile causa

Nell'esempio seguente, t.order_number_str non viene convertito prima di essere utilizzato per raggruppare gli oggetti JSON:

GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN t.order_number_str, COUNT(*) AS total_transfers;

Soluzione consigliata

Per risolvere il problema, utilizza una conversione del valore prima di utilizzare la proprietà come chiave di raggruppamento.

GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN STRING(t.order_number_str) AS order_number_str, COUNT(*) AS total_transfers;

Vengono restituiti risultati simili ai seguenti:

+-----------------+------------------+
| order_number_str | total_transfers |
+-----------------+------------------+
| 302290001255747 |                1 |
| 103650009791820 |                1 |
| 304330008004315 |                1 |
| 304120005529714 |                2 |
+-----------------+------------------+

Proprietà utilizzata come chiave di ordinamento senza conversione

Problema

ORDER BY does not support expressions of type JSON

Possibile causa

Nell'esempio seguente, t.amount non viene convertito prima di essere utilizzato per ordinare i risultati:

GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN a.Id AS from_account, b.Id AS to_account, t.amount
ORDER BY t.amount DESC
LIMIT 1;

Soluzione consigliata

Per risolvere il problema, esegui una conversione su t.amount nella clausola ORDER BY.

GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN a.Id AS from_account, b.Id AS to_account, t.amount
ORDER BY DOUBLE(t.amount) DESC
LIMIT 1;

Vengono restituiti risultati simili ai seguenti:

+--------------+------------+--------+
| from_account | to_account | amount |
+--------------+------------+--------+
|           20 |          7 | 500    |
+--------------+------------+--------+

Mancata corrispondenza del tipo durante la conversione

Problema

The provided JSON input is not an integer

Possibile causa

Nell'esempio seguente, la proprietà order_number_str viene memorizzata come tipo di dati JSON STRING. Se provi a eseguire una conversione in INT64, viene restituito un errore.

GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE INT64(e.order_number_str) = 302290001255747
RETURN e.amount;

Soluzione consigliata

Per risolvere il problema, utilizza il convertitore di valori esatti che corrisponde al tipo di valore.

GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE STRING(e.order_number_str) = "302290001255747"
RETURN e.amount;

Vengono restituiti risultati simili ai seguenti:

+-----------+
| amount    |
+-----------+
| JSON"200" |
+-----------+

In alternativa, utilizza un convertitore flessibile quando il valore è convertibile nel tipo di destinazione, come mostrato nell'esempio seguente:

GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE LAX_INT64(e.order_number_str) = 302290001255747
RETURN e.amount;

Vengono restituiti risultati simili ai seguenti:

+-----------+
| amount    |
+-----------+
| JSON"200" |
+-----------+

Passaggi successivi