Questa pagina spiega come gestire i dati senza schema in Spanner Graph. Fornisce inoltre best practice e suggerimenti per la risoluzione dei problemi. Ti consigliamo di acquisire familiarità con lo schema e le query di Spanner Graph.
La gestione dei dati senza schema consente di creare una definizione di grafico flessibile. Puoi aggiungere, aggiornare o eliminare le definizioni dei tipi di nodi e archi senza modifiche allo schema. Questo approccio supporta lo sviluppo iterativo e riduce l'overhead di gestione dello schema, preservando al contempo la familiare esperienza di query del grafico.
La gestione dei dati senza schema è utile per i seguenti scenari:
Gestione di grafici con modifiche frequenti, ad esempio aggiornamenti e aggiunte di etichette e proprietà degli elementi.
Grafici con molti tipi di nodi e archi, il che rende complessa la creazione e la gestione delle tabelle di input.
Per saperne di più su quando utilizzare la gestione dei dati senza schema, consulta Considerazioni per la gestione dei dati senza schema.
Modellare dati senza schema
Spanner Graph ti consente di creare un grafico dalle tabelle che mappa le righe a
nodi e archi.
Anziché utilizzare tabelle separate per ogni tipo di elemento, la modellazione dei dati senza schema
in genere utilizza una singola tabella dei nodi e una singola tabella degli archi con una colonna STRING
per l'etichetta e una colonna JSON
per le proprietà.
Creare tabelle di input
Puoi creare una singola tabella GraphNode
e una singola tabella GraphEdge
per
archiviare i dati senza schema, come mostrato nell'esempio seguente. I nomi delle tabelle sono a scopo illustrativo. Puoi scegliere quelli che preferisci.
CREATE TABLE GraphNode (
id INT64 NOT NULL,
label STRING(MAX) NOT NULL,
properties JSON,
) PRIMARY KEY (id);
CREATE TABLE GraphEdge (
id INT64 NOT NULL,
dest_id INT64 NOT NULL,
edge_id INT64 NOT NULL,
label STRING(MAX) NOT NULL,
properties JSON,
) PRIMARY KEY (id, dest_id, edge_id),
INTERLEAVE IN PARENT GraphNode;
Questo esempio esegue le seguenti azioni:
Memorizza tutti i nodi in una singola tabella,
GraphNode
, identificati da unid
univoco.Memorizza tutti gli archi in una singola tabella,
GraphEdge
, identificati da una combinazione univoca di origine (id
), destinazione (dest_id
) e dal proprio identificatore (edge_id
). Unedge_id
è incluso nella chiave primaria per consentire più di un arco da una coppiaid
a una coppiadest_id
.
Entrambe le tabelle dei nodi e degli archi hanno le proprie colonne label
e properties
.
Queste colonne sono di tipo STRING
e JSON
, rispettivamente.
Per saperne di più sulle scelte delle chiavi per la gestione dei dati senza schema, vedi Definizioni delle chiavi primarie per nodi e archi.
Creare un grafico delle proprietà
L'istruzione CREATE PROPERTY GRAPH mappa le tabelle di input nella sezione precedente come nodi e archi. Utilizza le seguenti clausole per definire etichette e proprietà per i dati senza schema:
DYNAMIC LABEL
: crea l'etichetta di un nodo o di un arco da una colonnaSTRING
della tabella di input.DYNAMIC PROPERTIES
: crea proprietà di un nodo o di un arco da una colonnaJSON
della tabella di input.
Il seguente esempio mostra come creare un grafico utilizzando queste clausole:
CREATE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNode
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
)
EDGE TABLES (
GraphEdge
SOURCE KEY (id) REFERENCES GraphNode(id)
DESTINATION KEY (dest_id) REFERENCES GraphNode(id)
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
);
Definire le etichette dinamiche
La clausola DYNAMIC LABEL
designa una colonna di tipo di dati STRING
per memorizzare i valori delle etichette.
Ad esempio, in una riga GraphNode
, se la colonna label
ha un valore person
,
viene mappata a un nodo Person
all'interno del grafico. Allo stesso modo, in una riga GraphEdge
, se
la colonna dell'etichetta ha un valore owns
, viene mappata a un arco Owns
all'interno del
grafico.
Per ulteriori informazioni sulle limitazioni quando utilizzi le etichette dinamiche, vedi Limitazioni.
Definisci le proprietà dinamiche
La clausola DYNAMIC PROPERTIES
designa una colonna di tipo di dati JSON
per archiviare
le proprietà. Le chiavi JSON rappresentano i nomi delle proprietà e i valori JSON rappresentano
i valori delle proprietà.
Ad esempio, quando la colonna properties
di una riga GraphNode
ha il valore JSON
'{"name": "David", "age": 43}'
, Spanner lo mappa a un nodo che
ha le proprietà age
e name
con 43
e "David"
come rispettivi
valori.
Considerazioni sulla gestione dei dati senza schema
Potresti non voler utilizzare la gestione dei dati senza schema nei seguenti scenari:
- I tipi di nodi e archi per i dati del grafico sono ben definiti oppure le relative etichette e proprietà non richiedono aggiornamenti frequenti.
- I tuoi dati sono già archiviati in Spanner e preferisci creare grafici da tabelle esistenti anziché introdurre nuove tabelle di nodi e archi dedicate.
- I limiti dei dati senza schema ne impediscono l'adozione.
Inoltre, se il tuo carico di lavoro è molto sensibile alle prestazioni di scrittura,
soprattutto quando le proprietà vengono aggiornate di frequente, l'utilizzo di proprietà
definite dallo schema con
tipi di dati primitivi come STRING
o INT64
è più efficace dell'utilizzo di
proprietà dinamiche con il tipo JSON
.
Per ulteriori informazioni su come definire lo schema del grafico senza utilizzare etichette e proprietà dei dati dinamici, consulta la panoramica dello schema del grafico di Spanner.
Eseguire query sui dati del grafico senza schema
Puoi eseguire query sui dati del grafo senza schema utilizzando Graph Query Language (GQL). Puoi utilizzare le query di esempio nella panoramica delle query Spanner Graph e nel riferimento GQL con modifiche limitate.
Corrispondenza di nodi e archi utilizzando le etichette
Puoi abbinare nodi e archi utilizzando l'espressione dell'etichetta in GQL.
La seguente query corrisponde a nodi e archi connessi che hanno i valori
account
e transfers
nella colonna delle etichette.
GRAPH FinGraph
MATCH (a:Account {id: 1})-[t:Transfers]->(d:Account)
RETURN COUNT(*) AS result_count;
Proprietà di accesso
Spanner modella le chiavi e i valori di primo livello del tipo di dati JSON
come proprietà, ad esempio age
e name
nell'esempio seguente.
JSON document |
Properties |
|
|
|
L'esempio seguente mostra come accedere alla proprietà name
dal nodo Person
.
GRAPH FinGraph
MATCH (person:Person {id: 1})
RETURN person.name;
La query restituisce risultati simili ai seguenti:
JSON"Tom"
Convertire i tipi di dati delle proprietà
Spanner considera le proprietà come valori del tipo di dati JSON. In alcuni casi, ad esempio per i confronti con i tipi SQL, devi prima convertire le proprietà in un tipo SQL.
Nell'esempio riportato di seguito, la query esegue le seguenti conversioni dei tipi di dati:
- Converte la proprietà
is_blocked
in un tipo booleano per valutare l'espressione. - Converte la proprietà
order_number_str
in un tipo di stringa e la confronta con il valore letterale"302290001255747"
. - Utilizza la funzione LAX_INT64
per convertire in modo sicuro
order_number_str
in un numero intero come tipo restituito.
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->()
WHERE BOOL(a.is_blocked) AND STRING(t.order_number_str) = "302290001255747"
RETURN LAX_INT64(t.order_number_str) AS order_number_as_int64;
Vengono restituiti risultati simili ai seguenti:
+-----------------------+
| order_number_as_int64 |
+-----------------------+
| 302290001255747 |
+-----------------------+
Nelle clausole come GROUP BY
e ORDER BY
, devi anche convertire il tipo di dati JSON. L'esempio seguente converte la proprietà city
in un tipo stringa,
che ti consente di utilizzarla per il raggruppamento.
GRAPH FinGraph
MATCH (person:Person {country: "South Korea"})
RETURN STRING(person.city) as person_city, COUNT(*) as cnt
LIMIT 10
Suggerimenti per la conversione dei tipi di dati JSON in tipi di dati SQL:
- I convertitori rigorosi, come
INT64
, eseguono controlli rigorosi su tipi e valori. Utilizza convertitori rigorosi quando il tipo di dati JSON è noto e applicato, ad esempio utilizzando vincoli dello schema per applicare il tipo di dati della proprietà. - I convertitori flessibili, ad esempio
LAX_INT64
, converte il valore in modo sicuro quando possibile e restituisceNULL
quando la conversione non è fattibile. Utilizza convertitori flessibili quando non è necessario un controllo rigoroso o i tipi sono difficili da applicare.
Per ulteriori informazioni sulla conversione dei dati, consulta i suggerimenti per la risoluzione dei problemi.
Filtrare per valori delle proprietà
Nei
filtri delle proprietà,
Spanner considera i parametri del filtro come valori del tipo di dati JSON
. Ad esempio, nella seguente query, Spanner
considerais_blocked
come un JSON boolean
e order_number_str
come un JSON
string
.
GRAPH FinGraph
MATCH (a:Account {is_blocked: false})-[t:Transfers {order_number_str:"302290001255747"}]->()
RETURN a.id AS account_id;
Vengono restituiti risultati simili ai seguenti:
+-----------------------+
| account_id |
+-----------------------+
| 7 |
+-----------------------+
Il parametro del filtro deve corrispondere al tipo e al valore della proprietà. Ad esempio, quando
il parametro di filtro order_number_str
è un numero intero, Spanner
non trova corrispondenze perché la proprietà è un string
JSON.
GRAPH FinGraph
MATCH (a:Account {is_blocked: false})-[t:Transfers {order_number_str: 302290001255747}]->()
RETURN t.order_number_str;
Accedere alle proprietà JSON nidificate
Spanner non modella chiavi e valori JSON nidificati come proprietà.
Nel seguente esempio, Spanner non modella le chiavi JSON
city
, state
e country
come proprietà perché sono nidificate in
location
. Tuttavia, puoi accedervi con un
operatore di accesso ai campi
JSON o un
operatore di indice
JSON.
JSON document |
Properties |
|
|
|
|
|
L'esempio seguente mostra come accedere alle proprietà nidificate con l'operatore di accesso del campo JSON.
GRAPH FinGraph
MATCH (person:Person {id: 1})
RETURN STRING(person.location.city);
Vengono restituiti risultati simili ai seguenti:
"New York"
Modificare i dati senza schema
Spanner Graph mappa i dati delle tabelle in nodi e archi del grafico. Quando modifichi i dati della tabella di input, questa modifica causa direttamente mutazioni ai dati del grafico corrispondenti. Per ulteriori informazioni sulla mutazione dei dati del grafico, vedi Inserire, aggiornare o eliminare i dati di Spanner Graph.
Esempi di query
Questa sezione fornisce esempi che mostrano come creare, aggiornare ed eliminare i dati del grafico.
Inserire i dati del grafico
L'esempio seguente inserisce un nodo person
. I nomi delle etichette e delle proprietà devono
essere in minuscolo.
INSERT INTO GraphNode (id, label, properties)
VALUES (4, "person", JSON'{"name": "David", "age": 43}');
Aggiornare i dati del grafico
L'esempio seguente aggiorna un nodo Account
e utilizza la funzione
JSON_SET
per impostare la relativa proprietà is_blocked
.
UPDATE GraphNode
SET properties = JSON_SET(
properties,
'$.is_blocked', false
)
WHERE label = "account" AND id = 16;
L'esempio seguente aggiorna un nodo person
con un nuovo insieme di proprietà.
UPDATE GraphNode
SET properties = JSON'{"name": "David", "age": 43}'
WHERE label = "person" AND id = 4;
L'esempio seguente utilizza la funzione
JSON_REMOVE
per rimuovere la proprietà is_blocked
da un nodo Account
. Dopo
l'esecuzione, tutte le altre proprietà esistenti rimangono invariate.
UPDATE GraphNode
SET properties = JSON_REMOVE(
properties,
'$.is_blocked'
)
WHERE label = "account" AND id = 16;
Elimina i dati del grafico
Il seguente esempio elimina il collegamento Transfers
sui nodi Account
che
sono stati trasferiti ad account bloccati.
DELETE FROM GraphEdge
WHERE label = "transfers" AND id IN {
GRAPH FinGraph
MATCH (a:Account)-[:Transfers]->{1,2}(:Account {is_blocked: TRUE})
RETURN a.id
}
Limitazioni note
Questa sezione elenca le limitazioni dell'utilizzo della gestione dei dati senza schema.
Requisito di una singola tabella per le etichette dinamiche
Puoi avere una sola tabella dei nodi se nella sua definizione viene utilizzata un'etichetta dinamica. Questa limitazione si applica anche alla tabella degli archi. Spanner non consente quanto segue:
- Definizione di una tabella dei nodi con un'etichetta dinamica insieme a qualsiasi altra tabella dei nodi.
- Definizione di una tabella degli archi con un'etichetta dinamica insieme a qualsiasi altra tabella degli archi.
- Definizione di più tabelle dei nodi o più tabelle degli archi che utilizzano ciascuna un'etichetta dinamica.
Ad esempio, il seguente codice non riesce a creare più nodi del grafico con etichette dinamiche.
CREATE OR REPLACE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNodeOne
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties),
GraphNodeTwo
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties),
Account
LABEL Account PROPERTIES(create_time)
)
EDGE TABLES (
...
);
I nomi delle etichette devono essere minuscoli
Per la corrispondenza, devi memorizzare i valori delle stringhe delle etichette in minuscolo. Ti consigliamo di applicare questa regola nel codice dell'applicazione o utilizzando i vincoli dello schema.
Sebbene i valori delle stringhe delle etichette debbano essere memorizzati in minuscolo, non sono sensibili alle maiuscole quando li fai riferimento in una query.
Il seguente esempio mostra come inserire etichette in valori minuscoli:
INSERT INTO GraphNode (id, label) VALUES (1, "account");
INSERT INTO GraphNode (id, label) VALUES (2, "account");
Puoi utilizzare etichette senza distinzione tra maiuscole e minuscole per trovare corrispondenze con GraphNode
o GraphEdge
.
GRAPH FinGraph
MATCH (accnt:Account {id: 1})-[:Transfers]->(dest_accnt:Account)
RETURN dest_accnt.id;
I nomi delle proprietà devono essere in minuscolo
Devi memorizzare i nomi delle proprietà in lettere minuscole. Ti consigliamo di applicare questa regola nel codice dell'applicazione o utilizzando i vincoli dello schema.
Anche se i nomi delle proprietà devono essere memorizzati in minuscolo, non sono sensibili alle maiuscole quando li fai riferimento nella query.
L'esempio seguente inserisce le proprietà name
e age
utilizzando le lettere minuscole.
INSERT INTO GraphNode (id, label, properties)
VALUES (25, "person", JSON '{"name": "Kim", "age": 27}');
Nel testo della query, i nomi delle proprietà non fanno distinzione tra maiuscole e minuscole. Ad esempio, puoi utilizzare Age
o age
per accedere alla proprietà.
GRAPH FinGraph
MATCH (n:Person {Age: 27})
RETURN n.id;
Limitazioni aggiuntive
- I modelli Spanner utilizzano solo le chiavi di primo livello del tipo di dati
JSON
come proprietà. - I tipi di dati delle proprietà devono essere conformi alle specifiche del tipo JSON di Spanner.
Best practice per i dati senza schema
Questa sezione descrive le best practice che ti aiutano a modellare i dati senza schema.
Definisci le chiavi primarie per nodi e archi
La chiave di un nodo deve essere univoca in tutti i nodi del grafico. Ad esempio, come colonna INT64
o stringa
UUID
.
Se esistono più archi tra due nodi, introduci un identificatore univoco per l'arco. L'esempio di schema utilizza una colonna INT64
edge_id
della logica dell'applicazione.
Quando crei lo schema per le tabelle dei nodi e degli archi, includi facoltativamente la colonna
label
come colonna di chiave
primaria se il valore
è immutabile. Se lo fai, la chiave composita formata da tutte le colonne chiave deve
essere univoca in tutti i nodi o gli archi. Questa tecnica migliora le prestazioni per
le query filtrate solo per etichetta.
Per saperne di più sulla scelta della chiave primaria, vedi Scegliere una chiave primaria.
Crea un indice secondario per una proprietà a cui si accede di frequente
Per migliorare il rendimento delle query per una proprietà utilizzata spesso nei filtri, crea un indice secondario in base a una colonna della proprietà generata. Poi, utilizzalo in uno schema e nelle query del grafico.
L'esempio seguente mostra come aggiungere una colonna age
generata alla tabella GraphNode
per un nodo person
. Il valore è NULL
per i nodi senza l'etichetta
person
.
ALTER TABLE GraphNode
ADD COLUMN person_age INT64 AS
(IF (label = "person", LAX_INT64(properties.age), NULL));
La seguente istruzione DDL crea quindi un NULL FILTERED INDEX
per person_age
e lo interleave nella tabella GraphNode
per l'accesso locale.
CREATE NULL_FILTERED INDEX IdxPersonAge
ON GraphNode(id, label, person_age), INTERLEAVE IN GraphNode;
La tabella GraphNode
include nuove colonne disponibili come proprietà dei nodi del grafico. Per riflettere questo aspetto nella definizione del grafico delle proprietà, utilizza l'istruzione CREATE OR
REPLACE PROPERTY GRAPH
. In questo modo, la definizione viene ricompilata e include
la nuova colonna person_age
come proprietà.
Per ulteriori informazioni, consulta la sezione Aggiornamento delle definizioni di nodi o archi esistenti.
La seguente istruzione ricompila la definizione e include la nuova
colonna person_age
come proprietà.
CREATE OR REPLACE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNode
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
)
EDGE TABLES (
GraphEdge
SOURCE KEY (id) REFERENCES GraphNode (id)
DESTINATION KEY (dest_id) REFERENCES GraphNode (id)
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
);
L'esempio seguente esegue una query con la proprietà indicizzata.
GRAPH FinGraph
MATCH (person:Person {person_age: 43})
RETURN person.id, person.name;
(Facoltativo) Esegui il comando ANALYZE
dopo la creazione dell'indice in modo che l'ottimizzatore delle query venga aggiornato con le statistiche
del database più recenti.
Utilizzare i vincoli di controllo per l'integrità dei dati
Spanner supporta oggetti schema come i vincoli di controllo per applicare l'integrità dei dati di etichette e proprietà. Questa sezione elenca i suggerimenti per i vincoli di controllo che puoi utilizzare con i dati senza schema.
Applica valori etichetta
Ti consigliamo di utilizzare NOT NULL
nella definizione della colonna delle etichette per evitare
valori delle etichette non definiti.
CREATE TABLE GraphNode (
id INT64 NOT NULL,
label STRING(MAX) NOT NULL,
properties JSON,
) PRIMARY KEY (id);
Applica nomi di proprietà e valori etichetta in minuscolo
Poiché i nomi delle etichette e delle proprietà devono essere memorizzati come valori in minuscolo, esegui una delle seguenti operazioni:
- Applica il controllo nella logica dell'applicazione.
- Crea vincoli check nello schema.
Al momento della query, il nome dell'etichetta e della proprietà non fa distinzione tra maiuscole e minuscole.
L'esempio seguente mostra come aggiungere un vincolo di etichetta del nodo alla tabella GraphNode
per garantire che l'etichetta sia in minuscolo.
ALTER TABLE GraphNode ADD CONSTRAINT NodeLabelLowerCaseCheck
CHECK(LOWER(label) = label);
L'esempio seguente mostra come aggiungere un vincolo di controllo al nome della proprietà edge. Il controllo utilizza
JSON_KEYS
per
accedere alle chiavi di primo livello.
COALESCE
converte l'output in un array vuoto se JSON_KEYS
restituisce NULL
e poi
verifica che ogni chiave sia in minuscolo.
ALTER TABLE GraphEdge ADD CONSTRAINT EdgePropertiesLowerCaseCheck
CHECK(NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));
Imponi l'esistenza delle proprietà
Crea un vincolo che controlla se esiste una proprietà per un'etichetta.
Nell'esempio seguente, il vincolo verifica se un nodo person
ha una proprietà name
.
ALTER TABLE GraphNode
ADD CONSTRAINT NameMustExistForPersonConstraint
CHECK (IF(label = 'person', properties.name IS NOT NULL, TRUE));
Imporre proprietà univoche
Crea vincoli basati sulle proprietà che controllano se la proprietà di un nodo o di un arco è univoca tra i nodi o gli archi con la stessa etichetta. Per farlo, utilizza un UNIQUE INDEX rispetto alle colonne generate delle proprietà.
Nell'esempio seguente, l'indice univoco verifica che le proprietà name
e country
combinate siano univoche per qualsiasi nodo person
.
Aggiungi una colonna generata per
PersonName
.ALTER TABLE GraphNode ADD COLUMN person_name STRING(MAX) AS (IF(label = 'person', STRING(properties.name), NULL)) Hidden;
Aggiungi una colonna generata per
PersonCountry
.ALTER TABLE GraphNode ADD COLUMN person_country STRING(MAX) AS (IF(label = 'person', STRING(properties.country), NULL)) Hidden;
Crea un indice univoco
NULL_FILTERED
in base alle proprietàPersonName
ePersonCountry
.CREATE UNIQUE NULL_FILTERED INDEX NameAndCountryMustBeUniqueForPerson ON GraphNode (person_name, person_country);
Forzare il tipo di dati della proprietà
Forza un tipo di dati della proprietà utilizzando un vincolo del tipo di dati su un valore della proprietà
per un'etichetta, come mostrato nell'esempio seguente. Questo esempio utilizza la funzione
JSON_TYPE
per verificare che la proprietà name
dell'etichetta person
utilizzi il tipo
STRING
.
ALTER TABLE GraphNode
ADD CONSTRAINT PersonNameMustBeStringTypeConstraint
CHECK (IF(label = 'person', JSON_TYPE(properties.name) = 'string', TRUE));
Combinare etichette definite e dinamiche
Spanner consente ai nodi nel grafico delle proprietà di avere sia etichette definite (nello schema) sia etichette dinamiche (derivate dai dati). Personalizza le etichette per sfruttare questa flessibilità.
Considera lo schema seguente che mostra la creazione della tabella GraphNode
:
CREATE OR REPLACE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNode
LABEL Entity -- Defined label
DYNAMIC LABEL (label) -- Dynamic label from data column 'label'
DYNAMIC PROPERTIES (properties)
);
In questo caso, ogni nodo creato da GraphNode
ha l'etichetta defined Entity
. Inoltre, ogni nodo ha un'etichetta dinamica determinata dal valore nella colonna
dell'etichetta.
Poi, scrivi query che corrispondono ai nodi in base al tipo di etichetta. Ad esempio,
la seguente query trova i nodi utilizzando l'etichetta Entity
definita:
GRAPH FinGraph
MATCH (node:Entity {id: 1}) -- Querying by the defined label
RETURN node.name;
Anche se questa query utilizza l'etichetta definita Entity
, ricorda che il
nodo corrispondente contiene anche un'etichetta dinamica in base ai suoi dati.
Esempi di schema
Utilizza gli esempi di schema in questa sezione come modelli per creare i tuoi schemi. I componenti chiave dello schema includono:
- Creazione di tabelle di input del grafico
- Creazione del grafico delle proprietà
- (Facoltativo) Indice di attraversamento degli archi inverso per migliorare il rendimento dell'attraversamento inverso
- (Facoltativo) Etichetta l'indice per migliorare il rendimento delle query per etichette
- (Facoltativo) Vincoli dello schema per applicare etichette in minuscolo e nomi delle proprietà
Il seguente esempio mostra come creare tabelle di input e un grafico delle proprietà:
CREATE TABLE GraphNode (
id INT64 NOT NULL,
label STRING(MAX) NOT NULL,
properties JSON
) PRIMARY KEY (id);
CREATE TABLE GraphEdge (
id INT64 NOT NULL,
dest_id INT64 NOT NULL,
edge_id INT64 NOT NULL,
label STRING(MAX) NOT NULL,
properties JSON
) PRIMARY KEY (id, dest_id, edge_id),
INTERLEAVE IN PARENT GraphNode;
CREATE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNode
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
)
EDGE TABLES (
GraphEdge
SOURCE KEY (id) REFERENCES GraphNode(id)
DESTINATION KEY (dest_id) REFERENCES GraphNode(id)
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
);
L'esempio seguente utilizza un indice per migliorare l'attraversamento degli archi inversi. La clausola
STORING (properties)
include una copia delle proprietà dei bordi, il che velocizza
le query che filtrano in base a queste proprietà. Puoi omettere la clausola
STORING (properties)
se le tue query non ne traggono vantaggio.
CREATE INDEX R_EDGE ON GraphEdge (dest_id, id, edge_id) STORING (properties),
INTERLEAVE IN GraphNode;
Il seguente esempio utilizza un indice delle etichette per velocizzare la corrispondenza dei nodi in base alle etichette.
CREATE INDEX IDX_NODE_LABEL ON GraphNode (label);
L'esempio seguente aggiunge vincoli che impongono etichette e proprietà in lettere minuscole. Gli ultimi due esempi utilizzano la funzione
JSON_KEYS
. Se vuoi, puoi applicare il controllo delle lettere minuscole nella logica dell'applicazione.
ALTER TABLE GraphNode ADD CONSTRAINT node_label_lower_case
CHECK(LOWER(label) = label);
ALTER TABLE GraphEdge ADD CONSTRAINT edge_label_lower_case
CHECK(LOWER(label) = label);
ALTER TABLE GraphNode ADD CONSTRAINT node_property_keys_lower_case
CHECK(
NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));
ALTER TABLE GraphEdge ADD CONSTRAINT edge_property_keys_lower_case
CHECK(
NOT array_includes(COALESCE(JSON_KEYS(properties, 1), []), key->key<>LOWER(key)));
Ottimizzare gli aggiornamenti batch delle proprietà dinamiche con DML
La modifica delle proprietà dinamiche utilizzando funzioni come
JSON_SET
e
JSON_REMOVE
comporta operazioni di lettura, modifica e scrittura. Ciò può comportare un costo maggiore rispetto
all'aggiornamento delle proprietà di tipo STRING
o INT64
.
Se i carichi di lavoro comportano aggiornamenti batch alle proprietà dinamiche utilizzando DML, segui i consigli riportati di seguito per ottenere prestazioni migliori:
Aggiorna più righe in una singola istruzione DML anziché elaborare le righe singolarmente.
Quando aggiorni un intervallo di chiavi ampio, raggruppa e ordina le righe interessate in base alle chiavi primarie. L'aggiornamento di intervalli non sovrapposti con ogni DML riduce la contesa di blocco.
Utilizza i parametri di query nelle istruzioni DML anziché codificarli in modo rigido per migliorare il rendimento.
In base a questi suggerimenti, l'esempio seguente mostra come aggiornare la proprietà is_blocked
per 100 nodi in un'unica istruzione DML. I parametri
della query includono:
@node_ids
: chiavi delle righeGraphNode
, memorizzate in un parametroARRAY
. Se applicabile, il raggruppamento e l'ordinamento tra i DML consentono di ottenere prestazioni migliori.@is_blocked_values
: i valori corrispondenti da aggiornare, archiviati in un parametroARRAY
.
UPDATE GraphNode
SET properties = JSON_SET(
properties,
'$.is_blocked',
CASE id
WHEN @node_ids[OFFSET(0)] THEN @is_blocked_values[OFFSET(0)]
WHEN @node_ids[OFFSET(1)] THEN @is_blocked_values[OFFSET(1)]
...
WHEN @node_ids[OFFSET(99)] THEN @is_blocked_values[OFFSET(99)]
END,
create_if_missing => TRUE)
WHERE id IN UNNEST(@node_ids)
Risoluzione dei problemi
Questa sezione descrive come risolvere i problemi relativi ai dati senza schema.
La proprietà compare più volte nel risultato TO_JSON
Problema
Il seguente nodo modella le proprietà birthday
e name
come proprietà dinamiche nella colonna JSON
. Le proprietà birthday
e name
duplicate
vengono visualizzate nel risultato JSON dell'elemento del grafico.
GRAPH FinGraph
MATCH (n: Person {id: 14})
RETURN SAFE_TO_JSON(n) AS n;
Vengono restituiti risultati simili ai seguenti:
{
…,
"properties": {
"birthday": "1991-12-21 00:00:00",
"name": "Alex",
"id": 14,
"label": "person",
"properties": {
"birthday": "1991-12-21 00:00:00",
"name": "Alex"
}
}
…
}
Possibile causa
Per impostazione predefinita, tutte le colonne della tabella di base sono definite come proprietà. L'utilizzo di
TO_JSON
o
SAFE_TO_JSON
per restituire elementi del grafico genera proprietà duplicate. Ciò si verifica perché
la colonna JSON
(properties
) è una proprietà definita dallo schema, mentre
le chiavi di primo livello di JSON
sono modellate come proprietà dinamiche.
Soluzione consigliata
Per evitare questo comportamento, utilizza la clausola PROPERTIES ALL COLUMNS EXCEPT
per escludere la colonna properties
quando definisci le proprietà nello
schema, come mostrato nell'esempio seguente:
CREATE OR REPLACE PROPERTY GRAPH FinGraph
NODE TABLES (
GraphNode
PROPERTIES ALL COLUMNS EXCEPT (properties)
DYNAMIC LABEL (label)
DYNAMIC PROPERTIES (properties)
);
Dopo la modifica dello schema, gli elementi del grafico restituiti del tipo di dati JSON
non hanno duplicati.
GRAPH FinGraph
MATCH (n: Person {id: 1})
RETURN TO_JSON(n) AS n;
Questa query restituisce quanto segue:
{
…
"properties": {
"birthday": "1991-12-21 00:00:00",
"name": "Alex",
"id": 1,
"label": "person",
}
}
Problemi comuni quando i valori delle proprietà non vengono convertiti correttamente
Per risolvere i seguenti problemi, utilizza sempre le conversioni del valore della proprietà quando utilizzi una proprietà all'interno di un'espressione di query.
Confronto dei valori delle proprietà senza conversione
Problema
No matching signature for operator = for argument types: JSON, STRING
Possibile causa
La query non converte correttamente i valori delle proprietà. Ad esempio, la proprietà name
non viene convertita nel tipo STRING
nel confronto:
GRAPH FinGraph
MATCH (p:Person)
WHERE p.name = "Alex"
RETURN p.id;
Soluzione consigliata
Per risolvere il problema, utilizza una conversione di valori prima del confronto.
GRAPH FinGraph
MATCH (p:Person)
WHERE STRING(p.name) = "Alex"
RETURN p.id;
Vengono restituiti risultati simili ai seguenti:
+------+
| id |
+------+
| 1 |
+------+
In alternativa, utilizza un filtro delle proprietà per semplificare
i confronti di uguaglianza in cui la conversione del valore avviene automaticamente. Tieni presente che
il tipo di valore ("Alex") deve corrispondere esattamente al tipo STRING
della proprietà in
JSON
.
GRAPH FinGraph
MATCH (p:Person {name: 'Alex'})
RETURN p.id;
Vengono restituiti risultati simili ai seguenti:
+------+
| id |
+------+
| 1 |
+------+
Utilizzo del valore della proprietà RETURN DISTINCT
senza conversione
Problema
Column order_number_str of type JSON cannot be used in `RETURN DISTINCT
Possibile causa
Nell'esempio seguente, order_number_str
non è stato convertito prima di essere
utilizzato nell'istruzione RETURN DISTINCT
:
GRAPH FinGraph
MATCH -[t:Transfers]->
RETURN DISTINCT t.order_number_str AS order_number_str;
Soluzione consigliata
Per risolvere il problema, utilizza una conversione di valore prima del giorno RETURN DISTINCT
.
GRAPH FinGraph
MATCH -[t:Transfers]->
RETURN DISTINCT STRING(t.order_number_str) AS order_number_str;
Vengono restituiti risultati simili ai seguenti:
+-----------------+
| order_number_str|
+-----------------+
| 302290001255747 |
| 103650009791820 |
| 304330008004315 |
| 304120005529714 |
+-----------------+
Proprietà utilizzata come chiave di raggruppamento senza conversione
Problema
Grouping by expressions of type JSON is not allowed.
Possibile causa
Nell'esempio seguente, t.order_number_str
non viene convertito prima di essere utilizzato
per raggruppare gli oggetti JSON:
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN t.order_number_str, COUNT(*) AS total_transfers;
Soluzione consigliata
Per risolvere il problema, utilizza una conversione del valore prima di utilizzare la proprietà come chiave di raggruppamento.
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN STRING(t.order_number_str) AS order_number_str, COUNT(*) AS total_transfers;
Vengono restituiti risultati simili ai seguenti:
+-----------------+------------------+
| order_number_str | total_transfers |
+-----------------+------------------+
| 302290001255747 | 1 |
| 103650009791820 | 1 |
| 304330008004315 | 1 |
| 304120005529714 | 2 |
+-----------------+------------------+
Proprietà utilizzata come chiave di ordinamento senza conversione
Problema
ORDER BY does not support expressions of type JSON
Possibile causa
Nell'esempio seguente, t.amount
non viene convertito prima di essere utilizzato per
ordinare i risultati:
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN a.Id AS from_account, b.Id AS to_account, t.amount
ORDER BY t.amount DESC
LIMIT 1;
Soluzione consigliata
Per risolvere il problema, esegui una conversione su t.amount
nella clausola ORDER BY
.
GRAPH FinGraph
MATCH (a:Account)-[t:Transfers]->(b:Account)
RETURN a.Id AS from_account, b.Id AS to_account, t.amount
ORDER BY DOUBLE(t.amount) DESC
LIMIT 1;
Vengono restituiti risultati simili ai seguenti:
+--------------+------------+--------+
| from_account | to_account | amount |
+--------------+------------+--------+
| 20 | 7 | 500 |
+--------------+------------+--------+
Mancata corrispondenza del tipo durante la conversione
Problema
The provided JSON input is not an integer
Possibile causa
Nell'esempio seguente, la proprietà order_number_str
viene memorizzata come tipo di dati JSON
STRING
. Se provi a eseguire una conversione in INT64
, viene restituito un
errore.
GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE INT64(e.order_number_str) = 302290001255747
RETURN e.amount;
Soluzione consigliata
Per risolvere il problema, utilizza il convertitore di valori esatti che corrisponde al tipo di valore.
GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE STRING(e.order_number_str) = "302290001255747"
RETURN e.amount;
Vengono restituiti risultati simili ai seguenti:
+-----------+
| amount |
+-----------+
| JSON"200" |
+-----------+
In alternativa, utilizza un convertitore flessibile quando il valore è convertibile nel tipo di destinazione, come mostrato nell'esempio seguente:
GRAPH FinGraph
MATCH -[e:Transfers]->
WHERE LAX_INT64(e.order_number_str) = 302290001255747
RETURN e.amount;
Vengono restituiti risultati simili ai seguenti:
+-----------+
| amount |
+-----------+
| JSON"200" |
+-----------+
Passaggi successivi
- Per saperne di più su JSON, consulta Modificare i dati JSON e Elenco delle funzioni JSON.
- Confronta Spanner Graph e openCypher.
- Esegui la migrazione a Spanner Graph.