Mappa i nomi degli oggetti SQL per la traduzione batch
Questo documento descrive come configurare la mappatura dei nomi per rinominare gli oggetti SQL durante la traduzione batch.
Panoramica
La mappatura dei nomi consente di identificare i nomi degli oggetti SQL nei file di origine e specificare i nomi di destinazione per questi oggetti in BigQuery. Puoi utilizzare alcuni o tutti i seguenti componenti per configurare la mappatura dei nomi per un oggetto:
- Una regola di mappatura dei nomi, composta da:
- Parti del nome di origine che forniscono il nome completo dell'oggetto nel sistema di origine.
- Un type che identifica il tipo di oggetto di origine.
- Scegli come target parti del nome che forniscono il nome dell'oggetto in BigQuery.
- Un nome del database predefinito da utilizzare con tutti gli oggetti di origine che non ne specificano uno.
- Un nome di schema predefinito da utilizzare con tutti gli oggetti di origine che non ne specificano uno.
Denominare le parti
Devi fornire i valori dei nomi degli oggetti di origine e di destinazione in una regola di mappatura dei nomi utilizzando una combinazione delle seguenti parti del nome:
- Database: il livello più alto della gerarchia di denominazione. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio progetto.
- Schema: il secondo livello della gerarchia di denominazione. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio set di dati.
- Relazione: il terzo livello della gerarchia di denominazione. La piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio tabella.
- Attributo: il livello più basso della gerarchia di denominazione. La piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio colonna.
Tipi di oggetti
Devi inoltre specificare il tipo di oggetto di origine che rinomini in una regola di mappatura dei nomi. Sono supportati i seguenti tipi di oggetti:
Database
: un oggetto di primo livello nella gerarchia degli oggetti, ad esempiodatabase
.schema.relation.attribute
. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio progetto. Se specifichidatabase
come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine nelle istruzioni DDL e DML.Schema
: oggetto di secondo livello nella gerarchia degli oggetti. La tua piattaforma di origine potrebbe utilizzare un termine alternativo per lo stesso, ad esempio set di dati. Se specifichischema
come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine nelle istruzioni DDL e DML.Relation
: oggetto di terzo livello nella gerarchia degli oggetti. La tua piattaforma di origine potrebbe utilizzare un termine alternativo per lo stesso, ad esempio tabella. Se specifichirelation
come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine nelle istruzioni DDL.Relation alias
: alias per un oggetto di terzo livello. Ad esempio, nella querySELECT t.field1, t.field2 FROM myTable t;
,t
è un alias di relazione. Nella querySELECT field1, field2 FROM schema1.table1
,table1
è anche un alias di relazione. Se specifichirelation alias
come tipo di oggetto, vengono creati alias per tutti i riferimenti alla stringa di origine nelle istruzioni DML. Ad esempio, setableA
viene specificato come nome di destinazione, gli esempi precedenti vengono tradotti rispettivamente comeSELECT tableA.field1, tableA.field2 FROM myTable AS tableA;
eSELECT tableA.field1, tableA.field2 FROM schema1.table1 AS tableA
.Function
: una procedura, ad esempiocreate procedure db.test.function1(a int)
. Se specifichifunction
come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine nelle istruzioni DDL e DML.Attribute
: oggetto di quarto livello nella gerarchia degli oggetti. La tua piattaforma di origine potrebbe utilizzare un termine alternativo per questo concetto, ad esempio colonna. Se specifichiattribute
come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine nelle istruzioni DDL.Attribute alias
: alias per un oggetto di quarto livello. Ad esempio, nella querySELECT field1 FROM myTable;
,field1
è un alias di attributo. Specificandoattribute alias
come tipo di oggetto si modificano tutti i riferimenti alla stringa di origine nelle istruzioni DML.
Parti dei nomi obbligatorie per i tipi di oggetti
Per descrivere un oggetto in una regola di mappatura dei nomi, utilizza le parti dei nomi identificate per ogni tipo di oggetto nella seguente tabella:
Tipo | Nome dell'oggetto di origine | Nome oggetto di destinazione | ||||||
---|---|---|---|---|---|---|---|---|
Parte del nome del database | Parte del nome dello schema | Parte del nome della relazione | Parte del nome dell'attributo | Parte del nome del database | Parte del nome dello schema | Parte del nome della relazione | Parte del nome dell'attributo | |
Database |
X | X | ||||||
Schema |
X | X | X | X | ||||
Relation |
X | X | X | X | X | X | ||
Function |
X | X | X | X | X | X | ||
Attribute |
X | X | X | X | X | |||
Attribute alias |
X | X | X | X | X | |||
Relation alias |
X | X |
Database predefinito
Se vuoi aggiungere il nome di un progetto BigQuery a tutti gli oggetti tradotti, la cosa più semplice da fare è specificare un nome predefinito del database quando crei un job di traduzione. Questo funziona per i file di origine in cui viene utilizzata la denominazione in tre parti o in cui viene utilizzata la denominazione in quattro parti, ma non viene specificato il nome dell'oggetto di livello più alto.
Ad esempio, se specifichi il nome predefinito del database myproject
, un'istruzione di origine come SELECT * FROM database.table
viene tradotta in SELECT * FROM myproject.database.table
. Se disponi di oggetti che utilizzano già una parte del nome del database, ad esempio SELECT * FROM database.schema.table
, devi utilizzare una regola di mappatura dei nomi per rinominare database.schema.table
in myproject.schema.table
.
Schema predefinito
Se vuoi qualificare completamente tutti i nomi degli oggetti nei file di origine che non utilizzano la denominazione in quattro parti, puoi fornire sia un nome di database predefinito sia un nome di schema predefinito quando crei un job di traduzione. Il nome dello schema predefinito viene fornito come primo nome dello schema nell'opzione del percorso di ricerca dello schema.
Ad esempio, se specifichi il nome predefinito del database myproject
e il nome dello schema predefinito myschema
, vengono riportate le seguenti istruzioni di origine:
SELECT * FROM database.table
SELECT * FROM table1
Vengono tradotte in:
SELECT * FROM myproject.database.table
.SELECT * FROM myproject.myschema.table1
Comportamento delle regole di mappatura dei nomi
Le seguenti sezioni descrivono il comportamento delle regole di mappatura dei nomi.
L'ereditarietà delle regole scorre verso il basso nella gerarchia degli oggetti
Una modifica del nome che interessa un oggetto di livello superiore influisce sull'oggetto di destinazione e anche su tutti i relativi oggetti figlio nella stessa gerarchia.
Ad esempio, se specifichi la seguente regola di mappatura dei nomi con un tipo di oggetto schema
:
Parte del nome | Origine | Destinazione |
---|---|---|
Database | sales_db |
sales |
Schema | cust_mgmt |
cms |
Relazione | ||
Attributo |
Quando viene applicato, vengono modificate anche le parti del nome del database e dello schema di tutti gli oggetti relation
e attribute
nello schema sales_db.cust_mgmt
. Ad
esempio, un oggetto relation
denominato sales_db.cust_mgmt.history
diventa
sales.cms.history
.
Al contrario, le modifiche dei nomi che hanno come target gli oggetti di livello inferiore non influiscono sugli oggetti di livello superiore o dello stesso livello nella gerarchia degli oggetti.
Ad esempio, se specifichi la seguente regola di mappatura dei nomi con un tipo di oggetto relation
:
Parte del nome | Origine | Destinazione |
---|---|---|
Database | sales_db |
sales |
Schema | cust_mgmt |
cms |
Relazione | clients |
accounts |
Attributo |
Dopo l'applicazione, non viene modificato il nome di nessun altro oggetto a livello sales_db
o sales_db.cust_mgmt
della gerarchia degli oggetti.
Viene applicata la regola più specifica
A un oggetto viene applicata una sola regola di mappatura dei nomi. Se un singolo oggetto può interessare più regole, viene applicata la regola che interessa la parte del nome di livello inferiore. Ad esempio, se una regola di mappatura dei nomi di tipo database
e una regola di mappatura dei nomi di tipo schema
potrebbero influire sul nome di un oggetto relation
, viene applicata la regola di mappatura dei nomi di tipo schema
.
Utilizza una combinazione univoca di valori di tipo e origine
Non puoi specificare più di una regola di mappatura dei nomi con lo stesso tipo e valori di origine. Ad esempio, non puoi specificare entrambe le seguenti regole di mappatura dei nomi:
Regola 1, tipo attribute |
Regola 2, tipo attribute |
|||
---|---|---|---|---|
Parte del nome | Origine | Destinazione | Origine | Destinazione |
Database | project |
project |
||
Schema | dataset1 |
dataset1 |
||
Relazione | table1 |
table1 |
||
Attributo | lname |
last_name |
lname |
lastname |
Crea regole di mappatura dei nomi attribute
e attribute alias
corrispondenti
Quando utilizzi una regola di mappatura dei nomi di tipo attribute
per modificare il nome di un attributo
nelle istruzioni DDL, devi creare una regola di mappatura dei nomi attribute alias
per
modificare il nome di tale attributo anche nelle istruzioni DML.
Le modifiche dei nomi non si verificano a cascata
Le modifiche dei nomi non si applicano alle regole sui nomi.
Ad esempio, se hai creato una regola di mappatura dei nomi che rinomina database1
in
project1
e un'altra che rinomina project1
in project2
, il traduttore
non mappa database1
a project2
.
Gestire gli oggetti di origine che non hanno nomi in quattro parti
Alcuni sistemi di origine, come Teradata, utilizzano tre parti dei nomi per qualificare completamente i nomi degli oggetti. Molti sistemi di origine consentono anche di utilizzare nomi parzialmente qualificati nei rispettivi dialetti SQL, ad esempio database1.schema1.table1
, schema1.table1
e table1
per fare riferimento allo stesso oggetto in contesti diversi. Se i file di origine contengono oggetti che non utilizzano nomi di oggetti composti da quattro parti, puoi utilizzare il mapping dei nomi insieme alla specifica di un nome di database predefinito e di un nome di schema predefinito per ottenere il mapping dei nomi desiderato.
Per esempi sull'utilizzo di regole di mappatura dei nomi con un nome di database o un nome di schema predefinito, consulta Modificare la parte del nome del database per gli oggetti con diversi livelli di completamento dei nomi e Modificare un nome di oggetto di relazione parzialmente qualificato.
Esempi di mappatura dei nomi
Utilizza gli esempi in questa sezione per vedere come funzionano le regole di mappatura dei nomi per casi d'uso comuni.
Modifica la parte del nome del database per gli oggetti completi
L'esempio seguente rinomina la parte del nome del database da td_project
a bq_project
per tutti gli oggetti database
, schema
, relation
e function
con nomi completi.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | td_project |
bq_project |
Schema | ||
Relazione | ||
Attributo |
Tipo
database
Input di esempio
SELECT * FROM td_project.schema.table;
SELECT * FROM td_project.schema1.table1;
Output di esempio
SELECT * FROM bq_project.schema.table;
SELECT * FROM bq_project.schema1.table1
Modifica la parte del nome del database per gli oggetti con diversi livelli di completamento dei nomi
L'esempio seguente rinomina la parte del nome del database project
in bq_project
per tutti i tipi di oggetti e aggiunge anche bq_project
come parte del nome del database
per gli oggetti che non ne specificano uno.
A tale scopo, devi specificare un valore di database predefinito quando configuri il job di traduzione, oltre a specificare le regole di mappatura dei nomi. Per ulteriori informazioni su come specificare un nome predefinito del database, consulta Inviare un job di traduzione.
Valore predefinito del database
project
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | project |
bq_project |
Schema | ||
Relazione | ||
Attributo |
Tipo
database
Input di esempio
SELECT * FROM project.schema.table;
SELECT * FROM schema1.table1;
Output di esempio
SELECT * FROM bq_project.schema.table;
SELECT * FROM bq_project.schema1.table1
Modifica la parte del nome del database e la parte del nome dello schema per gli oggetti completi
L'esempio seguente modifica la parte del nome del database warehouse1
in myproject
e anche la parte del nome dello schema database1
in mydataset
.
Puoi anche modificare le parti del nome di un oggetto relation
nello stesso modo, utilizzando un tipo relation
e specificando i valori di origine e di destinazione per la parte del nome della relazione.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | warehouse1 |
myproject |
Schema | database1 |
mydataset |
Relazione | ||
Attributo |
Tipo
schema
Input di esempio
SELECT * FROM warehouse1.database1.table1;
SELECT * FROM database2.table2;
Output di esempio
SELECT * FROM myproject.mydataset.table1;
SELECT * FROM __DEFAULT_DATABASE__.database2.table2;
Modifica un nome completo dell'oggetto relation
L'esempio seguente rinomina mydb.myschema.mytable
in
mydb.myschema.table1
.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | mydb |
mydb |
Schema | myschema |
myschema |
Relazione | mytable |
table1 |
Attributo |
Tipo
relation
Input di esempio
CREATE table mydb.myschema.mytable(id int, name varchar(64));
Output di esempio
CREATE table mydb.myschema.table1(id integer, name string(64));
Modifica il nome di un oggetto relation
parzialmente qualificato
L'esempio seguente rinomina myschema.mytable
in
mydb.myschema.table1
.
Valore predefinito del database
mydb
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | mydb |
mydb |
Schema | myschema |
myschema |
Relazione | mytable |
table1 |
Attributo |
Tipo
relation
Input di esempio
CREATE table myschema.mytable(id int, name varchar(64));
Output di esempio
CREATE table mydb.myschema.table1(id integer, name string(64));
Modifica il nome di un oggetto relation alias
L'esempio seguente rinomina tutte le istanze dell'oggetto relation alias
table
in t
.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | ||
Schema | ||
Relazione | table |
t |
Attributo |
Tipo
relation alias
Input di esempio
SELECT table.id, table.name FROM mydb.myschema.mytable table
Output di esempio
SELECT t.id, t.name FROM mydb.myschema.mytable AS t
Modifica il nome di un oggetto function
L'esempio seguente rinomina mydb.myschema.myfunction
in
mydb.myschema.function1
.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | mydb |
mydb |
Schema | myschema |
myschema |
Relazione | myprocedure |
procedure1 |
Attributo |
Tipo
function
Input di esempio
CREATE PROCEDURE mydb.myschema.myprocedure(a int) BEGIN declare i int; SET i = a + 1; END;
CALL mydb.myschema.myprocedure(7)
Output di esempio
CREATE PROCEDURE mydb.myschema.procedure1(a int) BEGIN declare i int; SET i = a + 1; END;
CALL mydb.myschema.procedure1(7);
Modifica il nome di un oggetto attribute
L'esempio seguente rinomina mydb.myschema.mytable.myfield
in
mydb.myschema.mytable.field1
. Poiché gli oggetti attribute
si trovano al livello più basso della gerarchia degli oggetti, questa mappatura dei nomi non cambia il nome di nessun altro oggetto.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | mydb |
|
Schema | myschema |
|
Relazione | mytable |
|
Attributo | myfield |
field1 |
Tipo
attribute
Input di esempio
CREATE table mydb.myschema.mytable(myfield int, name varchar(64), revenue int);
Output di esempio
CREATE table mydb.myschema.mytable(field1 int, name varchar(64), revenue int);
Modifica il nome di un oggetto attribute alias
L'esempio seguente rinomina mydb.myschema.mytable.myfield
in
mydb.myschema.mytable.field1
. Poiché gli oggetti attribute alias
si trovano al livello più basso della gerarchia degli oggetti, questa mappatura dei nomi non cambia il nome di nessun altro oggetto.
Parti del nome di origine e di destinazione
Parte del nome | Origine | Destinazione |
---|---|---|
Database | mydb |
|
Schema | myschema |
|
Relazione | mytable |
|
Attributo | myfield |
field1 |
Tipo
attribute alias
Input di esempio
SELECT myfield, name FROM mydb.myschema.mytable;
Output di esempio
SELECT field1, name FROM mydb.myschema.mytable;
Formato file JSON
Se scegli di specificare le regole di mappatura dei nomi utilizzando un file JSON anziché la console Google Cloud, il file JSON deve avere questo formato:
{
"name_map": [
{
"source": {
"type": "string",
"database": "string",
"schema": "string",
"relation": "string",
"attribute": "string"
},
"target": {
"database": "string",
"schema": "string",
"relation": "string",
"attribute": "string"
}
}
]
}
Le dimensioni del file devono essere inferiori a 5 MB.
Per maggiori informazioni su come specificare le regole di mappatura dei nomi per un job di traduzione, consulta Inviare un job di traduzione.
Esempi JSON
I seguenti esempi mostrano come specificare le regole di mappatura dei nomi utilizzando file JSON.
Esempio 1
Le regole di mappatura dei nomi in questo esempio apportano le seguenti modifiche ai nomi degli oggetti:
- Rinomina le istanze dell'oggetto
relation
project.dataset2.table2
inbq_project.bq_dataset2.bq_table2
. - Rinomina tutte le istanze dell'oggetto
database
project
inbq_project
. Ad esempio,project.mydataset.table2
diventabq_project.mydataset.table2
eCREATE DATASET project.mydataset
diventaCREATE DATASET bq_project.mydataset
.
{
"name_map": [{
"source": {
"type": "RELATION",
"database": "project",
"schema": "dataset2",
"relation": "table2"
},
"target": {
"database": "bq_project",
"schema": "bq_dataset2",
"relation": "bq_table2"
}
}, {
"source": {
"type": "DATABASE",
"database": "project"
},
"target": {
"database": "bq_project"
}
}]
}
Esempio 2
Le regole di mappatura dei nomi in questo esempio apportano le seguenti modifiche ai nomi degli oggetti:
- Rinomina le istanze dell'oggetto
attribute
project.dataset2.table2.field1
inbq_project.bq_dataset2.bq_table2.bq_field
nelle istruzioni DDL e DML.
{
"name_map": [{
"source": {
"type": "ATTRIBUTE",
"database": "project",
"schema": "dataset2",
"relation": "table2",
"attribute": "field1"
},
"target": {
"database": "bq_project",
"schema": "bq_dataset2",
"relation": "bq_table2",
"attribute": "bq_field"
}
}, {
"source": {
"type": "ATTRIBUTE_ALIAS",
"database": "project",
"schema": "dataset2",
"relation": "table2",
"attribute": "field1"
},
"target": {
"database": "bq_project",
"schema": "bq_dataset2",
"relation": "bq_table2",
"attribute": "bq_field"
}
}]
}