Mappa i nomi degli oggetti SQL per la traduzione batch

Questo documento descrive come configurare la mappatura dei nomi per rinominare gli oggetti SQL durante la traduzione batch.

Panoramica

La mappatura dei nomi ti consente di identificare i nomi degli oggetti SQL nei file di origine e di specificare i nomi di destinazione per questi oggetti in BigQuery. Puoi utilizzare alcuni dei seguenti componenti o tutti per configurare la mappatura dei nomi per un oggetto:

  • Una regola di mappatura dei nomi, composta da:
    • Le parti del nome di origine che forniscono il nome completo di l'oggetto nel sistema di origine.
    • Un tipo che identifica il tipo dell'oggetto di origine.
    • Parti del nome della destinazione che forniscono il nome dell'oggetto in BigQuery.
  • Un nome di database predefinito da utilizzare con gli oggetti di origine che non ne specificano uno.
  • Il nome di uno schema predefinito da utilizzare con gli oggetti di origine che non ne specificano uno.

Assegna un nome alle parti

Devi fornire i valori per i nomi degli oggetti di origine e di destinazione in una mappatura dei nomi utilizzando una combinazione delle seguenti parti del nome:

  • Database: il livello più alto della gerarchia dei nomi. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio progetto.
  • Schema: il secondo livello della gerarchia dei nomi. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio dataset.
  • Relazione: il terzo livello della gerarchia dei nomi. La piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio table.
  • Attributo: il livello più basso della gerarchia di denominazione. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio colonna.

Tipi di oggetti

Devi inoltre specificare il tipo di oggetto di origine che rinomini in un una regola di mappatura dei nomi. Sono supportati i seguenti tipi di oggetti:

  • Database: un oggetto di primo livello nella gerarchia degli oggetti, ad esempio database.schema.relation.attribute. La tua piattaforma di origine potrebbe utilizzare un termine alternativo, ad esempio progetto. Specificare database quando il tipo di oggetto modifica tutti i riferimenti alla stringa di origine in le istruzioni DDL e DML.
  • Schema: un oggetto di secondo livello nella gerarchia degli oggetti. La tua fonte piattaforma potrebbe utilizzare un termine alternativo, ad esempio dataset. Se specifichi schema come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine sia negli statement DDL sia in quelli DML.
  • Relation: un oggetto di terzo livello nella gerarchia degli oggetti. La tua fonte piattaforma potrebbe usare un termine alternativo, ad esempio tabella. Se specifichi relation come tipo di oggetto, vengono modificati tutti i riferimenti al stringa di origine nelle istruzioni DDL.
  • Relation alias: alias di un oggetto di terzo livello. Ad esempio, nella query SELECT t.field1, t.field2 FROM myTable t;, t è un alias di relazione. Nella query SELECT field1, field2 FROM schema1.table1, table1 è anche un alias relazione. Se specifichi relation alias come tipo di oggetto, vengono creati alias per tutti riferimenti alla stringa di origine nelle istruzioni DML. Ad esempio, se viene specificato tableA come nome di destinazione, gli esempi precedenti vengono tradotti rispettivamente come SELECT tableA.field1, tableA.field2 FROM myTable AS tableA; e SELECT tableA.field1, tableA.field2 FROM schema1.table1 AS tableA.
  • Function: una procedura, ad esempio create procedure db.test.function1(a int). Specifica function come modifica tutti i riferimenti alla stringa di origine nei file DDL e DML.
  • Attribute: un oggetto di quarto livello nella gerarchia degli oggetti. La tua fonte piattaforma potrebbe utilizzare un termine alternativo per farlo, ad esempio colonna. Se specifichi attribute come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine negli enunciati DDL.
  • Attribute alias: un alias per un oggetto di quarto livello. Ad esempio, nel query SELECT field1 FROM myTable;, field1 è un attributo alias. Se specifichi attribute alias come tipo di oggetto, vengono modificati tutti i riferimenti alla stringa di origine negli enunciati DML.

Parti nome obbligatorie per i tipi di oggetto

Per descrivere un oggetto in una regola di mappatura dei nomi, utilizza le parti del nome identificate per ogni tipo di oggetto nella seguente tabella:

Tipo Nome oggetto di origine Nome dell'oggetto di destinazione
Parte del nome del database Parte del nome dello schema Parte del nome della relazione Parte del nome dell'attributo Parte del nome del database Parte del nome dello schema Parte del nome della relazione Parte nome attributo
Database X X
Schema X X X X
Relation X X X X X X
Function X X X X X X
Attribute X X X X X
Attribute alias X X X X X
Relation alias X X

Database predefinito

Se vuoi aggiungere un nome di progetto BigQuery a tutti gli oggetti tradotti, la cosa più semplice da fare è specificare un nome di database predefinito quando crei un job di traduzione. Questo vale per i file sorgente in cui la denominazione in tre parti, o dove viene utilizzata la denominazione in quattro parti, ma quella più non è specificato.

Ad esempio, se specifichi il nome predefinito del database myproject, allora un valore un'istruzione di origine come SELECT * FROM database.table è tradotta in SELECT * FROM myproject.database.table. Se hai oggetti che usano già un oggetto del nome del database, come SELECT * FROM database.schema.table, allora c'è per utilizzare una regola di mappatura dei nomi per rinominare database.schema.table in myproject.schema.table.

Schema predefinito

Se vuoi specificare completamente tutti i nomi degli oggetti nei file di origine che non utilizzano la denominazione in quattro parti, puoi fornire sia un nome del database predefinito sia un nome dello schema predefinito quando crei un job di traduzione. Il nome dello schema predefinito viene fornito come primo nome dello schema nell'opzione del percorso di ricerca dello schema.

Ad esempio, se specifichi il nome predefinito del database myproject e nome schema predefinito myschema, seguito dalle seguenti istruzioni di origine:

  • SELECT * FROM database.table
  • SELECT * FROM table1

Sono tradotti in:

  • SELECT * FROM myproject.database.table.
  • SELECT * FROM myproject.myschema.table1

Comportamento della regola di mappatura dei nomi

Le sezioni seguenti descrivono il comportamento delle regole di mappatura dei nomi.

L'eredità delle regole avviene lungo la gerarchia degli oggetti

Una modifica del nome che interessa un oggetto di livello superiore influisce sull'oggetto di destinazione e anche su tutti i suoi oggetti secondari nella stessa gerarchia.

Ad esempio, se specifichi la seguente regola di mappatura dei nomi con un oggetto tipo di schema:

Parte del nome Origine Destinazione
Database sales_db sales
Schema cust_mgmt cms
Relazione
Attributo

Quando viene applicato, vengono modificate anche le parti del nome del database e dello schema di tutti gli oggetti relation e attribute nello schema sales_db.cust_mgmt. Per un'istanza, un oggetto relation denominato sales_db.cust_mgmt.history diventa sales.cms.history.

Al contrario, le modifiche ai nomi che interessano gli oggetti di livello inferiore non influiscono di oggetti di livello superiore o uguale nella gerarchia degli oggetti.

Ad esempio, se specifichi la seguente regola di mappatura dei nomi con un tipo di oggetto relation:

Nome della parte Origine Destinazione
Database sales_db sales
Schema cust_mgmt cms
Relazione clients accounts
Attributo

Una volta applicato, nessun altro oggetto in sales_db o sales_db.cust_mgmt livello della gerarchia degli oggetti viene modificato.

Viene applicata la regola più specifica

A un oggetto viene applicata una sola regola di mappatura dei nomi. Se più regole potessero interessa un singolo oggetto, la regola che influisce sulla parte del nome di livello più basso. . Ad esempio, se una regola di mappatura dei nomi di tipo database e un schema la regola di mappatura dei nomi dei tipi può influire sul nome di un oggetto relation, È stata applicata la regola di mappatura dei nomi dei tipi schema.

Utilizza una combinazione univoca di valori di tipo e di origine

Non puoi specificare più di una regola di mappatura dei nomi con lo stesso tipo e origine e i relativi valori. Ad esempio, non puoi specificare entrambe le seguenti regole di mappatura dei nomi:

Regola 1, digita attribute Regola 2, tipo attribute
Parte del nome Origine Destinazione Origine Destinazione
Database project project
Schema dataset1 dataset1
Relazione table1 table1
Attributo lname last_name lname lastname

Crea regole di mappatura dei nomi attribute e attribute alias corrispondenti

Quando utilizzi una regola di mappatura dei nomi di tipo attribute per modificare il nome di un attributo nelle istruzioni DDL, devi creare una regola di mappatura dei nomi attribute alias per modificare il nome dell'attributo anche nelle istruzioni DML.

Le modifiche ai nomi non si applicano in modo ricorsivo

Le modifiche dei nomi non vengono applicate a cascata tra le regole dei nomi. Ad esempio, se hai creato una regola di mappatura dei nomi che rinomina database1 in project1 e un'altra che rinomina project1 in project2, il traduttore non mappa database1 a project2.

Gestire gli oggetti di origine che non hanno nomi in quattro parti

Alcuni sistemi di origine, come Teradata, utilizzano tre parti di nome per qualificare completamente l'oggetto i nomi degli utenti. Molti sistemi di origine consentono inoltre di utilizzare nomi parzialmente qualificati nei loro dialetti SQL, ad esempio utilizzando database1.schema1.table1, schema1.table1 e table1 per fare riferimento allo stesso oggetto in contesti diversi. Se i file di origine contengono oggetti che non utilizzano nomi di oggetti in quattro parti, puoi utilizzare la mappatura dei nomi in combinazione con la specifica di un nome del database predefinito e di un nome dello schema predefinito per ottenere la mappatura dei nomi che preferisci.

Per esempi di utilizzo delle regole di mappatura dei nomi con un nome di database predefinito o un nome schema predefinito, consulta Modificare la parte del nome del database per gli oggetti con diversi livelli di completamento del nome e Modificare il nome di un oggetto relazione parzialmente qualificato.

Esempi di mappatura dei nomi

Utilizza gli esempi in questa sezione per capire come funzionano le regole di mappatura dei nomi per i casi d'uso comuni.

Modifica la parte del nome del database per gli oggetti completi

L'esempio seguente rinomina la parte del nome del database da td_project a bq_project per tutti i tipi di dati database, schema, relation e function che hanno nomi completi.

Parti dei nomi di origine e di destinazione

Parte del nome Origine Destinazione
Database td_project bq_project
Schema
Relazione
Attributo

Tipo

  • database

Input di esempio

  • SELECT * FROM td_project.schema.table;
  • SELECT * FROM td_project.schema1.table1;

Output di esempio

  • SELECT * FROM bq_project.schema.table;
  • SELECT * FROM bq_project.schema1.table1

Modificare la parte del nome del database per gli oggetti con diversi livelli di completamento del nome

L'esempio seguente rinomina la parte del nome del database project in bq_project per tutti i tipi di oggetti e aggiunge bq_project come parte del nome del database per gli oggetti che non ne specificano uno.

Per farlo, devi specificare un valore predefinito del database quando configuri di traduzione automatica, oltre a specificare regole di mappatura dei nomi. Per maggiori informazioni informazioni su come specificare un nome di database predefinito, consulta Invia un job di traduzione.

Valore predefinito del database

  • project

Parti del nome di origine e di destinazione

Parte del nome Origine Destinazione
Database project bq_project
Schema
Relazione
Attributo

Tipo

  • database

Input di esempio

  • SELECT * FROM project.schema.table;
  • SELECT * FROM schema1.table1;

Output di esempio

  • SELECT * FROM bq_project.schema.table;
  • SELECT * FROM bq_project.schema1.table1

Modificare la parte del nome del database e la parte del nome dello schema per gli oggetti completamente qualificati

Nell'esempio seguente la parte del nome del database warehouse1 viene modificata in myproject e anche la parte del nome dello schema database1 viene modificata in mydataset.

Puoi anche modificare le parti del nome di un oggetto relation nella allo stesso modo, utilizzando un tipo relation e specificando origine e destinazione per la parte del nome della relazione.

Parti del nome di origine e di destinazione

Parte del nome Origine Destinazione
Database warehouse1 myproject
Schema database1 mydataset
Relazione
Attributo

Tipo

  • schema

Input di esempio

  • SELECT * FROM warehouse1.database1.table1;
  • SELECT * FROM database2.table2;

Output di esempio

  • SELECT * FROM myproject.mydataset.table1;
  • SELECT * FROM __DEFAULT_DATABASE__.database2.table2;

Modificare un nome completo dell'oggetto relation

L'esempio seguente rinomina mydb.myschema.mytable in mydb.myschema.table1.

Parti dei nomi di origine e di destinazione

Parte del nome Origine Destinazione
Database mydb mydb
Schema myschema myschema
Relazione mytable table1
Attributo

Tipo

  • relation

Input di esempio

  • CREATE table mydb.myschema.mytable(id int, name varchar(64));

Output di esempio

  • CREATE table mydb.myschema.table1(id integer, name string(64));

Modificare un nome di oggetto relation parzialmente qualificato

L'esempio seguente rinomina myschema.mytable in mydb.myschema.table1.

Valore predefinito del database

  • mydb

Parti del nome di origine e di destinazione

Parte del nome Origine Destinazione
Database mydb mydb
Schema myschema myschema
Relazione mytable table1
Attributo

Tipo

  • relation

Input di esempio

  • CREATE table myschema.mytable(id int, name varchar(64));

Output di esempio

  • CREATE table mydb.myschema.table1(id integer, name string(64));

Modifica il nome di un oggetto relation alias

L'esempio seguente rinomina tutte le istanze dell'oggetto relation alias table in t.

Parti del nome di origine e di destinazione

Parte del nome Origine Destinazione
Database
Schema
Relazione table t
Attributo

Tipo

  • relation alias

Input di esempio

  • SELECT table.id, table.name FROM mydb.myschema.mytable table

Output di esempio

  • SELECT t.id, t.name FROM mydb.myschema.mytable AS t

Modificare il nome di un oggetto function

Nell'esempio seguente mydb.myschema.myfunction viene rinominato in mydb.myschema.function1.

Parti dei nomi di origine e di destinazione

Parte del nome Origine Destinazione
Database mydb mydb
Schema myschema myschema
Relazione myprocedure procedure1
Attributo

Tipo

  • function

Input di esempio

  • CREATE PROCEDURE mydb.myschema.myprocedure(a int) BEGIN declare i int; SET i = a + 1; END;
  • CALL mydb.myschema.myprocedure(7)

Output di esempio

  • CREATE PROCEDURE mydb.myschema.procedure1(a int) BEGIN declare i int; SET i = a + 1; END;
  • CALL mydb.myschema.procedure1(7);

Modificare il nome di un oggetto attribute

L'esempio seguente rinomina mydb.myschema.mytable.myfield in mydb.myschema.mytable.field1. Poiché attribute oggetti sono al livello più basso livello della gerarchia degli oggetti, questa mappatura dei nomi non cambia il nome di qualsiasi altro oggetto.

Parti del nome di origine e di destinazione

Parte del nome Origine Destinazione
Database mydb
Schema myschema
Relazione mytable
Attributo myfield field1

Tipo

  • attribute

Input di esempio

  • CREATE table mydb.myschema.mytable(myfield int, name varchar(64), revenue int);

Output di esempio

  • CREATE table mydb.myschema.mytable(field1 int, name varchar(64), revenue int);

Modificare il nome di un oggetto attribute alias

Nell'esempio seguente mydb.myschema.mytable.myfield viene rinominato in mydb.myschema.mytable.field1. Poiché attribute alias oggetti si trovano livello più basso della gerarchia degli oggetti, questa mappatura dei nomi non modifica di qualsiasi altro oggetto.

Parti dei nomi di origine e di destinazione

Parte del nome Origine Destinazione
Database mydb
Schema myschema
Relazione mytable
Attributo myfield field1

Tipo

  • attribute alias

Input di esempio

  • SELECT myfield, name FROM mydb.myschema.mytable;

Output di esempio

  • SELECT field1, name FROM mydb.myschema.mytable;

Formato file JSON

Se scegli di specificare le regole di mappatura dei nomi utilizzando un file JSON anziché la console Google Cloud, il file JSON deve seguire questo formato:

{
  "name_map": [
    {
      "source": {
        "type": "string",
        "database": "string",
        "schema": "string",
        "relation": "string",
        "attribute": "string"
      },
      "target": {
        "database": "string",
        "schema": "string",
        "relation": "string",
        "attribute": "string"
      }
    }
  ]
}

Le dimensioni del file devono essere inferiori a 5 MB.

Per ulteriori informazioni sulla specifica di regole di mappatura dei nomi per un job di traduzione, consulta Invia un job di traduzione.

Esempi JSON

Gli esempi seguenti mostrano come specificare le regole di mappatura dei nomi utilizzando JSON.

Esempio 1

Le regole di mappatura dei nomi in questo esempio apportano le seguenti modifiche ai nomi degli oggetti:

  • Rinomina le istanze dell'oggetto project.dataset2.table2 relation in bq_project.bq_dataset2.bq_table2.
  • Rinomina tutte le istanze dell'oggetto project database in bq_project. Per ad esempio project.mydataset.table2 diventa bq_project.mydataset.table2, e CREATE DATASET project.mydataset diventa CREATE DATASET bq_project.mydataset.
{
  "name_map": [{
    "source": {
      "type": "RELATION",
      "database": "project",
      "schema": "dataset2",
      "relation": "table2"
    },
    "target": {
      "database": "bq_project",
      "schema": "bq_dataset2",
      "relation": "bq_table2"
    }
  }, {
    "source": {
      "type": "DATABASE",
      "database": "project"
    },
    "target": {
      "database": "bq_project"
    }
  }]
}

Esempio 2

Le regole di mappatura dei nomi in questo esempio apportano le seguenti modifiche ai nomi degli oggetti:

  • Rinomina le istanze dell'oggetto project.dataset2.table2.field1 attribute in bq_project.bq_dataset2.bq_table2.bq_field sia nelle istruzioni DDL che DML.
{
  "name_map": [{
    "source": {
      "type": "ATTRIBUTE",
      "database": "project",
      "schema": "dataset2",
      "relation": "table2",
      "attribute": "field1"
    },
    "target": {
      "database": "bq_project",
      "schema": "bq_dataset2",
      "relation": "bq_table2",
      "attribute": "bq_field"
    }
  }, {
    "source": {
      "type": "ATTRIBUTE_ALIAS",
      "database": "project",
      "schema": "dataset2",
      "relation": "table2",
      "attribute": "field1"
    },
    "target": {
      "database": "bq_project",
      "schema": "bq_dataset2",
      "relation": "bq_table2",
      "attribute": "bq_field"
    }
  }]
}