Questa pagina è stata tradotta dall'API Cloud Translation.

Eseguire la migrazione di schema e dati da Teradata

La combinazione di BigQuery Data Transfer Service e di un agente speciale di migrazione ti consente di copiare i dati da un'istanza di data warehouse on-premise Teradata a BigQuery. Questo documento descrive la procedura passo passo per eseguire la migrazione dei dati da Teradata utilizzando BigQuery Data Transfer Service.

Prima di iniziare

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the BigQuery, BigQuery Data Transfer Service, Cloud Storage, and Pub/Sub APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Create a service account:

Ensure that you have the Create Service Accounts IAM role (roles/iam.serviceAccountCreator). Learn how to grant roles.
In the Google Cloud console, go to the Create service account page.
Go to Create service account
Select your project.
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.

In the Service account description field, enter a description. For example, Service account for quickstart.
Click Create and continue.
Grant the following roles to the service account: roles/bigquery.user, roles/storage.objectAdmin, roles/iam.serviceAccountTokenCreator.

To grant a role, find the Select a role list, then select the role.

To grant additional roles, click Add another role and add each additional role.

Note: The Role field affects which resources the service account can access in your project. You can revoke these roles or grant additional roles later.
Click Continue.
Click Done to finish creating the service account.

Do not close your browser window. You will use it in the next step.

Create a service account key:

In the Google Cloud console, click the email address for the service account that you created.
Click Keys.
Click Add key, and then click Create new key.
Click Create. A JSON key file is downloaded to your computer.
Click Close.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the BigQuery, BigQuery Data Transfer Service, Cloud Storage, and Pub/Sub APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Create a service account:

Ensure that you have the Create Service Accounts IAM role (roles/iam.serviceAccountCreator). Learn how to grant roles.
In the Google Cloud console, go to the Create service account page.
Go to Create service account
Select your project.
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.

In the Service account description field, enter a description. For example, Service account for quickstart.
Click Create and continue.
Grant the following roles to the service account: roles/bigquery.user, roles/storage.objectAdmin, roles/iam.serviceAccountTokenCreator.

To grant a role, find the Select a role list, then select the role.

To grant additional roles, click Add another role and add each additional role.

Note: The Role field affects which resources the service account can access in your project. You can revoke these roles or grant additional roles later.
Click Continue.
Click Done to finish creating the service account.

Do not close your browser window. You will use it in the next step.

Create a service account key:

In the Google Cloud console, click the email address for the service account that you created.
Click Keys.
Click Add key, and then click Create new key.
Click Create. A JSON key file is downloaded to your computer.
Click Close.

Le chiavi dei service account rappresentano un rischio per la sicurezza se non vengono gestite correttamente. Sei responsabile della sicurezza della chiave privata e di altre operazioni descritte nelle best practice per la gestione delle chiavi degli account di servizio. Se non riesci a creare una chiave del service account, la creazione di chiavi del service account potrebbe essere disabilitata per la tua organizzazione. Per ulteriori informazioni, vedi Gestione delle risorse dell'organizzazione sicure per impostazione predefinita.

Se hai acquisito la chiave del service account da una fonte esterna, devi convalidarla prima dell'utilizzo. Per maggiori informazioni, consulta Requisiti di sicurezza per le credenziali di origine esterna".

Impostare le autorizzazioni richieste

Assicurati che l'entità che crea il trasferimento disponga dei seguenti ruoli nel progetto contenente il job di trasferimento:

Visualizzatore log (roles/logging.viewer)
Amministratore Storage (roles/storage.admin) o un ruolo personalizzato che concede le seguenti autorizzazioni:
- storage.objects.create
- storage.objects.get
- storage.objects.list
Amministratore BigQuery (roles/bigquery.admin) o un ruolo personalizzato che concede le seguenti autorizzazioni:
- bigquery.datasets.create
- bigquery.jobs.create
- bigquery.jobs.get
- bigquery.jobs.listAll
- bigquery.transfers.get
- bigquery.transfers.update

Crea un set di dati

Crea un set di dati BigQuery per archiviare i dati. Non è necessario creare tabelle.

Crea un bucket Cloud Storage

Crea un bucket Cloud Storage per lo staging dei dati durante il job di trasferimento.

Prepara l'ambiente locale

Completa le attività in questa sezione per preparare l'ambiente locale per il job di trasferimento.

Requisiti del computer locale

L'agente di migrazione utilizza una connessione JDBC con l'istanza Teradata e le API Google Cloud . Assicurati che l'accesso alla rete non sia bloccato da un firewall.
Assicurati che sia installato Java Runtime Environment 8 o versioni successive.
Assicurati di avere spazio di archiviazione sufficiente per il metodo di estrazione che hai scelto, come descritto in Metodo di estrazione.
Se hai deciso di utilizzare l'estrazione Teradata Parallel Transporter (TPT), assicurati che l'utilità tbuild sia installata. Per ulteriori informazioni sulla scelta di un metodo di estrazione, consulta Metodo di estrazione.

Dettagli della connessione Teradata

Assicurati di disporre del nome utente e della password di un utente Teradata con accesso in lettura alle tabelle di sistema e alle tabelle di cui viene eseguita la migrazione.

Il nome utente e la password vengono acquisiti tramite una richiesta e vengono memorizzati solo nella RAM. Se vuoi, puoi creare un file di credenziali per il nome utente o la password in un passaggio successivo. Quando utilizzi un file delle credenziali, adotta le misure appropriate per controllare l'accesso alla cartella in cui lo memorizzi nel file system locale, perché non è criptato.
Assicurati di conoscere il nome host e il numero di porta per connetterti all'istanza Teradata.

Le modalità di autenticazione, come LDAP, non sono supportate.

Scaricare il driver JDBC

Scarica il file del driver JDBC terajdbc4.jar da Teradata su una macchina che può connettersi al data warehouse.

Imposta la variabile `GOOGLE_APPLICATION_CREDENTIALS`

Imposta la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS sulla chiave del account di servizio scaricata nella sezione Prima di iniziare.

Aggiorna la regola di uscita dei Controlli di servizio VPC

Aggiungi un progetto gestito da BigQuery Data Transfer Service Google Cloud (numero di progetto: 990232121269) alla regola di uscita nel perimetro Controlli di servizio VPC.

Il canale di comunicazione tra l'agente in esecuzione on-premise e BigQuery Data Transfer Service avviene tramite la pubblicazione di messaggi Pub/Sub in un argomento per trasferimento. BigQuery Data Transfer Service deve inviare comandi all'agente per estrarre i dati e l'agente deve pubblicare messaggi in BigQuery Data Transfer Service per aggiornare lo stato e restituire le risposte all'estrazione dei dati.

Creare un file di schema personalizzato

Per utilizzare un file di schema personalizzato anziché il rilevamento automatico dello schema, creane uno manualmente o chiedi all'agente di migrazione di crearne uno per te quando inizializzi l'agente.

Se crei un file di schema manualmente e intendi utilizzare la console Google Cloud per creare un trasferimento, carica il file di schema in un bucket Cloud Storage nello stesso progetto che prevedi di utilizzare per il trasferimento.

Scarica l'agente di migrazione

Scarica l'agente di migrazione su una macchina che può connettersi al data warehouse. Sposta il file JAR dell'agente di migrazione nella stessa directory del file JAR del driver JDBC di Teradata.

Configurare il file delle credenziali per il modulo di accesso

Se utilizzi il modulo di accesso per Cloud Storage con l'utilità Teradata Parallel Transporter (TPT) per l'estrazione, è necessario un file delle credenziali.

Prima di creare un file delle credenziali, devi creare una account di servizio account. Dal file della chiave del account di servizio scaricato, ottieni le seguenti informazioni:

client_email
private_key : copia tutti i caratteri all'interno di -----BEGIN PRIVATE KEY----- e -----END PRIVATE KEY-----, inclusi tutti i caratteri /n e senza le doppie virgolette di chiusura.

Una volta ottenute le informazioni richieste, crea un file delle credenziali. Di seguito è riportato un esempio di file delle credenziali con una posizione predefinita di $HOME/.gcs/credentials:

[default]
gcs_access_key_id = ACCESS_ID
gcs_secret_access_key = ACCESS_KEY

Sostituisci quanto segue:

ACCESS_ID: l'ID chiave di accesso o il valore client_email nel file della chiave del account di servizio.
ACCESS_KEY: la chiave di accesso segreta o il valore private_key nel file della chiave del account di servizio.

Configurare un trasferimento

Crea un trasferimento con BigQuery Data Transfer Service.

Se vuoi che venga creato automaticamente un file schema personalizzato, utilizza l'agente di migrazione per configurare il trasferimento.

Non puoi creare un trasferimento on demand utilizzando lo strumento a riga di comando bq; devi utilizzare la console Google Cloud o l'API BigQuery Data Transfer Service.

Se crei un trasferimento ricorrente, ti consigliamo vivamente di specificare un file di schema in modo che i dati dei trasferimenti successivi possano essere partizionati correttamente quando vengono caricati in BigQuery. Senza un file schema, BigQuery Data Transfer Service deduce lo schema della tabella dai dati di origine trasferiti e tutte le informazioni su partizionamento, clustering, chiavi primarie e monitoraggio delle modifiche vengono perse. Inoltre, i trasferimenti successivi saltano le tabelle di cui è già stata eseguita la migrazione dopo il trasferimento iniziale. Per saperne di più su come creare un file schema, vedi File schema personalizzato.

Console

Nella console Google Cloud , vai alla pagina BigQuery.

Vai alla pagina BigQuery
Fai clic su Trasferimenti di dati.
Fai clic su Crea trasferimento.
Nella sezione Tipo di origine, segui questi passaggi:
- Scegli Migrazione: Teradata.
- Per Nome configurazione di trasferimento, inserisci un nome visualizzato per il trasferimento, ad esempio My Migration. Il nome visualizzato può essere qualsiasi valore che ti consenta di identificare facilmente il trasferimento se devi modificarlo in un secondo momento.
- (Facoltativo) Per Opzioni di pianificazione, puoi lasciare il valore predefinito di Giornaliero (in base all'ora di creazione) o scegliere un'altra ora se vuoi un trasferimento incrementale ricorrente. In caso contrario, scegli On demand per un trasferimento una tantum.
- Per Impostazioni destinazione, scegli il set di dati appropriato.
Nella sezione Dettagli origine dati, continua con i dettagli specifici per il trasferimento Teradata.
- Per Tipo di database, scegli Teradata.
- Per Bucket Cloud Storage, cerca il nome del bucket Cloud Storage per la gestione temporanea dei dati di migrazione. Non digitare il prefisso gs://: inserisci solo il nome del bucket.
- In Nome database, inserisci il nome del database di origine in Teradata.
- Per Pattern nome tabella, inserisci un pattern per la corrispondenza dei nomi delle tabelle nel database di origine. Puoi utilizzare le espressioni regolari per specificare il pattern. Ad esempio:
  - sales|expenses corrisponde alle tabelle denominate sales e expenses.
  - .* corrisponde a tutte le tabelle.
  Nota: per informazioni sulla sintassi delle espressioni regolari per i trasferimenti Teradata, consulta la libreria re2.
- In Email del service account, inserisci l'indirizzo email associato alle credenziali delaccount di serviziot utilizzate da un agente di migrazione.
- (Facoltativo) Per Percorso file schema, inserisci il percorso e il nome di un file schema personalizzato. Per saperne di più sulla creazione di un file dello schema personalizzato, vedi File dello schema personalizzato. Puoi lasciare vuoto questo campo per consentire a BigQuery di rilevare automaticamente lo schema della tabella di origine.
- (Facoltativo) Per Directory radice di output della traduzione, inserisci il percorso e il nome del file di mappatura dello schema fornito dal motore di traduzione BigQuery. Per ulteriori informazioni sulla generazione di un file di mapping dello schema, vedi Utilizzare l'output del motore di traduzione per lo schema (anteprima). Puoi lasciare questo campo vuoto per consentire a BigQuery di rilevare automaticamente lo schema della tabella di origine.
- (Facoltativo) Per Enable direct unload to GCS (Abilita scaricamento diretto su GCS), seleziona la casella di controllo per attivare il modulo di accesso per Cloud Storage.
Nel menu Service account, seleziona un service account tra quelli associati al tuo progettoGoogle Cloud . Puoi associare un account di servizio al trasferimento anziché utilizzare le tue credenziali utente. Per ulteriori informazioni sull'utilizzo dei service account con i trasferimenti di dati, consulta Utilizza i service account.
- Se hai eseguito l'accesso con un'identità federata, è necessario un account di servizio per creare un trasferimento. Se hai eseguito l'accesso con un Account Google, il service account per il trasferimento è facoltativo.
- Il account di servizio deve disporre delle autorizzazioni richieste.
(Facoltativo) Nella sezione Opzioni di notifica, segui questi passaggi:
- Fai clic sul pulsante di attivazione/disattivazione Notifiche via email se vuoi che l'amministratore del trasferimento riceva una notifica via email quando l'esecuzione di un trasferimento non riesce.
- Fai clic sul pulsante di attivazione/disattivazione Notifiche Pub/Sub per configurare le notifiche di esecuzione di Pub/Sub per il trasferimento. In Seleziona un argomento Pub/Sub, scegli il nome dell'argomento o fai clic su Crea un argomento.
Fai clic su Salva.
Nella pagina Dettagli trasferimento, fai clic sulla scheda Configurazione.
Prendi nota del nome della risorsa per questo trasferimento perché ti servirà per eseguire l'agente di migrazione.

bq

Quando crei un trasferimento Cloud Storage utilizzando lo strumento bq, la configurazione del trasferimento viene impostata in modo che si ripeta ogni 24 ore. Per i trasferimenti on demand, utilizza la console Google Cloud o l'API BigQuery Data Transfer Service.

Non puoi configurare le notifiche utilizzando lo strumento bq.

Inserisci il comando bq mk e fornisci il flag di creazione del trasferimento --transfer_config. Sono necessari anche i seguenti flag:

--data_source
--display_name
--target_dataset
--params

bq mk \
--transfer_config \
--project_id=project ID \
--target_dataset=dataset \
--display_name=name \
--service_account_name=service_account \
--params='parameters' \
--data_source=data source

Dove:

project ID è l'ID progetto. Se --project_id non viene fornito per specificare un progetto particolare, viene utilizzato il progetto predefinito.
dataset è il set di dati di destinazione (--target_dataset) per la configurazione del trasferimento.
name è il nome visualizzato (--display_name) per la configurazione del trasferimento. Il nome visualizzato del trasferimento può essere qualsiasi valore che ti consenta di identificare il trasferimento se devi modificarlo in un secondo momento.
service_account è il nome del account di servizio utilizzato per autenticare il trasferimento. Il account di servizio deve essere di proprietà dello stesso project_id utilizzato per creare il trasferimento e deve disporre di tutte le autorizzazioni richieste elencate.
parameters contiene i parametri (--params) per la configurazione di trasferimento creata in formato JSON. Ad esempio --params='{"param":"param_value"}'.
- Per le migrazioni da Teradata, utilizza i seguenti parametri:
  - bucket è il bucket Cloud Storage che fungerà da area di staging durante la migrazione.
  - database_type è Teradata.
  - agent_service_account è l'indirizzo email associato al account di servizio che hai creato.
  - database_name è il nome del database di origine in Teradata.
  - table_name_patterns è un pattern o più pattern per la corrispondenza dei nomi delle tabelle nel database di origine. Puoi utilizzare le espressioni regolari per specificare il pattern. Il pattern deve seguire la sintassi delle espressioni regolari Java. Ad esempio:
    - sales|expenses corrisponde alle tabelle denominate sales e expenses.
    - .* corrisponde a tutte le tabelle.
  - is_direct_gcs_unload_enabled è un flag booleano per abilitare lo scaricamento diretto in Cloud Storage.
data_source è l'origine dati (--data_source): on_premises.

Ad esempio, il seguente comando crea un trasferimento Teradata denominato My Transfer utilizzando il bucket Cloud Storage mybucket e il set di dati di destinazione mydataset. Il trasferimento eseguirà la migrazione di tutte le tabelle dal data warehouse Teradata mydatabase e il file dello schema facoltativo è myschemafile.json.

bq mk \
--transfer_config \
--project_id=123456789876 \
--target_dataset=MyDataset \
--display_name='My Migration' \
--params='{"bucket": "mybucket", "database_type": "Teradata",
"database_name":"mydatabase", "table_name_patterns": ".*",
"agent_service_account":"myemail@mydomain.com", "schema_file_path":
"gs://mybucket/myschemafile.json", "is_direct_gcs_unload_enabled": true}' \
--data_source=on_premises

Dopo aver eseguito il comando, ricevi un messaggio simile al seguente:

[URL omitted] Please copy and paste the above URL into your web browser and follow the instructions to retrieve an authentication code.

Segui le istruzioni e incolla il codice di autenticazione nella riga di comando.

API

Utilizza il metodo projects.locations.transferConfigs.create e fornisci un'istanza della risorsa TransferConfig.

Java

Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di BigQuery per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API BigQuery Java.

Per eseguire l'autenticazione in BigQuery, configura le Credenziali predefinite dell'applicazione. Per saperne di più, vedi Configurare l'autenticazione per le librerie client.

import com.google.api.gax.rpc.ApiException;
import com.google.cloud.bigquery.datatransfer.v1.CreateTransferConfigRequest;
import com.google.cloud.bigquery.datatransfer.v1.DataTransferServiceClient;
import com.google.cloud.bigquery.datatransfer.v1.ProjectName;
import com.google.cloud.bigquery.datatransfer.v1.TransferConfig;
import com.google.protobuf.Struct;
import com.google.protobuf.Value;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

// Sample to create a teradata transfer config.
public class CreateTeradataTransfer {

  public static void main(String[] args) throws IOException {
    // TODO(developer): Replace these variables before running the sample.
    final String projectId = "MY_PROJECT_ID";
    String datasetId = "MY_DATASET_ID";
    String databaseType = "Teradata";
    String bucket = "cloud-sample-data";
    String databaseName = "MY_DATABASE_NAME";
    String tableNamePatterns = "*";
    String serviceAccount = "MY_SERVICE_ACCOUNT";
    String schemaFilePath = "/your-schema-path";
    Map<String, Value> params = new HashMap<>();
    params.put("database_type", Value.newBuilder().setStringValue(databaseType).build());
    params.put("bucket", Value.newBuilder().setStringValue(bucket).build());
    params.put("database_name", Value.newBuilder().setStringValue(databaseName).build());
    params.put("table_name_patterns", Value.newBuilder().setStringValue(tableNamePatterns).build());
    params.put("agent_service_account", Value.newBuilder().setStringValue(serviceAccount).build());
    params.put("schema_file_path", Value.newBuilder().setStringValue(schemaFilePath).build());
    TransferConfig transferConfig =
        TransferConfig.newBuilder()
            .setDestinationDatasetId(datasetId)
            .setDisplayName("Your Teradata Config Name")
            .setDataSourceId("on_premises")
            .setParams(Struct.newBuilder().putAllFields(params).build())
            .setSchedule("every 24 hours")
            .build();
    createTeradataTransfer(projectId, transferConfig);
  }

  public static void createTeradataTransfer(String projectId, TransferConfig transferConfig)
      throws IOException {
    try (DataTransferServiceClient client = DataTransferServiceClient.create()) {
      ProjectName parent = ProjectName.of(projectId);
      CreateTransferConfigRequest request =
          CreateTransferConfigRequest.newBuilder()
              .setParent(parent.toString())
              .setTransferConfig(transferConfig)
              .build();
      TransferConfig config = client.createTransferConfig(request);
      System.out.println("Cloud teradata transfer created successfully :" + config.getName());
    } catch (ApiException ex) {
      System.out.print("Cloud teradata transfer was not created." + ex.toString());
    }
  }
}

Agente di migrazione

Se vuoi, puoi configurare il trasferimento direttamente dall'agente di migrazione. Per maggiori informazioni, vedi Inizializzare l'agente di migrazione.

Inizializzare l'agente di migrazione

Per un nuovo trasferimento, devi inizializzare l'agente di migrazione. L'inizializzazione è richiesta una sola volta per un trasferimento, indipendentemente dal fatto che sia ricorrente o meno. L'inizializzazione configura solo l'agente di migrazione, non avvia il trasferimento.

Se intendi utilizzare l'agente di migrazione per creare un file di schema personalizzato, assicurati di avere una directory scrivibile nella directory di lavoro con lo stesso nome del progetto che vuoi utilizzare per il trasferimento. Qui l'agente di migrazione crea il file dello schema. Ad esempio, se lavori in /home e stai configurando il trasferimento nel progetto myProject, crea la directory /home/myProject e assicurati che sia scrivibile dagli utenti.

Apri una nuova sessione. Nella riga di comando, esegui il comando di inizializzazione, che segue questo formato:

java -cp \
OS-specific-separated-paths-to-jars (JDBC and agent) \
com.google.cloud.bigquery.dms.Agent \
--initialize

L'esempio seguente mostra il comando di inizializzazione quando il driver JDBC e i file JAR dell'agente di migrazione si trovano in una directory migration locale:

Unix, Linux, Mac OS

java -cp \
/usr/local/migration/terajdbc4.jar:/usr/local/migration/mirroring-agent.jar \
com.google.cloud.bigquery.dms.Agent \
--initialize

Windows

Copia tutti i file nella cartella C:\migration (o modifica i percorsi nel comando), poi esegui:

java -cp C:\migration\terajdbc4.jar;C:\migration\mirroring-agent.jar com.google.cloud.bigquery.dms.Agent --initialize

Quando richiesto, configura le seguenti opzioni:
1. Scegli se salvare il modello Teradata Parallel Transporter (TPT) su disco. Se prevedi di utilizzare il metodo di estrazione TPT, puoi modificare il modello salvato con i parametri adatti alla tua istanza Teradata.
2. Digita il percorso di una directory locale che il job di trasferimento può utilizzare per l'estrazione dei file. Assicurati di avere lo spazio di archiviazione minimo consigliato come descritto in Metodo di estrazione.
3. Digita il nome host del database.
4. Digita la porta del database.
5. Scegli se utilizzare Teradata Parallel Transporter (TPT) come metodo di estrazione.
6. (Facoltativo) Digita il percorso di un file delle credenziali del database.
7. Scegli se specificare un nome di configurazione di BigQuery Data Transfer Service.
  
  Se stai inizializzando l'agente di migrazione per un trasferimento che hai già configurato, procedi nel seguente modo:
  1. Digita il nome della risorsa del trasferimento. Puoi trovarlo nella scheda Configurazione della pagina Dettagli trasferimento per il trasferimento.
  2. Quando richiesto, digita un percorso e un nome file per il file di configurazione dell'agente di migrazione che verrà creato. Fai riferimento a questo file quando esegui l'agente di migrazione per avviare il trasferimento.
  3. Ignora i passaggi rimanenti.
  Se utilizzi l'agente di migrazione per configurare un trasferimento, premi Invio per passare al prompt successivo.
8. Digita l' Google Cloud ID progetto.
9. Digita il nome del database di origine in Teradata.
10. Digita un pattern per la corrispondenza dei nomi delle tabelle nel database di origine. Puoi utilizzare le espressioni regolari per specificare il pattern. Ad esempio:
  - sales|expenses corrisponde alle tabelle denominate sales e expenses.
  - .* corrisponde a tutte le tabelle.
  Nota: per informazioni sulla sintassi delle espressioni regolari per i trasferimenti Teradata, consulta la libreria re2.
11. (Facoltativo) Digita il percorso di un file di schema JSON locale. Questa opzione è consigliata vivamente per i trasferimenti ricorrenti.
  
  Se non utilizzi un file schema o se vuoi che l'agente di migrazione ne crei uno per te, premi Invio per passare al prompt successivo.
12. Scegli se creare un nuovo file schema.
  
  Se vuoi creare un file dello schema:
  1. Digita yes
  2. Digita il nome utente di un utente Teradata che ha accesso in lettura alle tabelle di sistema e alle tabelle di cui vuoi eseguire la migrazione.
  3. Digita la password per l'utente.
    
    L'agente di migrazione crea il file dello schema e ne restituisce la posizione.
  4. Modifica il file schema per contrassegnare le colonne di partizionamento, clustering, chiavi primarie e monitoraggio delle modifiche e verifica di voler utilizzare questo schema per la configurazione del trasferimento. Consulta File dello schema personalizzato per suggerimenti.
  5. Premi Enter per passare al prompt successivo.
  Se non vuoi creare un file di schema, digita no.
13. Digita il nome del bucket Cloud Storage di destinazione per i dati di migrazione di gestione temporanea prima del caricamento in BigQuery. Se l'agente di migrazione ha creato un file di schema personalizzato, anche questo viene caricato in questo bucket.
14. Digita il nome del set di dati di destinazione in BigQuery.
15. Digita un nome visualizzato per la configurazione del trasferimento.
16. Digita un percorso e un nome file per il file di configurazione dell'agente di migrazione che verrà creato.
Dopo aver inserito tutti i parametri richiesti, l'agente di migrazione crea un file di configurazione e lo restituisce al percorso locale specificato. Per un'analisi più approfondita del file di configurazione, consulta la sezione successiva.

File di configurazione per l'agente di migrazione

Il file di configurazione creato nel passaggio di inizializzazione è simile a questo esempio:


{
  "agent-id": "81f452cd-c931-426c-a0de-c62f726f6a6f",
  "transfer-configuration": {
    "project-id": "123456789876",
    "location": "us",
    "id": "61d7ab69-0000-2f6c-9b6c-14c14ef21038"
  },
  "source-type": "teradata",
  "console-log": false,
  "silent": false,
  "teradata-config": {
    "connection": {
      "host": "localhost"
    },
    "local-processing-space": "extracted",
    "database-credentials-file-path": "",
    "max-local-storage": "50GB",
    "gcs-upload-chunk-size": "32MB",
    "use-tpt": true,
    "transfer-views": false,
    "max-sessions": 0,
    "spool-mode": "NoSpool",
    "max-parallel-upload": 4,
    "max-parallel-extract-threads": 1,
    "session-charset": "UTF8",
    "max-unload-file-size": "2GB"
  }
}

Opzioni del job di trasferimento nel file di configurazione dell'agente di migrazione

transfer-configuration: informazioni su questa configurazione di trasferimento in BigQuery.
teradata-config: Informazioni specifiche per questa estrazione di Teradata:
- connection: Informazioni sull'hostname e sulla porta
- local-processing-space: la cartella di estrazione in cui l'agente estrarrà i dati delle tabelle prima di caricarli in Cloud Storage.
- database-credentials-file-path: (facoltativo) il percorso di un file che contiene le credenziali per la connessione automatica al database Teradata. Il file deve contenere due righe per le credenziali. Puoi utilizzare un nome utente/password, come mostrato nell'esempio seguente:
```
username=abc
password=123
```
  Puoi anche utilizzare un secret di SecretManager:
```
username=abc
secret_resource_id=projects/my-project/secrets/my-secret-name/versions/1
```
  Quando utilizzi un file delle credenziali, fai attenzione a controllare l'accesso alla cartella in cui lo memorizzi nel file system locale, perché non verrà criptato. Se non viene fornito alcun percorso, ti verrà chiesto un nome utente e una password quando avvii un agente.
  Le modalità di autenticazione, come LDAP, non sono supportate.
- max-local-storage: la quantità massima di spazio di archiviazione locale da utilizzare per l'estrazione nella directory di staging specificata. Il valore predefinito è 50GB. Il formato supportato è: numberKB|MB|GB|TB.
  
  In tutte le modalità di estrazione, i file vengono eliminati dalla directory di staging locale dopo essere stati caricati in Cloud Storage.
  
  Nota: il limite "max-local-storage" ha effetti aggiuntivi quando viene utilizzato Teradata Parallel Transporter (TPT). Se la tabella ha più partizioni più piccole del valore `max-local-storage`, l'estrazione della tabella viene suddivisa in più job TPT, ognuno dei quali non supera il valore `max-local-storage`. Se la tabella non è partizionata o se una delle partizioni è più grande di `max-local-storage`, l'estrazione procede, ma lo spazio effettivo richiesto per l'estrazione supera il limite.
- use-tpt: indica all'agente di migrazione di utilizzare Teradata Parallel Transporter (TPT) come metodo di estrazione.
  
  Per ogni tabella, l'agente di migrazione genera uno script TPT, avvia un processo tbuild e attende il completamento. Una volta completato il processo tbuild, l'agente elenca e carica i file estratti in Cloud Storage, quindi elimina lo script TPT. Per ulteriori informazioni, vedi Metodo di estrazione.
  
  Avviso: un agente genera e salva uno script TPT in un file nella cartella di estrazione locale. Lo script contiene un nome utente e una password Teradata. Adotta le misure appropriate per limitare l'accesso ai file nella cartella di estrazione locale, perché il nome utente e la password non verranno criptati.
- transfer-views: indica all'agente di migrazione di trasferire anche i dati dalle viste. Utilizza questa opzione solo quando è necessaria la personalizzazione dei dati durante la migrazione. Negli altri casi, esegui la migrazione delle viste alle viste BigQuery. Questa opzione ha i seguenti prerequisiti:
  - Puoi utilizzare questa opzione solo con Teradata versione 16.10 e successive.
  - Una vista deve avere una colonna di numeri interi "partition" definita, che punta a un ID di partizione per la riga specificata nella tabella sottostante.
- max-sessions: specifica il numero massimo di sessioni utilizzate dal job di estrazione (FastExport o TPT). Se impostato su 0, il database Teradata determinerà il numero massimo di sessioni per ogni job di estrazione.
- gcs-upload-chunk-size: un file di grandi dimensioni viene caricato in Cloud Storage in blocchi. Questo parametro, insieme a max-parallel-upload, viene utilizzato per controllare la quantità di dati caricati contemporaneamente in Cloud Storage. Ad esempio, se gcs-upload-chunk-size è 64 MB e max-parallel-upload è 10 MB, teoricamente un agente di migrazione può caricare 640 MB (64 MB * 10) di dati contemporaneamente. Se il caricamento del blocco non va a buon fine, l'intero blocco deve essere ritentato. La dimensione del chunk deve essere piccola.
- max-parallel-upload: questo valore determina il numero massimo di thread utilizzati dall'agente di migrazione per caricare i file in Cloud Storage. Se non specificato, il valore predefinito è il numero di processori disponibili per la macchina virtuale Java. La regola generale è di scegliere il valore in base al numero di core della macchina che esegue l'agente. Quindi, se hai n core, il numero ottimale di thread dovrebbe essere n. Se i core sono hyper-threaded, il numero ottimale deve essere (2 * n). Esistono anche altre impostazioni, come la larghezza di banda della rete, che devi considerare quando regoli max-parallel-upload. La modifica di questo parametro può migliorare le prestazioni del caricamento su Cloud Storage.
- spool-mode : nella maggior parte dei casi, la modalità NoSpool è l'opzione migliore. NoSpool è il valore predefinito nella configurazione dell'agente. Puoi modificare questo parametro se si applica al tuo caso uno qualsiasi degli svantaggi di NoSpool.
- max-unload-file-size: determina la dimensione massima del file estratto. Questo parametro non viene applicato per le estrazioni TPT.
- max-parallel-extract-threads: Questa configurazione viene utilizzata solo in modalità FastExport. Determina il numero di thread paralleli utilizzati per estrarre i dati da Teradata. La modifica di questo parametro potrebbe migliorare le prestazioni dell'estrazione.
- tpt-template-path: utilizza questa configurazione per fornire uno script di estrazione TPT personalizzato come input. Puoi utilizzare questo parametro per applicare le trasformazioni ai dati di migrazione.
- schema-mapping-rule-path: (facoltativo) Il percorso di un file di configurazione che contiene una mappatura dello schema per ignorare le regole di mappatura predefinite. Alcuni tipi di mapping funzionano solo con la modalità Teradata Parallel Transporter (TPT).
  
  Esempio: mappatura dal tipo Teradata TIMESTAMP al tipo BigQuery DATETIME:
```
{
"rules": [
  {
    "database": {
        "name": "database.*",
        "tables": [
           {
             "name": "table.*"
           }
        ]
    },
    "match": {
      "type": "COLUMN_TYPE",
      "value": "TIMESTAMP"
    },
    "action": {
      "type": "MAPPING",
      "value": "DATETIME"
    }
  }
]
}
```
  Attributi:
  - database: (facoltativo) name è un'espressione regolare per i database da includere. Per impostazione predefinita, sono inclusi tutti i database.
  - tables: (facoltativo) contiene un array di tabelle. name è un'espressione regolare per le tabelle da includere. Per impostazione predefinita, sono incluse tutte le tabelle.
  - match: (obbligatorio)
    - Valori supportati di type: COLUMN_TYPE.
    - Valori supportati per value: TIMESTAMP, DATETIME.
  - action: (obbligatorio)
    - Valori supportati di type: MAPPING.
    - Valori supportati per value: TIMESTAMP, DATETIME.
- compress-output: (facoltativo) indica se i dati devono essere compressi prima di essere archiviati su Cloud Storage. Questa impostazione viene applicata solo in tpt-mode. Per impostazione predefinita, questo valore è false.
- gcs-module-config-dir: (facoltativo) il percorso del file delle credenziali per accedere al bucket Cloud Storage. La directory predefinita è $HOME/.gcs, ma puoi utilizzare questo parametro per modificarla.
- gcs-module-connection-count: (facoltativo) specifica il numero di connessioni TCP al servizio Cloud Storage. Il valore predefinito è 10.
- gcs-module-buffer-size: (facoltativo) specifica le dimensioni dei buffer da utilizzare per le connessioni TCP. Il valore predefinito è 8 MB (8388608 byte). Per facilità d'uso, puoi utilizzare i seguenti moltiplicatori:
  - k (1000)
  - K (1024)
  - m (1000 * 1000)
  - M (1024*1024)
- gcs-module-buffer-count: (facoltativo) specifica il numero di buffer da utilizzare con le connessioni TCP specificate da gcs-module-connection-count. Ti consigliamo di utilizzare un valore pari al doppio del numero di connessioni TCP al servizio Cloud Storage. Il valore predefinito è 2 * gcs-module-connection-count.
- gcs-module-max-object-size: (facoltativo). Questo parametro controlla le dimensioni degli oggetti Cloud Storage. Il valore di questo parametro può essere un numero intero o un numero intero seguito, senza spazi, da uno dei seguenti moltiplicatori:
  - k (1000)
  - K (1024)
  - m (1000 * 1000)
  - M (1024*1024)
- gcs-module-writer-instances: (facoltativo). Questo parametro specifica il numero di istanze di scrittura di Cloud Storage. Per impostazione predefinita, il valore è 1. Puoi aumentare questo valore per incrementare il throughput durante la fase di scrittura dell'esportazione TPT.

Esegui l'agente di migrazione

Dopo aver inizializzato l'agente di migrazione e creato il file di configurazione, segui i passaggi riportati di seguito per eseguire l'agente e avviare la migrazione:

Esegui l'agente specificando i percorsi del driver JDBC, dell'agente di migrazione e del file di configurazione creato nel passaggio di inizializzazione precedente.

L'agente di migrazione deve rimanere in esecuzione per l'intero periodo del trasferimento. Se esegui l'agente da remoto, ad esempio utilizzando SSH, assicurati che rimanga attivo anche se la connessione remota viene chiusa. Puoi farlo utilizzando `tmux` o utilità simili.
```
java -cp \
OS-specific-separated-paths-to-jars (JDBC and agent) \
com.google.cloud.bigquery.dms.Agent \
--configuration-file=path to configuration file
```
Unix, Linux, Mac OS
```
java -cp \
/usr/local/migration/Teradata/JDBC/terajdbc4.jar:mirroring-agent.jar \
com.google.cloud.bigquery.dms.Agent \
--configuration-file=config.json
```
Windows
Copia tutti i file nella cartella C:\migration (o modifica i percorsi nel comando), poi esegui:
```
java -cp C:\migration\terajdbc4.jar;C:\migration\mirroring-agent.jar com.google.cloud.bigquery.dms.Agent --configuration-file=config.json
```
Se vuoi procedere con la migrazione, premi Enter e l'agente procederà se il classpath fornito durante l'inizializzazione è valido.
Quando richiesto, digita il nome utente e la password per la connessione al database. Se il nome utente e la password sono validi, inizia la migrazione dei dati.

(Facoltativo) Nel comando per avviare la migrazione, puoi anche utilizzare un flag che passa un file di credenziali all'agente, anziché inserire il nome utente e la password ogni volta. Per saperne di più, consulta il parametro facoltativo database-credentials-file-path nel file di configurazione dell'agente. Quando utilizzi un file delle credenziali, adotta le misure appropriate per controllare l'accesso alla cartella in cui lo memorizzi sul file system locale, perché non verrà criptato.
Lascia aperta questa sessione fino al completamento della migrazione. Se hai creato un trasferimento di migrazione ricorrente, mantieni aperta questa sessione a tempo indeterminato. Se questa sessione viene interrotta, le esecuzioni di trasferimento attuali e future non vanno a buon fine.
Monitora periodicamente se l'agente è in esecuzione. Se un trasferimento è in corso e nessun agente risponde entro 24 ore, il trasferimento non va a buon fine.
Se l'agente di migrazione smette di funzionare durante il trasferimento o la pianificazione, la console Google Cloud mostra lo stato di errore e ti chiede di riavviare l'agente. Per avviare di nuovo l'agente di migrazione, riprendi dall'inizio di questa sezione, eseguendo l'agente di migrazione, con il comando per eseguire l'agente di migrazione. Non è necessario ripetere il comando di inizializzazione. Il trasferimento riprende dal punto in cui le tabelle non sono state completate.

AVVISO: i dati estratti da Teradata non sono criptati. Adotta le misure appropriate per limitare l'accesso ai file estratti nella cartella di estrazione della macchina locale e assicurati che il bucket Cloud Storage non sia disponibile pubblicamente. Scopri di più sul controllo dell'accesso ai bucket Cloud Storage con i ruoli IAM.

Monitorare l'avanzamento della migrazione

Puoi visualizzare lo stato della migrazione nella console Google Cloud . Puoi anche configurare notifiche Pub/Sub o email. Consulta Notifiche di BigQuery Data Transfer Service.

BigQuery Data Transfer Service pianifica e avvia un'esecuzione del trasferimento in base a una pianificazione specificata al momento della creazione della configurazione del trasferimento. È importante che l'agente di migrazione sia in esecuzione quando un'esecuzione del trasferimento è attiva. Se non vengono ricevuti aggiornamenti da parte dell'agente entro 24 ore, l'esecuzione del trasferimento non va a buon fine.

Esempio di stato della migrazione nella console Google Cloud :

Stato migrazione

Esegui l'upgrade dell'agente di migrazione

Se è disponibile una nuova versione dell'agente di migrazione, devi aggiornarlo manualmente. Per ricevere notifiche relative a BigQuery Data Transfer Service, iscriviti alle note di rilascio.

Passaggi successivi

Prova una migrazione di test da Teradata a BigQuery.
Scopri di più su BigQuery Data Transfer Service.
Esegui la migrazione del codice SQL con la traduzione SQL batch.

Eseguire la migrazione di schema e dati da Teradata

Prima di iniziare

Impostare le autorizzazioni richieste

Crea un set di dati

Crea un bucket Cloud Storage

Prepara l'ambiente locale

Requisiti del computer locale

Dettagli della connessione Teradata

Scaricare il driver JDBC

Imposta la variabile GOOGLE_APPLICATION_CREDENTIALS

Aggiorna la regola di uscita dei Controlli di servizio VPC

Creare un file di schema personalizzato

Scarica l'agente di migrazione

Configurare il file delle credenziali per il modulo di accesso

Configurare un trasferimento

Console

bq

API

Java

Agente di migrazione

Inizializzare l'agente di migrazione

Unix, Linux, Mac OS

Windows

File di configurazione per l'agente di migrazione

Opzioni del job di trasferimento nel file di configurazione dell'agente di migrazione

Esegui l'agente di migrazione

Unix, Linux, Mac OS

Windows

Monitorare l'avanzamento della migrazione

Esegui l'upgrade dell'agente di migrazione

Passaggi successivi

Imposta la variabile `GOOGLE_APPLICATION_CREDENTIALS`