Questa pagina è stata tradotta dall'API Cloud Translation.

Esportare i dati dai sistemi SAP in Google BigQuery tramite SAP Data Services

Queste istruzioni mostrano come esportare i dati da un'applicazione SAP o dal relativo database di base in BigQuery utilizzando SAP Data Services (DS).

Il database può essere SAP HANA o qualsiasi altro database supportato da SAP.

L'esempio in questa guida esporta le tabelle di database SQL Anywhere, ma puoi utilizzarlo per configurare l'esportazione di altri tipi di oggetti sia dal livello di database sia dall'applicazione SAP in BigQuery.

Puoi utilizzare l'esportazione dei dati per eseguire il backup dei dati SAP o per consolidare i dati dei tuoi sistemi SAP con i dati dei consumatori di altri sistemi in BigQuery, dove puoi ricavare informazioni dal machine learning e per l'analisi dei dati su larga scala in termini di petabyte.

Le istruzioni sono destinate agli amministratori di sistema SAP che hanno esperienza di base con la configurazione di SAP Basis, SAP DS e Google Cloud.

Architettura

Il flusso di replica inizia dall'applicazione o dal database SAP e passa tramite SAP Data Services a BigQuery

SAP Data Services recupera i dati dall'applicazione SAP o dal database sottostante, li trasforma in modo che siano compatibili con il formato BigQuery e avvia il job di caricamento che trasferisce i dati in BigQuery. Al termine del job di caricamento, i dati sono disponibili in BigQuery per l'analisi.

L'esportazione è un'istantanea dei dati nel sistema di origine al momento dell'esportazione. Sei tu a stabilire quando SAP Data Services avvia un'esportazione. Tutti i dati esistenti nella tabella BigQuery di destinazione vengono sovrascritti dai dati esportati. Al termine dell'esportazione, i dati in BigQuery non vengono sincronizzati con i dati nel sistema di origine.

In questo scenario, il sistema di origine SAP e SAP Data Services possono essere in esecuzione su Google Cloudo meno.

Componenti principali della soluzione

Per esportare i dati da un'applicazione SAP o da un database in BigQuery utilizzando SAP Data Services, sono necessari i seguenti componenti:

Componente	Versioni richieste	Note
Stack del server delle applicazioni SAP	Qualsiasi sistema SAP basato su ABAP a partire da R/3 4.6C	In questa guida, il server delle applicazioni e il server di database vengono collettivamente indicati come sistema di origine, anche se sono in esecuzione su macchine diverse. Definisci l'utente RFC con l'autorizzazione appropriata (Facoltativo) Definisci uno spazio tabella separato per le tabelle di log
Sistema di database (DB)	Qualsiasi versione del database elencata come supportata nella matrice di disponibilità dei prodotti SAP (PAM), soggetta a eventuali restrizioni dello stack SAP NetWeaver elencate nella PAM.
SAP Data Services	SAP Data Services 4.2 SP1 o versioni successive
BigQuery	N/D

Costi

BigQuery è un componente Google Cloud fatturabile.

Utilizza il Calcolatore prezzi per generare una stima dei costi in base all'utilizzo previsto.

Prerequisiti

Queste istruzioni presuppongono che il sistema delle applicazioni SAP, il server di database e SAP Data Services siano già installati e configurati per il normale funzionamento.

Rivolgiti a SAP per assicurarti che la configurazione pianificata sia conforme ai requisiti di licenza SAP. I requisiti potrebbero variare a seconda che tu stia esportando i dati da un sistema di applicazioni SAP o da un database sottostante.

Configura un Google Cloud progetto in Google Cloud

Per poter utilizzare BigQuery, devi avere un Google Cloud progetto.

Crea un Google Cloud progetto

Vai alla Google Cloud console e registrati, seguendo la procedura guidata di configurazione.

VAI A CLOUD CONSOLE
Accanto al Google Cloud logo nell'angolo in alto a sinistra, fai clic sul menu a discesa e seleziona NUOVO PROGETTO.
Assegna un nome al progetto e fai clic su Crea.
Una volta creato il progetto (viene visualizzata una notifica in alto a destra), aggiorna la pagina.

Abilita API

Abilita l'API BigQuery:

VAI ALL'API BIGQUERY

Crea un account di servizio

L'account di servizio (in particolare il relativo file di chiavi) viene utilizzato per autenticare SAP DS in BigQuery. Utilizzerai il file della chiave in un secondo momento quando crei il data store di destinazione.

Nella Google Cloud console, vai alla pagina Account di servizio.

VAI AD ACCOUNT DI SERVIZIO
Selezionare il tuo progetto Google Cloud .
Fai clic su Crea account di servizio.
Inserisci un nome account di servizio.
Fai clic su Crea e continua.
Nell'elenco Seleziona un ruolo, scegli BigQuery > Editor dati BigQuery.
Fai clic su Aggiungi un altro ruolo.
Nell'elenco Seleziona un ruolo, scegli BigQuery > Utente job BigQuery.
Fai clic su Continua.
Se opportuno, concedi ad altri utenti l'accesso all'account di servizio.
Fai clic su Fine.
Nella pagina Account di servizio della Google Cloud console, fai clic sull'indirizzo email dell'account di servizio appena creato.
Sotto il nome dell'account di servizio, fai clic sulla scheda Chiavi.
Fai clic sul menu a discesa Aggiungi chiave, quindi seleziona Crea nuova chiave.
Assicurati che sia specificato il tipo di chiave JSON.
Fai clic su Crea.
Salva il file della chiave scaricato automaticamente in un luogo sicuro.

Configurazione dell'esportazione dai sistemi SAP a BigQuery

La configurazione di questa soluzione include i seguenti passaggi di alto livello:

Configurazione di SAP Data Services
Creazione del flusso di dati tra SAP Data Services e BigQuery

Configurazione di SAP Data Services

Crea un progetto di servizi dati

Apri l'applicazione SAP Data Services Designer.
Vai a Progetto > Nuovo > Progetto.
Specifica un nome nel campo Nome progetto.
Fai clic su Crea. Il progetto viene visualizzato in Esplora progetti a sinistra.

Crea un datastore di origine

Puoi utilizzare un sistema di applicazioni SAP o il relativo database di base come datastore di origine per SAP Data Services. I tipi di oggetti di dati che puoi esportare sono diversi a seconda che tu stia utilizzando un sistema di applicazioni SAP o un database come data store.

Se utilizzi un sistema di applicazioni SAP come datastore, puoi esportare i seguenti oggetti:

Tabelle
Visualizzazioni
Gerarchie
ODP
BAPI (funzioni)
IDoc

Il flusso di replica inizia dall'applicazione o dal database SAP e passa tramite SAP Data Services a BigQuery

Se utilizzi un database sottostante come connessione al datastore, puoi esportare oggetti come:

Tabelle
Visualizzazioni
Stored procedure
Altri oggetti di dati

Il flusso di replica inizia dall'applicazione o dal database SAP e passa tramite SAP Data Services a BigQuery

Le configurazioni dei datastore per i sistemi e i database delle applicazioni SAP sono descritte nelle sezioni seguenti. Indipendentemente dal tipo di connessione o oggetto dati del datastore, la procedura per importare e utilizzare gli oggetti in un flusso di dati SAP Data Services è quasi identica.

Configurazione per la connessione del livello di applicazione SAP

Questi passaggi creano una connessione all'applicazione SAP e aggiungono gli oggetti dati al node del datastore applicabile nella libreria di oggetti di Designer.

Apri l'applicazione SAP Data Services Designer.
Apri il progetto SAP Data Services in Esplora progetti.
Vai a Progetto > Nuovo > Datastore.
Inserisci Nome datastore. Ad esempio, ECC_DS.
Nel campo Tipo di data store, seleziona Applicazioni SAP.
Nel campo Nome server applicazioni, fornisci il nome dell'istanza del server applicazioni SAP.
Specifica le credenziali di accesso al server applicazioni SAP.
Fai clic su OK.

Configurazione per la connessione del livello del database SAP

SAP HANA

Questi passaggi creano una connessione al database SAP HANA e aggiungono le tabelle di dati al node del datastore applicabile nella libreria di oggetti di Designer.

Apri l'applicazione SAP Data Services Designer.
Apri il progetto SAP Data Services in Esplora progetti.
Vai a Progetto > Nuovo > Datastore.
Compila Nome datastore, ad esempio HANA_DS.
Nel campo Tipo di archivio dati, seleziona l'opzione Database.
Nel campo Tipo di database, seleziona l'opzione SAP HANA.
Nel campo Versione del database, seleziona la versione del database.
Compila il nome del server database, il numero di porta e le credenziali di accesso.
Fai clic su OK.

Altri database supportati

Questi passaggi creano una connessione a SQL Anywhere e aggiungono le tabelle di dati al node del datastore applicabile nella raccolta di oggetti di Designer.

I passaggi per la creazione della connessione ad altri database supportati sono quasi identici.

Apri l'applicazione SAP Data Services Designer.
Apri il progetto SAP Data Services in Esplora progetti.
Vai a Progetto > Nuovo > Datastore.
Compila Nome, ad esempio SQL_ANYWHERE_DS.
Nel campo Tipo di archivio dati, seleziona l'opzione Database.
Nel campo Tipo di database, seleziona l'opzione SQL Anywhere.
Nel campo Versione del database, seleziona la versione del database.
Compila Nome server database, Nome database e le credenziali di accesso.
Fai clic su OK.

Il nuovo data store viene visualizzato nella scheda Data Store della libreria di oggetti locali di Designer.

Crea un datastore di destinazione

Questi passaggi creano un archivio dati BigQuery che utilizza l'account di servizio che hai creato in precedenza nella sezione Creare un account di servizio. L'account di servizio consente a SAP Data Services di accedere in modo sicuro a BigQuery.

Per ulteriori informazioni, consulta Ottenere l'indirizzo email del tuo account di servizio Google e Ottenere un file della chiave privata dell'account di servizio Google nella documentazione di SAP Data Services.

Apri l'applicazione SAP Data Services Designer.
Apri il progetto SAP Data Services in Esplora progetti.
Vai a Progetto > Nuovo > Datastore.
Compila il campo Nome. Ad esempio, BQ_DS.
Nel campo Tipo di data store, seleziona Google BigQuery.
Viene visualizzata l'opzione URL servizio web. Il software completa automaticamente l'opzione con l'URL del servizio web BigQuery predefinito.
Seleziona Avanzate.
Completa le opzioni avanzate in base alle descrizioni delle opzioni del data store per BigQuery nella documentazione di SAP Data Services.
Fai clic su OK.

Il nuovo data store viene visualizzato nella scheda Data Store della libreria di oggetti locali di Designer.

Configurare il flusso di dati tra SAP Data Services e BigQuery

Per configurare il flusso di dati, devi creare il job batch, il flusso di dati del caricatore BigQuery e importare le tabelle di origine e BigQuery in SAP Data Services come metadati esterni.

Crea il job batch

Apri l'applicazione SAP Data Services Designer.
Apri il progetto SAP Data Services in Esplora progetti.
Vai a Progetto > Nuovo > Job batch.
Compila il campo Nome. Ad esempio, JOB_SQL_ANYWHERE_BQ.
Fai clic su OK.

Crea la logica del flusso di dati

Tabella di origine dell'importazione

Questi passaggi importano la tabella di database dal datastore di origine e la rendono disponibile in SAP Data Services.

Apri l'applicazione SAP Data Services Designer.
Espandi il data store di origine in Esplora progetti.
Seleziona l'opzione Metadati esterni nella parte superiore del riquadro a destra. Viene visualizzato l'elenco dei nodi con le tabelle e/o altri oggetti disponibili.
Seleziona la tabella da importare dall'elenco.
Fai clic con il tasto destro del mouse e seleziona l'opzione Importa.
La tabella importata è ora disponibile nella raccolta di oggetti nel nodo del datastore di origine.

Creare un flusso di dati

Seleziona il job batch in Esplora progetti.
Fai clic con il tasto destro del mouse nell'area di lavoro vuota del riquadro a destra e seleziona l'opzione Aggiungi nuovo > Dataflow.
Fai clic con il tasto destro del mouse sull'icona del flusso di dati e seleziona Rinomina.
Modifica il nome in DF_SQL_ANYWHERE_BQ.
Apri l'area di lavoro di Dataflow facendo doppio clic sull'icona di Dataflow.

Importa e collega il flusso di dati agli oggetti del datastore di origine

Espandi il data store di origine in Esplora progetti.
Dal data store, trascina la tabella di origine nello spazio di lavoro del flusso di dati (scegli l'opzione Crea origine quando trascini la tabella nello spazio di lavoro). In queste istruzioni, il datastore si chiama SQL_ANYWHERE_DS. Il nome del tuo data store potrebbe essere diverso.
Trascina Trasformazione query dal nodo Piattaforma nella scheda Trasformazioni della raccolta di oggetti sul flusso di dati.
Collega la tabella di origine nello spazio di lavoro alla trasformazione Query.
Fai doppio clic su Trasforma query.
Seleziona tutti i campi della tabella in Schema In a sinistra e trascinali in Schema Out a destra.

Importante: se il tipo di dati di un campo è Datetime, devi aggiungere una funzione di conversione per convertire il valore data/ora utilizzato in SAP Data Services nel formato timestamp utilizzato da BigQuery.Per aggiungere una funzione di conversione per un campo data/ora:
- Seleziona il campo data/ora nell'elenco Schema Out (Schema Out) a destra.
- Seleziona la scheda Mappatura sotto gli elenchi di schemi.
- Sostituisci il nome del campo con la seguente funzione:
```
to_date(to_char(FIELDNAME,'yyyy-mm-dd hh24:mi:ss'), 'yyyy-mm-dd
hh24:mi:ss')
```
  dove NOMECAMPO è il nome del campo selezionato.
Fai clic sull'icona Indietro nella barra degli strumenti dell'applicazione per tornare a Dataflow Editor.
Dal nodo Piattaforma nella scheda Trasformazioni della libreria di oggetti, trascina una trasformazione XML_Map nel flusso di dati.
Seleziona la modalità Batch nella finestra di dialogo.
Collega la trasformazione Query alla trasformazione XML_Map.

Crea un file di schema

Questi passaggi creano un file di schema che riflette la struttura delle tabelle di origine. Successivamente, utilizzerai il file dello schema per creare una tabella BigQuery.

Lo schema garantisce che il flusso di dati del caricatore BigQuery completi correttamente la nuova tabella BigQuery.

Apri la trasformazione mappa XML e completa le sezioni dello schema di input e output in base ai dati che includi nella tabella BigQuery.
Fai clic con il tasto destro del mouse sul nodo XML_Map nella colonna Schema Out e seleziona Genera schema Google BigQuery dal menu a discesa.
Inserisci un nome e una posizione per lo schema.
Fai clic su Salva.

SAP Data Services genera un file di schema con estensione .json.

Uno screenshot di SAP Data Services Designer che mostra il menu a discesa per generare uno schema Google BigQuery.

Crea la tabella BigQuery

Per il caricamento dei dati, devi creare una tabella nel set di dati BigQuery su Google Cloud . Utilizza lo schema che hai creato in SAP Data Services per creare la tabella.

La tabella si basa sullo schema generato nel passaggio precedente.

Accedi al tuo Google Cloud progetto nella Google Cloud console.
Seleziona BigQuery.
Fai clic sul set di dati applicabile.
Fai clic su Crea tabella.
Inserisci un nome per la tabella. Ad esempio, BQ_DATA_LOAD.
In Schema, attiva/disattiva l'impostazione per attivare la modalità Modifica come testo.
Imposta lo schema della nuova tabella in BigQuery copiando e incollando i contenuti del file dello schema che hai creato in Creare un file dello schema.
Fai clic su Crea tabella.

Importa la tabella BigQuery

Questi passaggi importano la tabella BigQuery creata nel passaggio precedente e la rendono disponibile in SAP Data Services.

Nella raccolta di oggetti di SAP Data Services Designer, fai clic con il tasto destro del mouse sul datastore BigQuery e seleziona l'opzione Aggiorna raccolta di oggetti. In questo modo viene aggiornato l'elenco delle tabelle delle origini dati che puoi utilizzare nel flusso di dati.
Apri il data store BigQuery.
Nella parte superiore del riquadro a destra, seleziona Metadati esterni. Viene visualizzata la tabella BigQuery che hai creato.
Fai clic con il tasto destro del mouse sul nome della tabella BigQuery applicabile e seleziona Importa.
Viene avviata l'importazione della tabella selezionata in SAP Data Services. La tabella è ora disponibile nella raccolta di oggetti nel nodo del datastore di destinazione.

Importa e collega il flusso di dati agli oggetti del datastore di destinazione

Dal datastore nella raccolta di oggetti, trascina la tabella BigQuery importata nel flusso di dati. Il nome del datastore in queste istruzioni è BQ_DS. Il nome del tuo datastore potrebbe essere diverso.
Collega la trasformazione XML_Map alla tabella BigQuery importata.
Apri la trasformazione XML_Map e completa le sezioni dello schema di input e output in base ai dati che includi nella tabella BigQuery.

Fai doppio clic sulla tabella BigQuery nello spazio di lavoro per aprirla e completa le opzioni nella scheda Destinazione come indicato nella tabella seguente:

Opzione	Descrizione
Crea porta	Specifica No, che è il valore predefinito. Se specifichi Sì, un file di origine o di destinazione diventa una porta del flusso di dati incorporata.
Modalità	Specifica Tronca per il caricamento iniziale, che sostituisce tutti i record esistenti nella tabella BigQuery con i dati caricati da SAP Data Services. Tronca è il valore predefinito.
Numero di caricatori	Specifica un numero intero positivo per impostare il numero di caricatori (thread) da utilizzare per l'elaborazione. Il valore predefinito è 4. Ogni caricatore avvia un job di caricamento riavviabile in BigQuery. Puoi specificare un numero qualsiasi di caricatori. Per determinare il numero appropriato di caricatori, consulta la documentazione di SAP, tra cui: Guida di riferimento alle dimensioni di SAP Data Services Strumento SAP Quicksizer Matrice di disponibilità dei prodotti SAP
Record con errori massimi per caricatore	Specifica 0 o un numero intero positivo per impostare il numero massimo di record che possono avere errori per job di caricamento prima che BigQuery interrompa il caricamento dei record. Il valore predefinito è zero (0).

Fai clic sull'icona Convalida nella barra degli strumenti in alto.
Fai clic sull'icona Indietro nella barra degli strumenti dell'applicazione per tornare all'Editor di flussi di dati.

Caricamento dei dati in BigQuery

Questi passaggi avviano il job di replica ed eseguono il flusso di dati in SAP Data Services per caricare i dati dal sistema di origine in BigQuery.

Quando esegui il caricamento, tutti i dati del set di dati di origine vengono replicati nella tabella BigQuery di destinazione collegata al flusso di caricamento dei dati. Tutti i dati nella tabella di destinazione vengono sovrascritti.

In SAP Data Services Designer, apri Project Explorer.
Fai clic con il tasto destro del mouse sul nome del job di replica e seleziona Esegui.
Fai clic su OK.
Viene avviato il processo di caricamento e nel log di SAP Data Services iniziano a essere visualizzati i messaggi di debug. I dati vengono caricati nella tabella che hai creato in BigQuery per i caricamenti iniziali. Il nome della tabella di caricamento in queste istruzioni è BQ_DATA_LOAD. Il nome della tabella potrebbe essere diverso.
Per verificare se il caricamento è stato completato, vai alla Google Cloud console e apri il set di dati BigQuery contenente la tabella. Se i dati sono ancora in fase di caricamento, accanto al nome della tabella viene visualizzato il messaggio "Caricamento".

Dopo il caricamento, i dati sono pronti per l'elaborazione in BigQuery.

Pianificazione dei carichi

Puoi pianificare l'esecuzione di un job di caricamento a intervalli regolari utilizzando la console di gestione SAP Data Services.

Apri l'applicazione SAP Data Services Management Console.
Fai clic su Amministratore.
Espandi il nodo Batch nella struttura ad albero del menu a sinistra.
Fai clic sul nome del repository SAP Data Services.
Fai clic sulla scheda Configurazione job batch.
Fai clic su Aggiungi pianificazione.
Inserisci il nome della pianificazione.
Seleziona Attivo.
Nella sezione Seleziona l'ora pianificata per l'esecuzione dei job, specifica la frequenza per l'esecuzione del caricamento delta.
1. Importante: Google Cloud limita il numero di job di caricamento BigQuery che puoi eseguire in un giorno. Assicurati che la pianificazione non superi il limite, che non può essere aumentato. Per ulteriori informazioni sul limite per i job di caricamento di BigQuery, consulta Quote e limiti nella documentazione di BigQuery.
Fai clic su Applica.

Passaggi successivi

Esegui query e analizza i dati replicati in BigQuery. Per ulteriori informazioni sulle query, vedi:

Panoramica sull'esecuzione di query sui dati di BigQuery nella documentazione di BigQuery.

Per alcune idee su come configurare una soluzione per la replica dei dati da applicazioni SAP a BigQuery in tempo quasi reale utilizzando SAP Landscape Transformation Replication Server e SAP Data Services, consulta:

Replica dei dati da applicazioni SAP a BigQuery tramite SAP Data Services e SAP LT Replication Server

Per altre architetture di riferimento, diagrammi e best practice, visita il Centro architetture di Google Cloud.

Esportare i dati dai sistemi SAP in Google BigQuery tramite SAP Data Services Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Architettura

Componenti principali della soluzione

Costi

Prerequisiti

Configura un Google Cloud progetto in Google Cloud

Crea un Google Cloud progetto

Abilita API

Crea un account di servizio

Configurazione dell'esportazione dai sistemi SAP a BigQuery

Configurazione di SAP Data Services

Crea un progetto di servizi dati

Crea un datastore di origine

Configurazione per la connessione del livello di applicazione SAP

Configurazione per la connessione del livello del database SAP

SAP HANA

Altri database supportati

Crea un datastore di destinazione

Configurare il flusso di dati tra SAP Data Services e BigQuery

Crea il job batch

Crea la logica del flusso di dati

Tabella di origine dell'importazione

Creare un flusso di dati

Importa e collega il flusso di dati agli oggetti del datastore di origine

Crea un file di schema

Crea la tabella BigQuery

Importa la tabella BigQuery

Importa e collega il flusso di dati agli oggetti del datastore di destinazione

Caricamento dei dati in BigQuery

Pianificazione dei carichi

Passaggi successivi

Esportare i dati dai sistemi SAP in Google BigQuery tramite SAP Data Services