Esta página foi traduzida pela API Cloud Translation.

Fonte de replicação do SAP SLT

Nesta página, descrevemos como ativar a replicação em tempo real de dados de aplicativos SAP para o Google Cloud usando o SAP Landscape Transformation (SLT). O conteúdo se aplica aos plug-ins SAP SLT Replication e SAP SLT Sem Replicação de RFC, que estão disponíveis no Hub do Cloud Data Fusion. Ele mostra as configurações do SAP Source System, SLT, Cloud Storage e Cloud Data Fusion, para fazer o seguinte:

Envie metadados e dados de tabelas do SAP para o Google Cloud usando o SAP SLT.
Crie um job de replicação do Cloud Data Fusion que leia os dados de um bucket do Cloud Storage.

A replicação do SAP SLT permite replicar seus dados de forma contínua e em tempo real de fontes SAP para o BigQuery. É possível configurar e executar transferências de dados de sistemas SAP sem programação.

O processo de replicação de SLT do Cloud Data Fusion é o seguinte:

Os dados vêm de um sistema de origem SAP.
O SLT rastreia e lê os dados e os envia para o Cloud Storage.
O Cloud Data Fusion extrai dados do bucket de armazenamento e os grava no BigQuery.

É possível transferir dados de sistemas SAP compatíveis, incluindo sistemas SAP hospedados no Google Cloud.

Para mais informações, consulte a Visão geral do SAP no Google Cloud e os detalhes do suporte.

Antes de começar

Para usar esse plug-in, é necessário ter conhecimento dos domínios nas seguintes áreas:

Como criar pipelines no Cloud Data Fusion
Gerenciamento de acesso com o IAM
Como configurar sistemas SAP Cloud e de planejamento de recursos empresariais (ERP) no local

Administradores e usuários que executam as configurações

As tarefas nesta página são realizadas por pessoas com os seguintes papéis no Google Cloud ou no sistema SAP:

Tipo de usuário	descrição;
Administrador do Google Cloud	Os usuários atribuídos a esse papel são administradores de contas do Google Cloud.
Usuário do Cloud Data Fusion	Os usuários atribuídos a esse papel estão autorizados a projetar e executar pipelines de dados. Eles recebem, no mínimo, o papel de leitor do Data Fusion ( `roles/datafusion.viewer`). Se estiver usando o controle de acesso baseado em papéis, talvez sejam necessários outros papéis.
Administrador do SAP	Os usuários atribuídos a essa função são administradores do sistema SAP. Eles têm acesso para fazer o download de softwares do site de serviços da SAP. Não é um papel do IAM.
Usuário SAP	Os usuários atribuídos a esse papel estão autorizados a se conectar a um sistema SAP. Não é um papel do IAM.

Operações de replicação com suporte

O plug-in SAP SLT Replication é compatível com as seguintes operações:

Modelagem de dados: todas as operações de modelagem de dados (registro insert, delete e update) são compatíveis com este plug-in.

Definição de dados: conforme descrito na Nota SAP 2055599 (é necessário o login do suporte SAP para visualização), há limitações quanto a quais alterações na estrutura da tabela do sistema de origem são replicadas automaticamente pelo SLT. Algumas operações de definição de dados não têm suporte no plug-in (é necessário promovê-las manualmente).

Compatível:
- Adicionar um campo sem chave (depois de fazer mudanças no SE11, ativar a tabela usando SE14)
Sem suporte:
- Campo "Adicionar/excluir chave"
- Excluir campo sem chave
- Modificar tipos de dados

Requisitos do SAP

Os seguintes itens são necessários no seu sistema SAP:

Você tem o SLT Server 2011 SP17 ou posterior instalado no sistema SAP de origem (incorporado) ou como um sistema dedicado do hub do SLT.
Seu sistema SAP de origem é SAP ECC ou SAP S/4HANA, compatível com DMIS 2011 SP17 ou superior, como DMIS 2018, DMIS 2020.
O complemento da interface do usuário do SAP (em inglês) precisa ser compatível com a versão do SAP Netweaver.
Seu pacote de suporte oferece suporte à classe /UI2/CL_JSON PL 12 ou mais recente. Caso contrário, implemente a Nota SAP mais recente para a classe /UI2/CL_JSON corrections de acordo com a versão do complemento da interface do usuário, como a Nota SAP 2798102 para PL12.
As seguintes medidas de segurança são aplicadas:

Requisitos do Cloud Data Fusion

Você precisa de uma instância do Cloud Data Fusion, versão 6.4.0 ou posterior, qualquer edição.
A conta de serviço atribuída à instância do Cloud Data Fusion recebe os papéis necessários. Consulte Como conceder permissão de usuário da conta de serviço.
Para instâncias particulares do Cloud Data Fusion, o peering de VPC é obrigatório.

Requisitos do Google Cloud

Ative a API Cloud Storage no projeto do Google Cloud.
O usuário do Cloud Data Fusion precisa receber permissão para criar pastas no bucket do Cloud Storage. Consulte Papéis do IAM para o Cloud Storage.
Opcional: defina a política de retenção, se exigido pela organização.

Crie o bucket de armazenamento

Antes de criar um job de replicação de SLT, crie o bucket do Cloud Storage. O job transfere dados para o bucket e atualiza o bucket de preparo a cada cinco minutos. Quando você executa o job, o Cloud Data Fusion lê os dados no bucket de armazenamento e os grava no BigQuery.

Se o SLT estiver instalado no Google Cloud

O servidor do SLT precisa ter permissão para criar e modificar objetos do Cloud Storage no bucket que você criou.

Conceda pelo menos os seguintes papéis à conta de serviço:

Criador de token da conta de serviço (roles/iam.serviceAccountTokenCreator)
Consumidor do Service Usage (roles/serviceusage.serviceUsageConsumer)
Administrador de objetos do Storage (roles/storage.objectAdmin)

Se o SLT não estiver instalado no Google Cloud

Instale o Cloud VPN ou o Cloud Interconnect entre a VM do SAP e o Google Cloud para permitir a conexão com um endpoint de metadados interno. Consulte Como configurar o Acesso privado do Google para hosts locais.

Se não for possível mapear os metadados internos:

Instale a Google Cloud CLI com base no sistema operacional da infraestrutura em que o SLT está sendo executado.
Criar uma conta de serviço no projeto do Google Cloud em que o Cloud Storage está ativado.
No sistema operacional SLT, autorize o acesso ao Google Cloud com uma conta de serviço.
Crie uma chave de API para a conta de serviço e autorize o escopo relacionado ao Cloud Storage.
Importe a chave de API para a CLI gcloud instalada anteriormente usando a CLI.
Para ativar o comando da CLI gcloud que imprime o token de acesso, configure o comando do sistema operacional SAP na ferramenta de transação SM69 no sistema de SLT.

Imprimir um token de acesso

O administrador do SAP configura o comando do sistema operacional, SM69, que recupera um token de acesso do Google Cloud.

Crie um script para imprimir um token de acesso e configure um comando do sistema operacional SAP para chamar o script como usuário <sid>adm a partir do host do SAP LT Replication Server.

Linux

Para criar um comando do SO:

No host do SAP LT Replication Server, em um diretório acessível para <sid>adm, crie um script bash que contenha as seguintes linhas:
```
PATH_TO_GCLOUD_CLI/bin/gcloud auth print-access-token SERVICE_ACCOUNT_NAME
```
Usando a interface do usuário SAP, crie um comando do SO externo:
1. Insira a transação SM69.
2. Clique em Criar.
3. Na seção Command do painel External Command, digite o nome do comando, como ZGOOGLE_CDF_TOKEN.
4. Na seção Definição:
  1. No campo Comando do sistema operacional, insira sh como a extensão do arquivo de script.
  2. No campo Parâmetros do comando do sistema operacional, digite:
```
/PATH_TO_SCRIPT/FILE_NAME.sh
```
5. Clique em Salvar.
6. Para testar o script, clique em Executar.
7. Clique em Executar novamente.
Um token do Google Cloud é retornado e exibido na parte inferior do painel da interface do usuário da SAP.

Windows

Usando a interface do usuário SAP, crie um comando de sistema operacional externo:

Insira a transação SM69.
Clique em Criar.
Na seção Command do painel External Command, insira o nome do comando, como ZGOOGLE_CDF_TOKEN.
Na seção Definição:
1. No campo Operating System Command, digite cmd /c.
2. No campo Parâmetros do comando do sistema operacional, digite:
```
gcloud auth print-access-token SERVICE_ACCOUNT_NAME
```
Clique em Salvar.
Para testar o script, clique em Executar.
Clique em Executar novamente.

Um token do Google Cloud é retornado e exibido na parte inferior do painel da interface do usuário do SAP.

Requisitos de SLT

O conector do SLT precisa ter a seguinte configuração:

O conector é compatível com SAP ECC NW 7.02, DMIS 2011 SP17 e posterior.
Configurar uma conexão RFC ou de banco de dados entre o SLT e o sistema do Cloud Storage.
Configure os certificados SSL:
- Faça o download dos seguintes certificados de AC no repositório do Google Trust Services:
  - GTS Root R1
  - GTS CA 1C3
- Na interface do usuário do SAP, use a transação STRUST para importar os certificados raiz e subordinados para a pasta SSL Client (Standard) PSE.
É necessário configurar o Gerenciador de comunicações da Internet (ICM, na sigla em inglês) para HTTPS. Verifique se as portas HTTP e HTTPS são mantidas e ativadas no sistema SAP SLT. É possível verificar isso pelo código de transação SMICM > Services.
Ative o acesso às APIs do Google Cloud na VM em que o sistema SAP SLT está hospedado. Isso permite a comunicação particular entre os serviços do Google Cloud sem roteamento pela Internet pública.
Verifique se a rede é compatível com o volume e a velocidade necessários da transferência de dados entre a infraestrutura do SAP e o Cloud Storage. Para uma instalação bem-sucedida, recomendamos o Cloud VPN e/ou o Cloud Interconnect. A capacidade da API de streaming depende das quotas de cliente que foram concedidas ao projeto do Cloud Storage.

Configurar o servidor de replicação do SLT

O usuário do SAP executa as etapas a seguir.

Nas etapas a seguir, conecte o servidor SLT ao sistema de origem e o bucket no Cloud Storage, especificando o sistema de origem, as tabelas de dados a serem replicadas e o bucket de armazenamento de destino.

Configurar o SDK do ABAP do Google

Para configurar o SLT para replicação de dados (uma vez por instância do Cloud Data Fusion), siga estas etapas:

Para configurar o conector SLT, o SAP-User insere as seguintes informações na tela de configuração (Transação SAP /GOOG/CDF_SETTINGS) sobre a chave da conta de serviço do Google Cloud para transferir dados para o Cloud Storage. Configure as seguintes propriedades na tabela /GOOG/CDF_CLT_KY usando a transação SE16 e anote esta chave:
- NOME: o nome da chave da conta de serviço (por exemplo, CDFSLT).
- SERVICE ACCOUNT NAME: o nome da conta de serviço do IAM
- ESCOPO: o escopo da conta de serviço
- PROJECT ID: o ID do seu projeto do Google Cloud
- Opcional: comando EXT OS: use esse campo somente se o SLT não estiver instalado no Google Cloud.
- CLASSE DE AUTENTICAÇÃO: se o comando do SO estiver configurado na tabela /GOOG/CDF_CLT_KY, use o valor fixo: /GOOG/CDF_CL_GCP_AUTH.
  
  Observação: se o SLT estiver hospedado no Google Cloud, o comando do SO não será usado. Em vez disso, use o valor fixo /GOOG/CDF_CL_GCP_AUTH_GOOGLE.
- TOKEN REFRESH SEC: duração da atualização do token de autorização

Insira detalhes sobre a chave da conta de serviço

Crie a configuração de replicação

Crie uma configuração de replicação no código da transação: LTRC.

Antes de prosseguir com a configuração do LTRC, verifique se a conexão RFC entre o SLT e o sistema SAP de origem foi estabelecida.
Para uma configuração de SLT, pode haver várias tabelas SAP atribuídas para replicação.

Acesse o código da transação LTRC e clique em New Configuration.
Digite o Nome da configuração e a Descrição e clique em Próximo.
Especifique a conexão RFC do sistema de origem SAP e clique em Próximo.
Em "Target System Connection Details", selecione Other.
Expanda o campo Scenario for RFC Communication, selecione SLT SDK e clique em Next.
Acesse a janela Especificar configurações de transferência e insira o nome do aplicativo: ZGOOGLE_CDF.
Digite o Número de jobs de transferência de dados, o Número de jobs de carga inicial e o Número de jobs de cálculo. Para mais informações sobre desempenho, consulte o Guia de otimização de desempenho do SAP LT Replication Server.

Dica: se você não souber o número de jobs, digite 10,10,10 e edite os valores mais tarde, quando tiver mais informações.
Clique em Tempo real > Próxima.
Revise a configuração e clique em Salvar. Observe o ID de transferência em massa para as etapas a seguir.
Para manter o ID da transferência em massa e os detalhes da tabela SAP, execute a transação SAP: /GOOG/CDF_SETTINGS.
Clique em Executar ou pressione F8.
Crie uma nova entrada clicando no ícone de anexação de linha.
1. Insira o ID de transferência em massa, a chave de transferência em massa, o nome da chave do GCP e o bucket de destino do GCS. Marque a caixa de seleção Está ativo e salve as mudanças.
Selecione a configuração na coluna Nome da configuração e clique em Provisionamento de dados.
Opcional: personalize os nomes da tabela e dos campos.
1. Clique em Nomes personalizados e salve.
2. Clique em Tela.
  
  Cuidado: configure a coluna da tabela de exibição antes de iniciar o job de replicação no LTRC da transação. Os nomes personalizados só estarão disponíveis no BigQuery se os mapeamentos forem mantidos e salvos.
3. Crie uma nova entrada clicando nos botões Anexar linha ou Criar.
4. Insira os nomes da tabela SAP e da tabela externa a serem usados no BigQuery e salve as alterações.
5. Clique no botão Visualizar na coluna Exibir campos para manter o mapeamento dos campos da tabela.
6. Uma página é aberta com os mapeamentos sugeridos. Opcional: edite o Nome do campo temporário e a Descrição do campo e salve os mapeamentos.
Acesse a transação do LTRC.
Selecione o valor na coluna Nome da configuração e clique em Provisionamento de dados.
Digite o nome da tabela no campo Nome da tabela no banco de dados e selecione o cenário de replicação.
Clique em Executar. Isso aciona a implementação do SDK do SLT e começa a transferir os dados para o bucket de destino no Cloud Storage.

Instalar arquivos de transporte SAP

Para projetar e executar jobs de replicação no Cloud Data Fusion, os componentes do SAP são entregues como arquivos de transporte SAP arquivados em um arquivo ZIP. O download fica disponível quando você implanta o plug-in no hub do Cloud Data Fusion.

Fazer o download do arquivo ZIP de transporte do SAP SLT

Os IDs de solicitação de transporte SAP e os arquivos associados são fornecidos na tabela a seguir:

ID do transporte	Cofile	Arquivo de dados	Conteúdo
ED1K900520	K900520.ED1	R900520.ED1	Implementação do SAP BADI ES_IUUC_REPL_RUNTIME_OLO_EXIT
ED1K900337	K900337.ED1	R900337.ED1	Papel de autorização /GOOG/SLT_CDF_AUTH

Para instalar os transportes SAP, siga estas etapas:

Etapa 1: fazer upload dos arquivos de solicitação de transporte

Faça login no sistema operacional da instância SAP.
Use o código de transação SAP AL11 para ver o caminho da pasta DIR_TRANS. Normalmente, o caminho é /usr/sap/trans/.
Copie os arquivos compartilhados para a pasta DIR_TRANS/cofiles.
Copie os arquivos de dados para a pasta DIR_TRANS/data.
Defina o usuário e o grupo de dados e o coarquivo como <sid>adm e sapsys.

Etapa 2: importar os arquivos de solicitação de transporte

O administrador do SAP pode importar os arquivos de solicitação de transporte usando o sistema de gerenciamento de transporte da SAP ou o sistema operacional:

Sistema de gerenciamento de transporte SAP

Faça login no sistema SAP como administrador da SAP.
Digite o STMS da transação.
Clique em Visão geral > Importações.
Na coluna "Fila", clique duas vezes no SID atual.
Clique em Extras > Outras solicitações > Adicionar.
Selecione o ID da solicitação de transporte e clique em Continuar.
Selecione a solicitação de transporte na fila de importação e clique em Solicitar > Importar.
Digite o número do cliente.
Na guia Opções, selecione Substituir originais e Ignorar a versão inválida do componente (se disponível).

Opcional: para reimportar os transportes depois, clique em Deixe solicitações de transporte na fila para importação posterior e Importar solicitações de transporte novamente. Isso é útil para atualizações do sistema SAP e restaurações de backup.
Clique em Continuar.
Verifique se o módulo de função e os papéis de autorização foram importados usando transações como SE80 e PFCG.

Sistema operacional

Faça login no sistema SAP como administrador da SAP.
Adicione solicitações ao buffer de importação:
```
tp addtobuffer TRANSPORT_REQUEST_ID SID
```
Por exemplo: tp addtobuffer IB1K903958 DD1
Importe as solicitações de transporte:
```
tp import TRANSPORT_REQUEST_ID SID client=NNN U1238
```
Substitua NNN pelo número do cliente. Por exemplo: tp import IB1K903958 DD1 client=800 U1238

Observação: U1238 indica a definição das opções descritas nas etapas de 9 a 10 na Opção 1. Os números indicam o número da ordem da opção correspondente na interface do usuário do SAP, que pode variar de acordo com o sistema. Os números precisam ser ajustados pelo administrador do SAP.
Verifique se o módulo da função e os papéis de autorização foram importados com êxito usando as transações apropriadas, como SE80 e PFCG.

Autorizações SAP necessárias

Para executar um pipeline de dados no Cloud Data Fusion, você precisa de um usuário SAP. O usuário SAP precisa ser do tipo "Comunicações" ou "Caixa de diálogo". Para evitar o uso de recursos de caixa de diálogo do SAP, o tipo Communications é recomendado. Os usuários podem ser criados pelo administrador do SAP usando o código de transação SU01.

As autorizações SAP são necessárias para manter e configurar o conector para SAP, uma combinação de objetos de autorização padrão e novos do conector da SAP. Os objetos de autorização são mantidos com base nas políticas de segurança da sua organização. A lista a seguir descreve algumas autorizações importantes necessárias para o conector:

Objeto de autorização: o objeto de autorização ZGOOGCDFMT é enviado como parte do papel de solicitação de transporte.
Criação de papel: crie um papel usando o código de transação PFCG.
Para objetos de autorização SAP padrão, sua organização gerencia permissões com o próprio mecanismo de segurança.
Para objetos de autorização personalizada, forneça valores nos campos de autorização para objetos de autorização ZGOOGCDFMT.
Para um controle de acesso detalhado, o ZGOOGCDFMT fornece autorização baseada em grupo de autorização. Os usuários com acesso completo, parcial ou nenhum acesso aos grupos de autorização recebem acesso com base no grupo de autorização atribuído no papel deles.
/GOOG/SLT_CDF_AUTH: papel com acesso a todos os grupos de autorização. Para restringir o acesso específico a um determinado grupo de autorização, mantenha o FICDF do grupo de autorização na configuração.

Criar um destino RFC para a origem

Antes de começar a configuração, verifique se a conexão RFC está estabelecida entre a origem e o destino.

Acesse o código de transação SM59.
Clique em Criar > Tipo de conexão 3 (Conexão ABAP).
Na janela Configurações técnicas, insira os detalhes sobre o destino do RFC.
Clique na guia Login e segurança para manter as credenciais RFC (usuário e senha do RFC).
Clique em Salvar.
Clique em Teste de conexão. Após um teste bem-sucedido, você pode continuar.
Verifique se o teste de autorização de RFC foi concluído.
Clique em Utilitários > Teste > Teste de autorização.

Configurar o plug-in

Para configurar o plug-in, implante-o do Hub, crie um job de replicação e configure a origem e o destino com as etapas a seguir.

Implantar o plug-in no Cloud Data Fusion

O usuário do Cloud Data Fusion executa as etapas a seguir.

Antes de executar o job de replicação do Cloud Data Fusion, implante o plug-in SAP SLT Replication:

Acesse sua instância:
1. No console do Google Cloud, acesse a página Instâncias do Cloud Data Fusion.
  
  Acesse "Instâncias"
2. Ative a replicação em uma instância nova ou atual:
  - Para uma nova instância, clique em Criar instância, insira um nome, clique em Adicionar aceleradores, marque a caixa de seleção Replicação e clique em Salvar.
  - Para uma instância atual, consulte Ativar replicação em uma instância atual.
3. Clique em Ver instância para abrir a instância na interface da Web do Cloud Data Fusion.
Clique em Hub.
Acesse a guia SAP, clique em SAP SLT e em Plug-in de replicação do SAP SLT ou SAP SLT No RFC Replication Plugin.

Observação: se a guia "SAP" não estiver visível, consulte Solução de problemas de integrações SAP.
Selecione Implantar.

Criar um job de replicação

O plug-in SAP SLT Replication lê o conteúdo de tabelas SAP usando um bucket de preparo da API Cloud Storage.

Para criar um job de replicação para a transferência de dados, siga estas etapas:

Na instância aberta do Cloud Data Fusion, clique em Início > Replicação > Criar um job de replicação. Se não houver uma opção de replicação, ative a replicação para a instância.
Insira um Nome e uma Descrição exclusivos para o job de replicação.
Clique em Próxima.

Configurar a origem

Configure a origem inserindo valores nos seguintes campos:
- ID do projeto: o ID do seu projeto do Google Cloud (este campo é preenchido automaticamente)
- Caminho do GCS de replicação de dados: o caminho do Cloud Storage que contém os dados para replicação. Precisa ser o mesmo caminho configurado nos jobs do SAP SLT. Internamente, o caminho fornecido é concatenado com Mass Transfer ID e Source Table Name:
  
  Formato: gs://<base-path>/<mass-transfer-id>/<source-table-name>
  
  Exemplo: gs://slt_bucket/012/MARA
- GUID: o GUID do SLT, um identificador exclusivo atribuído ao ID de transferência em massa do SAP SLT.
- ID de transferência em massa: o ID de transferência em massa do SLT é um identificador exclusivo atribuído à configuração no SAP SLT.
- Caminho do GCS da biblioteca SAP JCo: o caminho de armazenamento que contém os arquivos da biblioteca SAP JCo enviados pelo usuário. Faça o download das bibliotecas SAP JCo no Portal de suporte da SAP. Removido na versão 0.10.0 do plug-in.
- SLT Server Host: nome do host do servidor SLT ou endereço IP. Removido na versão 0.10.0 do plug-in.
- Número do sistema SAP: o número do sistema de instalação fornecido pelo administrador do sistema (por exemplo, 00). Removido na versão 0.10.0 do plug-in.
- Cliente SAP: o cliente SAP a ser usado, por exemplo, 100 (removido na versão 0.10.0 do plug-in)
- Linguagem SAP: idioma de logon SAP (por exemplo, EN). (removido na versão 0.10.0 do plug-in)
- Nome de usuário de logon SAP: nome de usuário do SAP. Removido na versão 0.10.0 do plug-in.
  - Recomendado: se o nome de usuário de login do SAP for alterado periodicamente, use uma macro.
- Senha de logon SAP (M): senha de usuário SAP para autenticação de usuário.
  - Recomendado: use macros seguras para valores confidenciais, como senhas. Removido na versão 0.10.0 do plug-in.
- Suspender a replicação de SLT quando o job de CDF for interrompido: tenta interromper o job de replicação de SLT (para as tabelas envolvidas) quando o job de replicação do Cloud Data Fusion é interrompido. pode falhar se o job no Cloud Data Fusion for interrompido inesperadamente;
- Replicar dados atuais: indica se é necessário replicar os dados das tabelas de origem. Por padrão, os jobs replicam os dados das tabelas de origem. Se definido como false, todos os dados atuais nas tabelas de origem serão ignorados e somente as alterações que ocorrerem após o início do job serão replicadas.
- Chave da conta de serviço: a chave para usar ao interagir com o Cloud Storage. A conta de serviço precisa ter permissão para gravar no Cloud Storage. Quando executado em uma VM do Google Cloud, ele precisa ser definido como auto-detect para usar a conta de serviço anexada à VM.
  
  Observação: as chaves de conta de serviço poderão causar problemas de segurança se não forem gerenciadas corretamente. Sempre que possível, escolha uma alternativa mais segura para as chaves de conta de serviço. Caso seja necessário autenticar com uma chave de conta de serviço, você será responsável pela segurança da chave privada e por outras operações descritas em Práticas recomendadas para gerenciar chaves de contas de serviço. Se não for possível criar uma chave de conta de serviço, a criação pode ser desativada para sua organização. Para mais informações, consulte Gerenciar recursos da organização com segurança por padrão.
Clique em Próxima.

Configurar o destino

Para gravar dados no BigQuery, o plug-in requer acesso de gravação ao BigQuery e a um bucket de teste. Os eventos de alteração são gravados primeiro em lotes, do SLT para o Cloud Storage. Em seguida, elas são carregadas em tabelas de preparo no BigQuery. As alterações da tabela de preparo são mescladas na tabela de destino final usando uma consulta de mesclagem do BigQuery.

A tabela de destino final inclui todas as colunas originais da tabela de origem e mais uma coluna _sequence_num. O número da sequência garante que os dados não sejam duplicados ou perdidos em cenários de falha do replicador.

Configure a origem inserindo valores nos seguintes campos:
- ID do projeto: projeto do conjunto de dados do BigQuery. Ao executar em um cluster do Dataproc, esse campo pode ficar em branco, o que usará o projeto do cluster.
- Credenciais: consulte Credenciais.
- Chave da conta de serviço: o conteúdo da chave da conta de serviço que será usada ao interagir com o Cloud Storage e o BigQuery. Ao executar em um cluster do Dataproc, deixe em branco, o que usa a conta de serviço do cluster.
- Nome do conjunto de dados: nome do conjunto de dados a ser criado no BigQuery. Ele é opcional e, por padrão, o nome do conjunto de dados é o mesmo do banco de dados de origem. Um nome válido só pode conter letras, números e sublinhados, e o comprimento máximo pode ser de 1.024 caracteres. Todos os caracteres inválidos são substituídos por sublinhado no nome final do conjunto de dados, e os caracteres que excedem o limite de comprimento são truncados.
- Nome da chave de criptografia: a chave de criptografia gerenciada pelo cliente (CMEK) usada para proteger os recursos criados por esse destino. O nome da chave de criptografia precisa estar no formato projects/<project-id>/locations/<key-location>/keyRings/<key-ring-name>/cryptoKeys/<key-name>.
- Local: o local onde o conjunto de dados do BigQuery e o bucket de preparação do Cloud Storage são criados. Por exemplo, us-east1 para buckets regionais, us para buckets multirregionais. Consulte Locais. Esse valor será ignorado se um bucket atual for especificado, já que o bucket de preparo e o conjunto de dados do BigQuery são criados no mesmo local desse bucket.
- Bucket de preparo: o bucket em que os eventos de alteração são gravados antes de serem carregados nas tabelas de preparo. As alterações são gravadas em um diretório que contém o nome e o namespace do replicador. É seguro usar o mesmo bucket em vários replicadores na mesma instância. Se ele for compartilhado por replicadores em várias instâncias, verifique se o namespace e o nome são exclusivos. Caso contrário, o comportamento será indefinido. O bucket precisa estar no mesmo local que o conjunto de dados do BigQuery. Se não for fornecido, um novo bucket será criado para cada job nomeado como df-rbq-<namespace-name>-<job-name>-<deployment-timestamp>.
  
  Observação: é necessário excluir explicitamente o bucket depois que o job for excluído.
- Intervalo de carregamento (segundos): número de segundos a aguardar antes de carregar um lote de dados no BigQuery.
- Prefixo da tabela de preparo: as alterações são gravadas primeiro em uma tabela de preparo antes de mescladas na tabela final. Os nomes das tabelas de preparo são gerados adicionando esse prefixo ao nome da tabela de destino.
- Exigir intervenção de queda manual: se é necessária uma ação administrativa manual para remover tabelas e conjuntos de dados quando uma tabela ou um evento de eliminação do banco de dados é encontrado. Quando definido como verdadeiro, o replicador não exclui uma tabela ou um conjunto de dados. Em vez disso, ela falha e tenta novamente até que a tabela ou o conjunto de dados não exista. Se o conjunto de dados ou a tabela não existir, nenhuma intervenção manual será necessária. O evento é ignorado normalmente.
- Ativar exclusões reversíveis: se definida como verdadeira, quando um evento de exclusão for recebido pelo destino, a coluna _is_deleted do registro será definida como true. Caso contrário, o registro será excluído da tabela do BigQuery. Essa configuração não opera para uma origem que gera eventos fora de ordem, e os registros sempre são excluídos de forma reversível da tabela do BigQuery.
Clique em Próxima.

Credenciais

Se o plug-in for executado em um cluster do Dataproc, a chave da conta de serviço precisará estar definida para detecção automática. As credenciais são lidas automaticamente do ambiente do cluster.

Se o plug-in não for executado em um cluster do Dataproc, será necessário fornecer o caminho para uma chave de conta de serviço. A chave da conta de serviço pode ser encontrada na página do IAM no console do Google Cloud. Verifique se a chave da conta tem permissão para acessar o BigQuery. O arquivo da chave da conta de serviço precisa estar disponível em todos os nós no cluster e ser legível para todos os usuários que executam o job.

Limitações

As tabelas precisam ter uma chave primária para serem replicadas.
As operações de renomeação de tabela não são compatíveis.
As alterações de tabela são parcialmente aceitas.
- Uma coluna não anulável existente pode ser alterada para se tornar uma coluna anulável.
- É possível adicionar novas colunas anuláveis a uma tabela existente.
- Qualquer outro tipo de alteração no esquema da tabela vai falhar.
- As alterações na chave primária não falharão, mas os dados atuais não serão regravados para obedecer à exclusividade na nova chave primária.

Selecionar tabelas e transformações

Na etapa Selecionar tabelas e transformações, aparece uma lista de tabelas selecionadas para replicação no sistema de SLT.

Selecione as tabelas para replicar.
Opcional: selecione outras operações de esquema, como inserções, atualizações ou exclusões.
Para ver o esquema, clique em Colunas a serem replicadas em uma tabela.
Opcional: para renomear colunas no esquema, siga estas etapas:
1. Ao visualizar o esquema, clique em Transform > Renomear.
2. No campo Renomear, digite um novo nome e clique em Aplicar.
3. Para salvar o novo nome, clique em Atualizar e Salvar.
Observação :no Cloud Data Fusion 6.9 e versões mais recentes, essa opção está disponível.
Clique em Próxima.

Opcional: configurar propriedades avançadas

Se você souber a quantidade de dados que está replicando em uma hora, poderá selecionar a opção apropriada.

Revisar avaliação

A etapa Revisar avaliação verifica problemas de esquema, recursos ausentes ou problemas de conectividade que ocorrem durante a replicação.

Na página Revisar avaliação, clique em Ver mapeamentos.

Se ocorrer algum problema, ele precisará ser resolvido antes que você possa continuar.
Opcional: se você renomeou as colunas ao selecionar as tabelas e as transformações, verifique se os novos nomes estão corretos nesta etapa.
Clique em Próxima.

Confira o resumo e implante o job de replicação

Na página Revisar os detalhes do job de replicação, revise as configurações e clique em Implantar job de replicação.

Selecione um perfil do Compute Engine

Depois de implantar o job de replicação, clique em Configurar em qualquer página da interface da Web do Cloud Data Fusion.
Selecione o perfil do Compute Engine que você quer usar para executar esse job de replicação.
Clique em Salvar.

Iniciar o job de replicação

Para executar o job de replicação, clique em Iniciar.

Inicie o job de replicação na interface da Web do Cloud Data Fusion

Opcional: otimizar o desempenho

Por padrão, o plug-in é configurado para otimizar o desempenho. Para mais otimizações, consulte Argumentos do ambiente de execução.

O desempenho da comunicação do SLT e do Cloud Data Fusion depende destes fatores:

SLT no sistema de origem versus um sistema de SLT central dedicado (opção preferida)
Processamento de jobs em segundo plano no sistema de SLT
Processos de trabalho de caixa de diálogo no sistema SAP de origem
O número de processos de job em segundo plano alocados para cada ID de transferência em massa na guia Administração do LTRC
Configurações de LTRS
Hardware (CPU e memória) do sistema SLT
O banco de dados usado (por exemplo: HANA, Sybase ou DB2)
A largura de banda da Internet (conectividade entre o sistema SAP e o Google Cloud pela Internet)
Utilização preexistente (carga) no sistema
O número de colunas na tabela. Com mais colunas, a replicação fica lenta e a latência pode aumentar.

Os seguintes tipos de leitura nas configurações do LTRS são recomendados para os carregamentos iniciais:

Sistema de SLT	Sistema de origem	Tipo de tabela	Tipo de leitura recomendado [carregamento inicial]
SLT 3.0 independente [DMIS 2018_1_752 SP 2]	S/4 HANA 1909	Transparente (pequeno/médio) Transparente (grande) Tabela de cluster	1 cálculo de intervalo 1 cálculo de intervalo 4 fila de remetentes
SLT incorporado [S4CORE 104 HANA 1909]	N/A	Transparente (pequeno/médio) Transparente (grande) Tabela de cluster	1 cálculo de intervalo 1 cálculo de intervalo 4 fila de remetentes
SLT 2.0 independente [DMIS 2011_1_731 SP 17]	ECC NW 7.02	Transparente (pequeno/médio) Transparente (grande) Tabela de cluster	Fila de 5 remetentes Fila de remetentes de 5 4 Fila de remetentes
SLT incorporado [DMIS 2011_1_700 SP 17]	N/A	Transparente (pequeno/médio) Transparente (grande) Tabela de cluster	Fila de 5 remetentes Fila de remetentes de 5 4 Fila de remetentes

Para replicação, use "Sem intervalos" para melhorar o desempenho:
- Os intervalos precisam ser usados somente quando os backlogs são gerados em uma tabela de geração de registros com alta latência.
- Usando o cálculo de um intervalo: o tipo de leitura para a carga inicial não é recomendado em casos de sistemas SLT 2.0 e não HANA.
- Usando o cálculo de um intervalo: o tipo de leitura para a carga inicial pode resultar em registros duplicados no BigQuery.
O desempenho é sempre melhor quando um sistema de SLT autônomo é usado.
Um sistema de SLT autônomo é sempre recomendado se a utilização de recursos do sistema de origem já for alta.

Argumentos de ambiente de execução

snapshot.thread.count: transmite o número de linhas de execução para começar a executar o carregamento de dados SNAPSHOT/INITIAL em paralelo. Por padrão, ele usa o número de vCPUs disponíveis no cluster do Dataproc em que o job de replicação é executado.

Recomendado: defina esse parâmetro somente nos casos em que for necessário ter um controle preciso sobre o número de linhas de execução paralelas (por exemplo, para diminuir o uso no cluster).
poll.file.count: transmite o número de arquivos a serem pesquisados do caminho do Cloud Storage fornecido no campo Caminho do GCS de replicação de dados na interface da Web. Por padrão, o valor é 500 por enquete. No entanto, com base na configuração do cluster, ele pode ser aumentado ou diminuído.

Recomendado: defina esse parâmetro somente se tiver requisitos rigorosos de atraso de replicação. Valores mais baixos podem reduzir o atraso. É possível usá-lo para melhorar a capacidade. Se ele não responder, use valores maiores que o padrão.
bad.files.base.path: transmite o caminho base do Cloud Storage em que todos os arquivos de dados de erro ou com defeito que foram encontrados durante a replicação são copiados. Isso é útil quando há requisitos rigorosos para a auditoria de dados e um local específico precisa ser usado para registrar transferências com falha.

Por padrão, todos os arquivos com falha são copiados do caminho do Cloud Storage fornecido no campo Caminho do Cloud Storage de replicação de dados na interface da Web.
- Padrão do caminho final de arquivos de dados com falha:
```
gs://BASE_FILE_PATH/MASS_TRANSFER_ID/SOURCE_TABLE_NAME/bad_files/REPLICATION_JOB_NAME/REPLICATION_JOB_ID/BAD_FILE_NAME
```
- Exemplo:
```
gs://slt_to_cdf_bucket/001/MARA/bad_files/MaraRepl/05f97349-7398-11ec-9443-8
ac0640fc83c/20220205_1901205168830_DATA_INIT.xml
```
Os critérios para um arquivo inválido são um arquivo XML corrompido ou inválido, valores de PK ausentes ou um problema de incompatibilidade de tipo de dados de campo.

Detalhes do suporte

Produtos e versões compatíveis da SAP

SAP_BASIS 702, SP-Level 0016 e superior.
versão SAP_ABA 702, SP-nível 0016 e mais recentes.
Versão DMIS 2011_1_700, SP nível 0017 e superior.

Versões de SLT compatíveis

As versões 2 e 3 do SLT são compatíveis.

Modelos de implantação SAP compatíveis

SLT como um sistema autônomo ou incorporado ao sistema de origem.

Notas SAP que precisam ser implementadas antes de você começar a usar o SLT

Se o pacote de suporte não incluir correções de classe /UI2/CL_JSON para PL 12 ou mais recente, implemente a Nota SAP mais recente para correções de classe /UI2/CL_JSON, por exemplo, Nota SAP 2798102 para PL12.

Recomendado: implemente as notas do SAP recomendadas pelo relatório CNV_NOTE_ANALYZER_SLT com base na condição do sistema central ou de origem. Para mais informações, consulte a Nota SAP 3016862 (é necessário o login SAP).

Se a SAP já estiver configurada, nenhuma outra observação precisará ser implementada. Para quaisquer erros ou problemas específicos, consulte a nota central da SAP referente à sua versão do SLT.

Limites para o volume de dados ou a largura do registro

Não há limite definido para o volume de dados extraídos e para a largura do registro.

Capacidade esperada para o plug-in SAP SLT Replication

Para um ambiente configurado de acordo com as diretrizes em Otimizar o desempenho, o plug-in pode extrair cerca de 13 GB por hora para o carregamento inicial e 3 GB por hora para replicação (CDC). O desempenho real pode variar de acordo com a carga do sistema do Cloud Data Fusion e da SAP ou com o tráfego de rede.

Suporte para extração de delta do SAP (dados alterados)

A extração do delta do SAP é compatível.

Obrigatório: peering de locatário para instâncias do Cloud Data Fusion

O peering de locatário é necessário quando a instância do Cloud Data Fusion é criada com um endereço IP interno. Para mais informações sobre o peering de locatário, consulte Como criar uma instância particular.

Resolver problemas

O job de replicação continua reiniciando

Se o job de replicação continuar reiniciando automaticamente, aumente a memória do cluster do job de replicação e o execute novamente.

Cópias no coletor do BigQuery

Se você definir o número de jobs paralelos nas configurações avançadas do plug-in SAP SLT Replication, quando as tabelas forem grandes, ocorrerá um erro que causa colunas duplicadas no coletor do BigQuery.

Para evitar o problema, remova os jobs paralelos para carregar dados.

Cenários de erro

A tabela a seguir lista algumas mensagens de erro comuns (o texto entre aspas será substituído pelos valores reais no ambiente de execução):

ID da mensagem	Mensagem	Ação recomendada
`CDF_SAP_SLT_01402`	`Service account type is not defined for SERVICE_ACCT_NAME_FROM_UI.`	Verifique se o caminho do Cloud Storage fornecido está correto.
`CDF_SAP_SLT_01403`	`Service account key provided is not valid due to error: ROOT_CAUSE. Please provide a valid service account key for service account type : SERVICE_ACCT_NAME_FROM_UI.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_01404`	`Mass Transfer ID could not be found. Please ensure that it exists in given GCS Bucket.`	Confira se o ID de transferência em massa fornecido está no formato correto.
`CDF_SAP_SLT_01502`	`The specified data replication GCS path 'slt_to_cdf_bucket_1' or Mass Transfer ID '05C' could not be found. Please ensure that it exists in GCS.`	Verifique se o caminho do Cloud Storage fornecido está correto.
`CDF_SAP_SLT_01400`	`Metadata file not found. The META_INIT.json file is not present or file is present with invalid format.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_03408`	`Failed to start the event reader.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_03409`	`Error while processing TABLE_NAME file for source table gs://CLOUD_STORAGE_BUCKET_NAME/MT_ID/TABLE_NAME /FILE_NAME. Root cause: ROOT_CAUSE.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_03410`	`Failed to replicate data for source table TABLE_NAME from file: gs://CLOUD_STORAGE_BUCKET_NAME/MT_ID/ TABLE_NAME/FILE_NAME. Root cause: ROOT_CAUSE.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_03411`	`Failed data replication for source table TABLE_NAME. Root cause: ROOT_CAUSE.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
`CDF_SAP_SLT_03412`	`Failed to create target table for source table TABLE_NAME. Root cause: ROOT_CAUSE.`	Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.

Mapeamento de tipo de dados

A tabela a seguir mostra o mapeamento entre os tipos de dados usados em aplicativos SAP e o Cloud Data Fusion.

Tipo de dados do SAP	Tipo ABAP	Descrição (SAP)	Tipo de dados do Cloud Data Fusion
Numérico
INT1	b	Inteiro de 1 byte	`int`
INT2	s	Inteiro de 2 bytes	`int`
INT4	i	Inteiro de 4 bytes	`int`
INT8	8	Inteiro de 8 bytes	`long`
DEZ	p	Número no pacote no formato BCD (DEC)	`decimal`
DF16_DEC DF16_RAW	a	Ponto flutuante decimal de 8 bytes IEEE 754r	`decimal`
DF34_DEC DF34_RAW	e	Ponto flutuante decimal de 16 bytes IEEE 754r	`decimal`
FLTP	f	Número de ponto flutuante binário	`double`
Caractere
CARRO LCHR	c	String de caracteres	`string`
SSTRING GEOM_EWKB	string	String de caracteres	`string`
STRING GEOM_EWKB	string	CLOB de string de caracteres	`bytes`
NUMC ACCP	n	Texto numérico	`string`
Byte
RAW LRAW	x	Dados binários	`bytes`
RAWSTRING	string extra	String de bytes BLOB	`bytes`
Data/hora
DATS	d	Data	`date`
Timóteo	t	Tempo	`time`
TIMESTAMP	Ultcl	( Utclong) Carimbo de data/hora	`timestamp`

A seguir

Saiba mais sobre o Cloud Data Fusion.
Saiba mais sobre Go no Google Cloud.