Origem de replicação do SAP SLT

Nesta página, descrevemos como ativar a replicação em tempo real de dados de aplicativos SAP para o Google Cloud usando o SAP Landscape Transformation (SLT). O conteúdo se aplica aos plug-ins SAP SLT Replication e SAP SLT No RFC Replication, disponíveis no Hub do Cloud Data Fusion. Ele mostra as configurações do SAP Source System, SLT, Cloud Storage e Cloud Data Fusion para fazer o seguinte:

  • Enviar metadados e dados de tabelas do SAP para o Google Cloud usando o SAP SLT.
  • Criar um job de replicação do Cloud Data Fusion que leia os dados de um bucket do Cloud Storage.

A replicação do SAP SLT permite replicar seus dados continuamente e em tempo real de fontes SAP para o BigQuery. É possível configurar e executar transferências de dados de sistemas SAP sem precisar de programação.

O processo de replicação SLT do Cloud Data Fusion é o seguinte:

  1. Os dados vêm de um sistema de origem SAP.
  2. O SLT rastreia e lê os dados e os envia para o Cloud Storage.
  3. O Cloud Data Fusion extrai dados do bucket de armazenamento e os grava no BigQuery.

É possível transferir dados de sistemas SAP compatíveis, incluindo sistemas SAP hospedados no Google Cloud.

Para mais informações, consulte a Visão geral do SAP no Google Cloud e os detalhes de suporte.

Antes de começar

Para usar esse plug-in, é necessário ter conhecimento dos domínios nas seguintes áreas:

  • Como criar pipelines no Cloud Data Fusion
  • Gerenciamento de acesso com o IAM
  • Como configurar sistemas SAP Cloud e de planejamento de recursos empresariais (ERP) no local

Administradores e usuários que executam as configurações

As tarefas nesta página são realizadas por pessoas com os seguintes papéis no Google Cloud ou no sistema SAP:

Tipo de usuário descrição;
Administrador do Google Cloud Os usuários atribuídos a esse papel são administradores de contas do Google Cloud.
Usuário do Cloud Data Fusion Os usuários atribuídos a esse papel estão autorizados a projetar e executar pipelines de dados. Eles recebem, no mínimo, o papel de leitor do Data Fusion ( roles/datafusion.viewer). Se estiver usando o controle de acesso baseado em papéis, talvez sejam necessários outros papéis.
Administrador do SAP Os usuários atribuídos a essa função são administradores do sistema SAP. Eles têm acesso para fazer o download de softwares do site de serviços da SAP. Não é um papel do IAM.
Usuário SAP Os usuários atribuídos a esse papel estão autorizados a se conectar a um sistema SAP. Não é um papel do IAM.

Operações de replicação com suporte

O plug-in SAP SLT Replication oferece suporte às seguintes operações:

Modelagem de dados: todas as operações de modelagem de dados (registro insert, delete e update) são compatíveis com esse plug-in.

Definição de dados: conforme descrito na Nota SAP 2055599 (login de suporte SAP necessário para visualização), há limitações em relação a quais alterações na estrutura da tabela do sistema de origem são replicadas automaticamente pelo SLT. Algumas operações de definição de dados não têm suporte no plug-in, e é necessário propagá-las manualmente.

  • Compatível:
    • Adicionar campo sem chave (depois de fazer alterações no SE11, ative a tabela usando o SE14)
  • Sem suporte:
    • Adicionar/excluir campo de chave
    • Excluir campo sem chave
    • Modificar tipos de dados

Requisitos da SAP

Os itens a seguir são necessários no seu sistema SAP:

  • Você tem o SLT Server versão 2011 SP17 ou mais recente instalado no sistema SAP de origem (incorporado) ou como um sistema de hub do SLT dedicado.
  • O sistema SAP de origem é o SAP ECC ou SAP S/4HANA, que tem suporte ao DMIS 2011 SP17 ou mais recente, como DMIS 2018 e DMIS 2020.
  • O complemento da interface do usuário SAP precisa ser compatível com sua versão do SAP Netweaver.
  • Seu pacote de suporte oferece suporte à classe /UI2/CL_JSON PL 12 ou mais recente. Caso contrário, implemente a nota SAP mais recente para a classe /UI2/CL_JSON corrections de acordo com a versão do complemento de interface do usuário, como a Nota SAP 2798102 para PL12.

  • A seguinte segurança está em vigor:

Requisitos do Cloud Data Fusion

  • Você precisa de uma instância do Cloud Data Fusion versão 6.4.0 ou posterior, qualquer edição.
  • A conta de serviço atribuída à instância do Cloud Data Fusion recebe os papéis necessários. Consulte Como conceder permissão de usuário da conta de serviço.
  • Para instâncias particulares do Cloud Data Fusion, o peering de VPC é obrigatório.

Requisitos do Google Cloud

crie o bucket de armazenamento

Antes de criar um job de replicação do SLT, crie o bucket do Cloud Storage. O job transfere dados para o bucket e atualiza o bucket de preparo a cada cinco minutos. Quando você executa o job, o Cloud Data Fusion lê os dados no bucket de armazenamento e os grava no BigQuery.

Se o SLT estiver instalado no Google Cloud

O servidor do SLT precisa ter permissão para criar e modificar objetos do Cloud Storage no bucket que você criou.

No mínimo, conceda os seguintes papéis à conta de serviço:

Se o SLT não estiver instalado no Google Cloud

Instale o Cloud VPN ou o Cloud Interconnect entre a VM SAP e o Google Cloud para permitir a conexão com um endpoint de metadados interno. Consulte Como configurar o Acesso privado do Google para hosts locais.

Se não for possível mapear os metadados internos:

  • Instale a Google Cloud CLI com base no sistema operacional da infraestrutura em que o SLT está sendo executado.

  • Crie uma conta de serviço no projeto do Google Cloud em que o Cloud Storage está ativado.

  • No sistema operacional SLT, autorize o acesso ao Google Cloud com uma conta de serviço.

  • Crie uma chave de API para a conta de serviço e autorize o escopo relacionado ao Cloud Storage.

  • Importe a chave de API para a CLI gcloud instalada anteriormente usando a CLI.

  • Para ativar o comando da CLI gcloud que imprime o token de acesso, configure o comando do sistema operacional SAP na ferramenta de transação SM69 no sistema SLT.

O administrador do SAP configura o comando do sistema operacional, SM69, que recupera um token de acesso do Google Cloud.

Crie um script para imprimir um token de acesso e configure um comando do sistema operacional SAP para chamar o script como o usuário <sid>adm pelo host do SAP LT Replication Server.

Linux

Para criar um comando do SO:

  1. No host do SAP LT Replication Server, em um diretório acessível a <sid>adm, crie um script bash que contenha as seguintes linhas:

    PATH_TO_GCLOUD_CLI/bin/gcloud auth print-access-token SERVICE_ACCOUNT_NAME
    
  2. Usando a interface de usuário SAP, crie um comando de SO externo:

    1. Insira a transação SM69.
    2. Clique em Criar.
    3. Na seção Comando do painel Comando externo, insira o nome do comando, como ZGOOGLE_CDF_TOKEN.
    4. Na seção Definição:

      1. No campo Comando do sistema operacional, insira sh como a extensão do arquivo de script.
      2. No campo Parâmetros do comando do sistema operacional, digite:

        /PATH_TO_SCRIPT/FILE_NAME.sh
        
    5. Clique em Salvar.

    6. Para testar o script, clique em Executar.

    7. Clique em Executar novamente.

    Um token do Google Cloud é retornado e exibido na parte inferior do painel da interface do usuário do SAP.

Windows

Usando a interface do usuário SAP, crie um comando de sistema operacional externo:

  1. Insira a transação SM69.
  2. Clique em Criar.
  3. Na seção Comando do painel Comando externo, insira o nome do comando, como ZGOOGLE_CDF_TOKEN.
  4. Na seção Definição:

    1. No campo Operating System Command, digite cmd /c.
    2. No campo Parâmetros do comando do sistema operacional, digite:

      gcloud auth print-access-token SERVICE_ACCOUNT_NAME
      
  5. Clique em Salvar.

  6. Para testar o script, clique em Executar.

  7. Clique em Executar novamente.

Um token do Google Cloud é retornado e exibido na parte inferior do painel de interface do usuário do SAP.

Requisitos de SLT

O conector do SLT precisa ter a seguinte configuração:

  • O conector é compatível com SAP ECC NW 7.02, DMIS 2011 SP17 e posterior.
  • Configurar uma conexão de RFC ou de banco de dados entre o SLT e o sistema do Cloud Storage.
  • Configure os certificados SSL:
    • Faça o download dos seguintes certificados de CA no repositório do Google Trust Services:
      • GTS Root R1
      • GTS CA 1C3
    • Na interface do usuário SAP, use a transação STRUST para importar os certificados raiz e subordinados para a pasta SSL Client (Standard) PSE.
  • O Internet Communication Manager (ICM) precisa ser configurado para HTTPS. Verifique se as portas HTTP e HTTPS são mantidas e ativadas no sistema SAP SLT. Isso pode ser verificado com o código da transação SMICM > Services.
  • Ative o acesso às APIs do Google Cloud na VM em que o sistema SAP SLT está hospedado. Isso permite a comunicação privada entre os serviços do Google Cloud sem roteamento pela Internet pública.
  • Verifique se a rede é compatível com o volume e a velocidade necessários da transferência de dados entre a infraestrutura do SAP e o Cloud Storage. Para uma instalação bem-sucedida, recomendamos o Cloud VPN e/ou o Cloud Interconnect. A capacidade da API de streaming depende das quotas de cliente que foram concedidas ao projeto do Cloud Storage.

Configurar o servidor de replicação do SLT

O usuário SAP executa as etapas a seguir.

Nas etapas a seguir, conecte o servidor do SLT ao sistema de origem e ao bucket no Cloud Storage, especificando o sistema de origem, as tabelas de dados a serem replicadas e o bucket de armazenamento de destino.

Configurar o SDK do Google ABAP

Se quiser configurar o SLT para replicação de dados (uma vez por instância do Cloud Data Fusion), siga estas etapas:

  1. Para configurar o conector do SLT, o SAP-User insere as seguintes informações na tela de configuração (Transação SAP /GOOG/CDF_SETTINGS) sobre a chave da conta de serviço do Google Cloud para transferir dados para o Cloud Storage. Configure as seguintes propriedades na tabela /GOOG/CDF_CLT_KY usando a Transação SE16 e anote esta chave:

    • NAME: o nome da chave da sua conta de serviço (por exemplo, CDFSLT).
    • NOME DA CONTA DE SERVIÇO: o nome da conta de serviço do IAM
    • SCOPE: o escopo da conta de serviço
    • ID do PROJETO: o ID do seu projeto do Google Cloud
    • Opcional: comando EXT OS: use esse campo somente se o SLT não estiver instalado no Google Cloud.
    • AUTH CLASS: se o comando do SO estiver configurado na tabela /GOOG/CDF_CLT_KY, use o valor fixo /GOOG/CDF_CL_GCP_AUTH.

    • TOKEN REFRESH SEC: duração da atualização do token de autorização

Insira detalhes sobre a chave da conta de serviço

Crie a configuração de replicação

Crie uma configuração de replicação no código da transação: LTRC.

  • Antes de prosseguir com a configuração do LTRC, verifique se a conexão RFC entre o SLT e o sistema SAP de origem foi estabelecida.
  • Para uma configuração de SLT, pode haver várias tabelas SAP atribuídas para replicação.
  1. Acesse o código da transação LTRC e clique em Nova configuração.

    Insira detalhes sobre a chave da conta de serviço

  2. Insira o Configuration Name e Description e clique em Next.

  3. Especifique a conexão RFC do sistema de origem SAP e clique em Next.

    Especificar detalhes da conexão RFC do sistema de origem

  4. Em "Target System Connection Details", selecione Other.

  5. Expanda o campo Scenario for RFC Communication, selecione SLT SDK e clique em Next.

  6. Acesse a janela Especificar configurações de transferência e insira o nome do aplicativo: ZGOOGLE_CDF.

    Especificar configurações de transferência

  7. Insira o Número de jobs de transferência de dados, o Número de jobs de carregamento inicial e o Número de jobs de cálculo. Para mais informações sobre desempenho, consulte o Guia de otimização de desempenho do SAP LT Replication Server.

  8. Clique em Tempo real > Próxima.

  9. Revise a configuração e clique em Salvar. Observe o ID de transferência de massa para as etapas a seguir.

    Salve a configuração e anote o ID da transferência em massa

  10. Para manter o ID da transferência de massa e os detalhes da tabela SAP, execute a transação SAP: /GOOG/CDF_SETTINGS.

  11. Clique em Executar ou pressione F8.

  12. Crie uma nova entrada clicando no ícone para anexar linha.

    1. Insira o ID de transferência de massa, a Chave de transferência em massa, o Nome da chave do GCP e o Bucket de GCS de destino. Marque a caixa de seleção Is Active e salve as alterações.

      Insira os detalhes da transferência em massa do transporte

  13. Selecione a configuração na coluna Configuration Name e clique em Data Provisioning.

    Selecionar o provisionamento de dados

  14. Opcional: personalize os nomes da tabela e dos campos.

    1. Clique em Nomes personalizados e salve.

    2. Clique em Tela.

    3. Crie uma nova entrada clicando nos botões Anexar linha ou Criar.

    4. Insira o nome da tabela do SAP e o da tabela externa a serem usados no BigQuery e salve as alterações.

    5. Clique no botão Visualizar na coluna Campos de exibição para manter o mapeamento dos campos da tabela.

    6. Uma página é aberta com sugestões de mapeamentos. Opcional: edite o Nome do campo temp e a Descrição do campo e salve os mapeamentos.

  15. Acesse a transação de LTRC.

  16. Selecione o valor na coluna Configuration Name e clique em Data Provisioning.

  17. Digite o nome da tabela no campo Nome da tabela no banco de dados e selecione o cenário de replicação.

    Selecione o cenário de replicação

  18. Clique em Executar. Isso aciona a implementação do SDK do SLT e começa a transferir os dados para o bucket de destino no Cloud Storage.

Instalar arquivos de transporte SAP

Para projetar e executar jobs de replicação no Cloud Data Fusion, os componentes do SAP são entregues como arquivos de transporte SAP arquivados em um arquivo ZIP. O download estará disponível quando você implantar o plug-in no Hub do Cloud Data Fusion.

Fazer o download do arquivo ZIP de transporte do SAP SLT

Os IDs de solicitação de transporte SAP e os arquivos associados são fornecidos na tabela a seguir:

ID do transporte Cofile Arquivo de dados Conteúdo
ED1K900520 K900520.ED1 R900520.ED1 Implementação do SAP BADI ES_IUUC_REPL_RUNTIME_OLO_EXIT
ED1K900337 K900337.ED1 R900337.ED1 Papel de autorização /GOOG/SLT_CDF_AUTH

Para instalar os transportes SAP, siga estas etapas:

Etapa 1: fazer upload dos arquivos de solicitação de transporte

  1. Log into the operating system of the SAP Instance.
  2. Use the SAP transaction code AL11 to get the path for the DIR_TRANS folder. Typically, the path is /usr/sap/trans/.
  3. Copy the cofiles to the DIR_TRANS/cofiles folder.
  4. Copy the data files to the DIR_TRANS/data folder.
  5. Set the User and Group of data and cofile to <sid>adm and sapsys.

Etapa 2: importar os arquivos de solicitação de transporte

O administrador do SAP pode importar os arquivos de solicitação de transporte usando o sistema de gerenciamento de transporte SAP ou o sistema operacional:

Sistema de gerenciamento de transporte SAP

  1. Faça login no sistema SAP como administrador da SAP.
  2. Digite o STMS da transação.
  3. Clique em Visão geral > Importações.
  4. Na coluna "Fila", clique duas vezes no SID atual.
  5. Clique em Extras > Outras solicitações > Adicionar.
  6. Selecione o ID da solicitação de transporte e clique em Continuar.
  7. Selecione a solicitação de transporte na fila de importação e clique em Solicitar > Importar.
  8. Digite o número do cliente.
  9. Na guia Opções, selecione Substituir originais e Ignorar a versão inválida do componente (se disponível).

    Opcional: para reimportar os transportes mais tarde, clique em Deixar solicitações de transporte na fila para importação posterior e em Importar solicitações de transporte novamente. Isso é útil para atualizações de sistema SAP e restaurações de backup.

  10. Clique em Continuar.

  11. Verifique se o módulo de função e os papéis de autorização foram importados com sucesso usando transações, como SE80 e PFCG.

Sistema operacional

  1. Faça login no sistema SAP como administrador da SAP.
  2. Adicione solicitações ao buffer de importação:

    tp addtobuffer TRANSPORT_REQUEST_ID SID
    

    Por exemplo: tp addtobuffer IB1K903958 DD1

  3. Importe as solicitações de transporte:

    tp import TRANSPORT_REQUEST_ID SID client=NNN U1238
    

    Substitua NNN pelo número do cliente. Por exemplo: tp import IB1K903958 DD1 client=800 U1238

  4. Verifique se o módulo da função e os papéis de autorização foram importados com êxito usando as transações apropriadas, como SE80 e PFCG.

Autorizações SAP necessárias

Para executar um pipeline de dados no Cloud Data Fusion, é preciso ter um usuário SAP. O usuário SAP precisa ser do tipo comunicações ou caixa de diálogo. Para evitar o uso de recursos de caixa de diálogo do SAP, o tipo Communications é recomendado. Os usuários podem ser criados pelo administrador da SAP usando o código de transação SAP SU01.

As autorizações SAP são necessárias para manter e configurar o conector para SAP, uma combinação de objetos de autorização do novo conector e padrão do SAP. Você mantém objetos de autorização com base nas políticas de segurança da sua organização. A lista a seguir descreve algumas autorizações importantes necessárias para o conector:

  • Objeto de autorização: o objeto de autorização ZGOOGCDFMT é enviado como parte do papel de solicitação de transporte.

  • Criação de papel: crie um papel usando o código de transação PFCG.

    Criar um papel usando um código de transação SAP

  • Para objetos de autorização SAP padrão, a organização gerencia permissões com o próprio mecanismo de segurança.

  • Para objetos de autorização personalizados, forneça valores nos campos de autorização para objetos de autorização ZGOOGCDFMT.

  • Para um controle de acesso refinado, ZGOOGCDFMT fornece autorização baseada em grupo de autorização. Os usuários com acesso completo, parcial ou nenhum acesso a grupos de autorização recebem acesso com base no grupo de autorização atribuído à função deles.

  • /GOOG/SLT_CDF_AUTH: papel com acesso a todos os grupos de autorização. Para restringir o acesso específico a um determinado grupo de autorização, mantenha o FICDF do grupo de autorização na configuração.

Criar um destino RFC para a origem

Antes de começar a configuração, verifique se a conexão RFC está estabelecida entre a origem e o destino.

  1. Acesse o código da transação SM59.

  2. Clique em Criar > Tipo de conexão 3 (Conexão ABAP).

    Criar código da transação

  3. Na janela Technical Settings, insira os detalhes sobre o destino RFC.

  4. Clique na guia Logon and Security para manter as credenciais RFC (usuário e senha RFC).

  5. Clique em Salvar.

  6. Clique em Teste de conexão. Após um teste bem-sucedido, você pode continuar.

  7. Verifique se o teste de autorização RFC foi bem-sucedido.

  8. Clique em Utilitários > Teste > Teste de autorização.

Configurar o plug-in

Para configurar o plug-in, implante-o no Hub, crie um job de replicação e configure a origem e o destino com as etapas abaixo.

Implantar o plug-in no Cloud Data Fusion

O usuário do Cloud Data Fusion executa as etapas a seguir.

Antes de executar o job de replicação do Cloud Data Fusion, implante o plug-in SAP SLT Replication:

  1. Acesse sua instância:

    1. No console do Google Cloud, acesse a página Instâncias do Cloud Data Fusion.

      Acesse "Instâncias"

    2. Ative a replicação em uma instância nova ou atual:

      • Para uma nova instância, clique em Criar instância, insira um nome para ela, clique em Adicionar aceleradores, marque a caixa de seleção Replicação e clique em Salvar.
      • Para uma instância atual, consulte Ativar replicação em uma instância atual.
    3. Clique em Visualizar instância para abrir a instância na interface da Web do Cloud Data Fusion.

  2. Clique em Hub.

  3. Acesse a guia SAP, clique em SAP SLT e em Plug-in de replicação do SAP SLT ou Plug-in de replicação SAP SLT No RFC de replicação.

  4. Selecione Implantar.

Criar um job de replicação

O plug-in SAP SLT Replication lê o conteúdo das tabelas do SAP usando um bucket de preparo da API Cloud Storage.

Para criar um job de replicação para sua transferência de dados, siga estas etapas:

  1. Na instância aberta do Cloud Data Fusion, clique em Início > Replicação > Criar um job de replicação. Se não houver a opção Replicação, ative a replicação para a instância.

  2. Insira um Nome e uma Descrição exclusivos para o job de replicação.

  3. Clique em Próxima.

Configurar a origem

  1. Configure a origem inserindo valores nos seguintes campos:

    • ID do projeto: o ID do projeto do Google Cloud (campo é preenchido previamente)
    • Caminho do GCS de replicação de dados: o caminho do Cloud Storage que contém os dados para replicação. Ele precisa ser o mesmo caminho configurado nos jobs do SAP SLT. Internamente, o caminho fornecido é concatenado com Mass Transfer ID e Source Table Name:

      Formato: gs://<base-path>/<mass-transfer-id>/<source-table-name>

      Exemplo: gs://slt_bucket/012/MARA

    • GUID: o GUID do SLT, um identificador exclusivo atribuído ao ID de transferência de massa do SAP SLT.

    • ID de transferência de massa: o ID da transferência de massa do SLT é um identificador exclusivo atribuído à configuração no SAP SLT.

    • Caminho do GCS da biblioteca JCo do SAP: o caminho de armazenamento que contém os arquivos de biblioteca do SAP JCo enviados pelo usuário. É possível fazer o download das bibliotecas SAP JCo no SAP Support Portal. (Removido na versão do plug-in 0.10.0.)

    • SLT Server Host: nome do host ou endereço IP do servidor SLT. (Removido na versão 0.10.0 do plug-in).

    • Número do sistema SAP: o número do sistema de instalação fornecido pelo administrador do sistema (por exemplo, 00). (removido na versão 0.10.0 do plug-in).

    • Cliente SAP: o cliente SAP a ser usado (por exemplo, 100). (removido na versão 0.10.0 do plug-in).

    • Idioma SAP: idioma de login do SAP (por exemplo, EN). (removido na versão 0.10.0 do plug-in).

    • Nome de usuário de logon do SAP: nome de usuário SAP. (Removido na versão do plug-in 0.10.0.)

      • Recomendado: se o nome de usuário de logon do SAP for alterado periodicamente, use uma macro.
    • Senha de logon SAP (M): senha de usuário SAP para autenticação de usuário.

      • Recomendado: use macros seguras para valores sensíveis, como senhas. (Removido na versão do plug-in 0.10.0.)
    • Suspender a replicação SLT quando o job de CDF for interrompido: tenta interromper o job de replicação do SLT (para as tabelas envolvidas) quando o job de replicação do Cloud Data Fusion for interrompido. Poderá falhar se o job no Cloud Data Fusion for interrompido inesperadamente.

    • Replicar dados atuais: indica se os dados das tabelas de origem precisam ser replicados. Por padrão, os jobs replicam os dados das tabelas de origem. Se definido como false, todos os dados atuais nas tabelas de origem serão ignorados e apenas as alterações ocorridas após o início do job serão replicadas.

    • Chave da conta de serviço: a chave a ser usada ao interagir com o Cloud Storage. A conta de serviço precisa ter permissão para gravar no Cloud Storage. Ao executar em uma VM do Google Cloud, ele pode ser definido como auto-detect para usar a chave da conta de serviço na VM.

  2. Clique em Próxima.

Configurar o destino

Para gravar dados no BigQuery, o plug-in requer acesso de gravação ao BigQuery e a um bucket de preparo. Os eventos de alteração são gravados primeiro em lotes do SLT para o Cloud Storage. Em seguida, eles são carregados em tabelas de preparo no BigQuery. As alterações da tabela de preparo são mescladas na tabela de destino final usando uma consulta de mesclagem do BigQuery.

A tabela de destino final inclui todas as colunas originais da tabela de origem e mais uma coluna _sequence_num. O número de sequência garante que os dados não sejam duplicados ou perdidos em cenários de falha do replicador.

  1. Configure a origem inserindo valores nos seguintes campos:

    • ID do projeto: projeto do conjunto de dados do BigQuery. Ao executar em um cluster do Dataproc, este campo pode ser deixado em branco, o que usará o projeto do cluster.
    • Credenciais: consulte Credenciais.
    • Chave da conta de serviço: o conteúdo da chave da conta de serviço a ser usada ao interagir com o Cloud Storage e o BigQuery. Ao executar em um cluster do Dataproc, esse campo pode ser deixado em branco, o que usa a conta de serviço do cluster.
    • Nome do conjunto de dados: nome do conjunto de dados a ser criado no BigQuery. Ele é opcional e, por padrão, o nome do conjunto de dados é igual ao nome do banco de dados de origem. Um nome válido precisa conter apenas letras, números e sublinhados, e o comprimento máximo pode ser de 1.024 caracteres. Todos os caracteres inválidos são substituídos por um sublinhado no nome do conjunto de dados final, e todos os caracteres que excedem o limite de comprimento são truncados.
    • Nome da chave de criptografia: a chave de criptografia gerenciada pelo cliente (CMEK) usada para proteger os recursos criados por esse destino. O nome da chave de criptografia precisa estar no formato projects/<project-id>/locations/<key-location>/keyRings/<key-ring-name>/cryptoKeys/<key-name>.
    • Local: o local onde o conjunto de dados do BigQuery e o bucket de preparo do Cloud Storage são criados. Por exemplo, us-east1 para buckets regionais, us para buckets multirregionais (consulte Locais). Esse valor será ignorado se um bucket atual for especificado, já que o bucket de preparo e o conjunto de dados do BigQuery são criados no mesmo local.
    • Bucket de preparo: o bucket em que os eventos de alteração são gravados antes de serem carregados nas tabelas de preparo. As alterações são gravadas em um diretório que contém o nome do replicador e o namespace. É seguro usar o mesmo bucket em vários replicadores na mesma instância. Se ele for compartilhado por replicadores em várias instâncias, verifique se o namespace e o nome são exclusivos. Caso contrário, o comportamento será indefinido. O bucket precisa estar no mesmo local que o conjunto de dados do BigQuery. Se não for fornecido, um novo bucket será criado para cada job nomeado como df-rbq-<namespace-name>-<job-name>-<deployment-timestamp>.

    • Intervalo de carregamento (segundos): número de segundos para aguardar antes de carregar um lote de dados no BigQuery.

    • Prefixo da tabela de preparo: as alterações são primeiro gravadas em uma tabela de preparo antes de serem mescladas na tabela final. Os nomes das tabelas de preparo são gerados adicionando esse prefixo ao nome da tabela de destino.

    • Exigir intervenção manual de descarte: determina se é necessário realizar uma ação administrativa manual para eliminar tabelas e conjuntos de dados quando um evento de tabela ou exclusão de banco de dados for encontrado. Quando definido como verdadeiro, o replicador não exclui uma tabela ou conjunto de dados. Em vez disso, ele falha e tenta novamente até que a tabela ou o conjunto de dados não exista. Se o conjunto de dados ou a tabela não existir, não será necessária nenhuma intervenção manual. O evento é ignorado normalmente.

    • Ativar exclusões reversíveis: se definido como verdadeiro, quando um evento de exclusão for recebido pelo destino, a coluna _is_deleted do registro será definida como true. Caso contrário, o registro será excluído da tabela do BigQuery. Essa configuração é independente para uma origem que gera eventos fora de ordem, e os registros são sempre excluídos de maneira reversível da tabela do BigQuery.

  2. Clique em Próxima.

Credenciais

Se o plug-in for executado em um cluster do Dataproc, a chave da conta de serviço pode ser configurada para detecção automática. As credenciais são lidas automaticamente no ambiente do cluster.

Se o plug-in não for executado em um cluster do Dataproc, será necessário fornecer o caminho para uma chave de conta de serviço. A chave da conta de serviço pode ser encontrada na página do IAM no console do Google Cloud. Verifique se a chave da conta tem permissão para acessar o BigQuery. O arquivo de chave da conta de serviço precisa estar disponível em todos os nós do cluster e ser legível para todos os usuários que executam o job.

Limitações

  • As tabelas precisam ter uma chave primária para serem replicadas.
  • As operações de renomeação de tabelas não são compatíveis.
  • As alterações de tabela são parcialmente compatíveis.
    • Uma coluna não anulável existente pode ser alterada para uma coluna anulável.
    • É possível adicionar novas colunas anuláveis a uma tabela existente.
    • Qualquer outro tipo de alteração no esquema da tabela falhará.
    • As alterações na chave primária não falham, mas os dados atuais não são reescritos para obedecer à exclusividade na nova chave primária.

Selecionar tabelas e transformações

Na etapa Selecionar tabelas e transformações, é exibida uma lista de tabelas selecionadas para replicação no sistema de SLT.

  1. Selecione as tabelas a serem replicadas.
  2. Opcional: selecione outras operações de esquema, como Inserções, Atualizações ou Exclusões.
  3. Para visualizar o esquema, clique em Colunas a serem replicadas em uma tabela.
  4. Opcional: para renomear colunas no esquema, siga estas etapas:

    1. Ao visualizar o esquema, clique em Transformar > Renomear.
    2. No campo Renomear, digite um novo nome e clique em Aplicar.
    3. Para salvar o novo nome, clique em Atualizar e Salvar.
  5. Clique em Próxima.

Opcional: configurar propriedades avançadas

Se você souber a quantidade de dados que está replicando em uma hora, poderá selecionar a opção apropriada.

Revisar avaliação

A etapa Revisar avaliação verifica se há problemas de esquema, recursos ausentes ou problemas de conectividade que ocorrem durante a replicação.

  1. Na página Review Assessment, clique em View mappings.

    Se ocorrer algum problema, ele precisará ser resolvido antes que você possa continuar.

  2. Opcional: se você renomeou as colunas ao selecionar as tabelas e transformações, verifique se os novos nomes estão corretos nesta etapa.

  3. Clique em Próxima.

Confira o resumo e implante o job de replicação

Na página Revisar os detalhes do job de replicação, revise as configurações e clique em Implantar job de replicação.

Selecione um perfil do Compute Engine

  1. Depois de implantar o job de replicação, clique em Configurar em qualquer página da interface da Web do Cloud Data Fusion.

  2. Selecione o perfil do Compute Engine que você quer usar para executar esse job de replicação.

  3. Clique em Salvar.

    Selecione um perfil do Compute na interface da Web do Cloud Data Fusion.

Iniciar o job de replicação

  • Para executar o job de replicação, clique em Iniciar.

Iniciar o job de replicação na interface da Web do Cloud Data Fusion

Opcional: otimizar a performance

Por padrão, o plug-in é configurado para ter o desempenho ideal. Para mais otimizações, consulte Argumentos de ambiente de execução.

O desempenho da comunicação do SLT e do Cloud Data Fusion depende destes fatores:

  • SLT no sistema de origem em comparação com um sistema SLT central dedicado (opção preferencial)
  • Processamento de jobs em segundo plano no sistema SLT
  • Processos de trabalho de caixas de diálogo no sistema SAP de origem
  • O número de processos de jobs em segundo plano alocados para cada ID de transferência em massa na guia Administração do LTRC
  • Configurações de LTRS
  • Hardware (CPU e memória) do sistema SLT
  • O banco de dados usado (por exemplo: HANA, Sybase ou DB2)
  • a largura de banda da Internet (conectividade entre o sistema SAP e o Google Cloud pela Internet);
  • Uso pré-existente (carga) no sistema
  • Número de colunas da tabela. Com mais colunas, a replicação se torna lenta e a latência pode aumentar.

Os seguintes tipos de leitura nas configurações de LTRS são recomendados para carregamentos iniciais:

sistema SLT Sistema de origem Tipo de tabela Tipo de leitura recomendado
[carregamento inicial]
SLT 3.0 autônomo
[DMIS 2018_1_752 SP 2]
S/4 HANA 1909 Transparente (pequeno/médio)
Transparente (grande)
Tabela de clusters
1 cálculo de intervalo
1 cálculo de intervalo
4 fila de remetentes
SLT incorporado
[S4CORE 104 HANA 1909]
N/A Transparente (pequeno/médio)
Transparente (grande)
Tabela de clusters
1 cálculo de intervalo
1 cálculo de intervalo
4 fila de remetentes
SLT 2.0 autônomo
[DMIS 2011_1_731 SP 17]
ECC NW 7.02 Transparente (pequeno/médio)
Transparente (grande)
Tabela de clusters
5 fila de remetentes
5 fila de remetentes
4 fila de remetentes
SLT incorporado
[DMIS 2011_1_700 SP 17]
N/A Transparente (pequeno/médio)
Transparente (grande)
Tabela de clusters
5 fila de remetentes
5 fila de remetentes
4 fila de remetentes
  • Para replicação, use "No Range" para melhorar o desempenho:
    • Os intervalos precisam ser usados somente quando os backlogs forem gerados em uma tabela de geração de registros com alta latência.
    • Usando um cálculo de intervalo: o tipo de leitura para carregamento inicial não é recomendado no caso de sistemas SLT 2.0 e não HANA.
    • Usando um cálculo de intervalo: o tipo de leitura para carga inicial pode resultar em registros duplicados no BigQuery.
  • O desempenho é sempre melhor quando um sistema SLT independente é usado.
  • Um sistema SLT autônomo sempre é recomendado se a utilização de recursos do sistema de origem já for alta.

Argumentos de ambiente de execução

  • snapshot.thread.count: transmite o número de linhas de execução para começar a executar o carregamento de dados SNAPSHOT/INITIAL em paralelo. Por padrão, ele usa o número de vCPUs disponíveis no cluster do Dataproc em que o job de replicação é executado.

    Recomendado: defina esse parâmetro apenas nos casos em que for necessário ter um controle preciso sobre o número de linhas de execução paralelas (por exemplo, para diminuir o uso no cluster).

  • poll.file.count: transmite o número de arquivos a serem pesquisados no caminho do Cloud Storage fornecido no campo Caminho do GCS de replicação de dados na interface da Web. Por padrão, o valor é 500 por enquete. No entanto, com base na configuração do cluster, ele pode ser aumentado ou reduzido.

    Recomendado: defina esse parâmetro somente se você tiver requisitos rigorosos para o atraso de replicação. Valores mais baixos podem reduzir o atraso. É possível usá-lo para melhorar a capacidade. Se não houver resposta, use valores maiores que o padrão.

  • bad.files.base.path: transmite o caminho base do Cloud Storage em que todos os arquivos de dados com erro ou com defeito são copiados e encontrados durante a replicação. Isso é útil quando há requisitos rigorosos para auditoria de dados e um local específico precisa ser usado para registrar transferências com falha.

    Por padrão, todos os arquivos com defeito são copiados do caminho do Cloud Storage fornecido no campo Caminho do Cloud Storage de replicação de dados na interface da Web.

    • Padrão de caminho final dos arquivos de dados com falha:

      gs://BASE_FILE_PATH/MASS_TRANSFER_ID/SOURCE_TABLE_NAME/bad_files/REPLICATION_JOB_NAME/REPLICATION_JOB_ID/BAD_FILE_NAME
      

    • Exemplo:

      gs://slt_to_cdf_bucket/001/MARA/bad_files/MaraRepl/05f97349-7398-11ec-9443-8
      ac0640fc83c/20220205_1901205168830_DATA_INIT.xml
      

    Os critérios de um arquivo inválido são um arquivo XML corrompido ou inválido, valores de PK ausentes ou um problema de incompatibilidade no tipo de dados de campo.

Detalhes do suporte

Produtos e versões SAP compatíveis

  • SAP_BASIS 702 versão, nível SP 0016 e posteriores.
  • SAP_ABA 702 versão, nível SP 0016 e posteriores.
  • versão DMIS 2011_1_700, nível SP 0017 e mais recentes.

Versões de SLT compatíveis

As versões 2 e 3 do SLT são compatíveis.

Modelos de implantação SAP com suporte

O SLT funciona como um sistema independente ou incorporado ao sistema de origem.

Notas SAP que precisam ser implementadas antes de você começar a usar o SLT.

Se o pacote de suporte não incluir correções de classe /UI2/CL_JSON para PL 12 ou mais recente, implemente a nota SAP mais recente para correções de classe /UI2/CL_JSON, por exemplo, a Nota SAP 2798102 para PL12.

Recomendado: implemente as notas SAP recomendadas pelo relatório CNV_NOTE_ANALYZER_SLT com base na condição do sistema Central ou de origem. Para mais informações, consulte a Nota SAP 3016862 (login SAP necessário).

Se a SAP já estiver configurada, nenhuma outra observação precisará ser implementada. Para quaisquer erros ou problemas específicos, consulte a nota central do SAP referente à sua versão do SLT.

Limites para o volume de dados ou largura de registro

Não há limite definido para o volume de dados extraídos e a largura do registro.

Capacidade esperada para o plug-in do SAP SLT Replication

Para um ambiente configurado de acordo com as diretrizes em Otimizar desempenho, o plug-in pode extrair cerca de 13 GB por hora para o carregamento inicial e 3 GB por hora para replicação (CDC). O desempenho real pode variar de acordo com a carga do sistema ou o tráfego de rede do Cloud Data Fusion e SAP.

Suporte para extração delta do SAP (dados alterados)

A extração delta do SAP é aceita.

Obrigatório: peering de locatário para instâncias do Cloud Data Fusion

O peering de locatário é necessário quando a instância do Cloud Data Fusion é criada com um endereço IP interno. Para mais informações sobre peering de locatário, consulte Como criar uma instância particular.

Resolver problemas

O job de replicação continua reiniciando

Se o job de replicação continuar sendo reiniciado automaticamente, aumente a memória do cluster do job de replicação e execute-o novamente.

Cópias no coletor do BigQuery

Se você definir o número de jobs paralelos nas configurações avançadas do plug-in de replicação do SAP SLT, quando as tabelas forem grandes, ocorrerá um erro, causando colunas duplicadas no coletor do BigQuery.

Para evitar esse problema, remova os jobs paralelos.

Cenários de erro

A tabela a seguir lista algumas mensagens de erro comuns (o texto entre aspas será substituído por valores reais no ambiente de execução):

ID da mensagem Mensagem Ação recomendada
CDF_SAP_SLT_01402 Service account type is not defined for SERVICE_ACCT_NAME_FROM_UI. Verifique se o caminho do Cloud Storage fornecido está correto.
CDF_SAP_SLT_01403 Service account key provided is not valid due to error: ROOT_CAUSE. Please provide a valid service account key for service account type : SERVICE_ACCT_NAME_FROM_UI. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_01404 Mass Transfer ID could not be found. Please ensure that it exists in given GCS Bucket. Verifique se o ID de transferência em massa fornecido está no formato correto.
CDF_SAP_SLT_01502 The specified data replication GCS path 'slt_to_cdf_bucket_1' or Mass Transfer ID '05C' could not be found. Please ensure that it exists in GCS. Verifique se o caminho do Cloud Storage fornecido está correto.
CDF_SAP_SLT_01400 Metadata file not found. The META_INIT.json file is not present or file is present with invalid format. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_03408 Failed to start the event reader. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_03409 Error while processing TABLE_NAME file for source table gs://CLOUD_STORAGE_BUCKET_NAME/MT_ID/TABLE_NAME /FILE_NAME. Root cause: ROOT_CAUSE. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_03410 Failed to replicate data for source table TABLE_NAME from file: gs://CLOUD_STORAGE_BUCKET_NAME/MT_ID/ TABLE_NAME/FILE_NAME. Root cause: ROOT_CAUSE. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_03411 Failed data replication for source table TABLE_NAME. Root cause: ROOT_CAUSE. Verifique a causa raiz exibida na mensagem e tome as medidas adequadas.
CDF_SAP_SLT_03412 Failed to create target table for source table TABLE_NAME. Root cause: ROOT_CAUSE. Verifique a causa raiz exibida na mensagem e tome a medida apropriada.

Mapeamento de tipo de dados

A tabela a seguir mostra o mapeamento entre os tipos de dados usados nos aplicativos SAP e no Cloud Data Fusion.

Tipo de dados do SAP Tipo ABAP Descrição (SAP) Tipo de dados do Cloud Data Fusion
Numérico
INT1 b Inteiro de 1 byte int
INT2 s Inteiro de 2 bytes int
INT4 i Inteiro de 4 bytes int
INT8 8 Inteiro de 8 bytes long
DEZ p Número no pacote no formato BCD (DEC) decimal
DF16_DEC
DF16_RAW
a Ponto flutuante decimal de 8 bytes IEEE 754r decimal
DF34_DEC
DF34_RAW
e Ponto flutuante decimal de 16 bytes IEEE 754r decimal
FLTP f Número de ponto flutuante binário double
Caractere
CARACTER
LCHR
c String de caracteres string
SSTRING
GEOM_EWKB
string String de caracteres string
STRING
GEOM_EWKB
string CLOB de string de caracteres bytes
NUMC
ACCP
n Texto numérico string
Byte
RAW
LRAW
x Dados binários bytes
RAWSTRING xstring String de bytes BLOB bytes
Data/hora
DATS d Data date
Tims t Tempo time
TIMESTAMP utcl ( Utclong)
Indicação de data e hora
timestamp

A seguir