O plug-in SAP ODP permite a integração de dados em massa de aplicações SAP com o BigQuery ou outros sistemas de destino suportados através do Cloud Data Fusion. O plug-in tem as seguintes funcionalidades principais:
- Usa o SAP ECC, o SAP S4/HANA ou o SAP BW como sistema de origem
- Usa o SAP CDC (Change Data Capture) para monitorizar e extrair dados novos e delta nas origens de dados
- Usa o modo de extração em lote
- Suporta SAP DataSources e visualizações de propriedade do ABAP CDS como origens de dados
Versões de software compatíveis
Software | Versões |
---|---|
SAP S4/HANA | SAP S4/HANA 1909 e posterior |
SAP ECC | SAP ERP6 NW 7.31 SP16 e posteriores |
SAP JCo | Versão 3.0.20 e posterior do SAP JCo |
Cloud Data Fusion | 6.3 e posteriores |
Para mais informações sobre o SAP no Google Cloud, consulte a vista geral do SAP no Google Cloud.
Antes de começar
Configure os seguintes sistemas e serviços usados pelo plug-in SAP ODP:
- Configure o sistema SAP ERP.
Este processo inclui os seguintes passos:
- Instale os ficheiros de transporte do SAP.
- Configure as autorizações e as funções SAP necessárias.
- Configure o SAP Java Connector.
Implemente o plug-in do ODP no Cloud Data Fusion.
- Importante: escolha uma versão do plug-in compatível com a versão do Cloud Data Fusion.
- Se atualizar a versão da instância ou do plug-in do Cloud Data Fusion, avalie o impacto das alterações no âmbito funcional e no desempenho do pipeline.
Estabeleça a conetividade RFC entre o Cloud Data Fusion e o SAP.
- Certifique-se de que a comunicação está ativada entre a instância do Cloud Data Fusion e o servidor SAP.
- Para instâncias privadas, configure o intercâmbio da rede da VPC.
- Tanto o sistema SAP como a instância do Cloud Data Fusion têm de estar no mesmo projeto.
Configure o plug-in
- Aceda à interface Web do Cloud Data Fusion e clique em Studio.
- Verifique se a opção Data Pipeline - Batch está selecionada (e não Tempo Real).
- No menu Origem, clique em SapODP. O nó SAP ODP é apresentado no pipeline.
- Para configurar a origem, aceda ao nó SAP ODP e clique em Propriedades.
Introduza as seguintes propriedades. Para ver uma lista completa, consulte as Propriedades.
- Introduza uma etiqueta para o nó ODP do SAP, por exemplo,
SAP ODP tables
. Introduza os detalhes da associação. Pode configurar uma nova associação única ou uma associação existente reutilizável.
Nova associação
Para adicionar uma associação única ao SAP, siga estes passos:
- Mantenha a opção Usar ligação desativada.
Na secção Ligação, introduza as seguintes informações da conta SAP nestes campos:
- No campo Nome de referência, introduza um nome para a ligação que identifica esta origem para a linhagem.
- No campo Cliente SAP, introduza o nome do cliente de uma instância ou um ambiente específico no SAP. Um administrador do SAP pode indicar o nome do cliente.
- No campo Idioma do SAP, introduza um idioma de início de sessão do SAP. A predefinição é EN (inglês).
Selecione um dos seguintes Tipos de associação.
- Direta (através do servidor de aplicações SAP). Se escolher este tipo predefinido, introduza informações nos seguintes campos: Anfitrião do servidor de aplicações SAP, Número do sistema SAP e Router SAP.
- Equilibrado de carga (através do servidor de mensagens SAP). Se escolher este tipo, introduza informações nos seguintes campos: Anfitrião do servidor de mensagens SAP, Serviço do servidor de mensagens SAP ou número da porta, ID do sistema SAP (SID) e Nome do grupo de início de sessão SAP.
No campo Contexto, selecione o tipo de origem de dados que está a usar.
No campo Nome da origem do SAP ODP, introduza o nome da origem de dados que está a usar.
No campo Tipo de extração, selecione o tipo de extração de dados. A predefinição é Completo (todos os dados).
Faculte as credenciais da SAP: peça ao administrador da SAP o nome de utilizador de início de sessão da SAP e a palavra-passe.
No campo Caminho do Cloud Storage da biblioteca JCo, introduza o caminho do SAP Java Connector (SAP JCo) no Cloud Storage que contém os ficheiros da biblioteca SAP JCo que carregou.
Para gerar um esquema com base nos metadados do SAP que mapeiam os tipos de dados do SAP para os tipos de dados do Cloud Data Fusion correspondentes, clique em Obter esquema. Para mais informações, consulte o artigo Mapeamentos de tipos de dados.
Opcional: para otimizar a carga de ingestão do SAP, introduza informações nos seguintes campos:
- No campo Nome do subscritor do SAP ODP, identifique o subscritor para a extração de dados de uma origem de dados válida.
- As Opções de filtro permitem-lhe extrair registos com base em condições de seleção.
- No campo Número de divisões, pode criar partições para extrair registos de dados em paralelo, o que melhora o desempenho. O número de divisões pode afetar os processos de trabalho do SAP e tem de ser selecionado cuidadosamente.
- No campo Tamanho do pacote, especifique o número de registos a extrair numa única chamada de rede SAP. O tamanho do pacote afeta o desempenho e os recursos disponíveis e tem de ser selecionado cuidadosamente.
Ligação reutilizável
Para reutilizar uma associação existente, siga estes passos:
- Ative a opção Usar ligação.
- Clique em Procurar associações.
Clique no nome da associação.
Se não existir uma associação, para criar uma associação reutilizável, siga estes passos:
- Clique em Adicionar associação > SapOdp.
- Na página Crie uma associação SapOdp que é aberta, introduza um nome e uma descrição da associação.
- No campo Cliente SAP, introduza o nome do cliente de uma instância ou um ambiente específico no SAP. Um administrador do SAP pode indicar o nome do cliente.
- No campo Idioma do SAP, introduza um idioma de início de sessão do SAP. A predefinição é EN (inglês).
Selecione um dos seguintes Tipos de associação.
- Direta (através do servidor de aplicações SAP). Se escolher este tipo predefinido, introduza informações nos seguintes campos: Anfitrião do servidor de aplicações SAP, Número do sistema SAP e Router SAP.
- Equilibrado de carga (através do servidor de mensagens SAP). Se escolher este tipo, introduza informações nos seguintes campos: Anfitrião do servidor de mensagens SAP, Serviço do servidor de mensagens SAP ou número da porta, ID do sistema SAP (SID) e Nome do grupo de início de sessão SAP.
No nome da origem do SAP ODP, introduza o nome do ODP DataSource do SAP.
Faculte as credenciais da SAP: peça ao administrador da SAP os valores do nome de utilizador de início de sessão da SAP e da palavra-passe.
No campo Caminho do Cloud Storage da biblioteca JCo, introduza o caminho do conetor Java (SAP JCo) do SAP no Cloud Storage que contém os ficheiros da biblioteca SAP JCo que carregou.
No campo Tempo de espera, introduza um tempo de espera (em segundos) antes da próxima nova tentativa, por exemplo,
60
.No campo Contagem de novas tentativas, introduza o número máximo de tentativas. Por exemplo,
3
.Opcional: no campo Propriedades de ligação SAP adicionais, introduza pares de chave-valor que têm de substituir as predefinições do SAP JCo.
Clique em Criar.
- Introduza uma etiqueta para o nó ODP do SAP, por exemplo,
Propriedades
Propriedade | O modo macro está ativado | Propriedade obrigatória | Descrição |
---|---|---|---|
Etiqueta | Não | Sim | O nome do nó no pipeline de dados. |
Usar ligação | Não | Não | Use uma ligação reutilizável. Se for usada uma associação, não tem de fornecer as credenciais. Para mais informações, consulte o artigo Faça a gestão das associações. |
Nome | Não | Sim | O nome da associação reutilizável. |
Cliente SAP | Sim | Sim | A instância ou o ambiente específico num sistema SAP. |
Idioma do SAP | Sim | Sim | O idioma em que a interface do utilizador e os dados do SAP são apresentados e processados. |
Tipo de ligação | Não | Sim | O tipo de ligação SAP: direta ou com equilíbrio de carga. |
Anfitrião do servidor de aplicações SAP | Sim | Não | Apenas para o tipo de ligação Direta, este nome do anfitrião é do servidor de aplicações SAP, que funciona como uma camada de software intermédio entre clientes SAP (como a interface Web SAP, navegadores de Internet ou apps para dispositivos móveis) e a base de dados subjacente. |
Número do sistema SAP | Sim | Não | Apenas para o tipo de ligação Direta, este número é o identificador exclusivo atribuído a cada sistema SAP. Por exemplo,
00 . |
Router SAP | Sim | Não | Apenas para o tipo de ligação Direta, esta é a string do router para o servidor proxy, que fornece um canal seguro para a comunicação entre os sistemas SAP e os clientes ou os parceiros externos. |
Anfitrião do servidor de mensagens SAP | Sim | Não | Apenas para o tipo de ligação Equilibrado por carga, este é o nome do anfitrião, que facilita o equilíbrio de carga em vários servidores de aplicações no SAP. |
Serviço ou número da porta do servidor de mensagens SAP | Sim | Não | Apenas para o tipo de ligação Equilibrado por carga, esta é a porta de rede onde o servidor de mensagens SAP escuta as ligações recebidas de clientes SAP e servidores de aplicações no SAP. |
ID do sistema SAP (SID) | Sim | Não | Apenas para o tipo de ligação Equilibrado por carga, este ID é atribuído a cada sistema SAP. |
Nome do grupo de início de sessão da SAP | Sim | Não | O nome do agrupamento lógico ou da configuração de vários servidores de aplicações SAP. A predefinição é PUBLIC . |
Tipo de objeto | N/A | N/A | Os tipos de objetos suportados: DataSources/Extractors ou ABAP Core Data Services. |
Nome da origem do ODP da SAP | Sim | Sim | O nome das origens de dados SAP ou da vista CDS (por exemplo,
2LIS_02_ITM ). |
Tipo de extrato | Sim | Sim | O plug-in suporta os dois seguintes tipos de extração de dados:
|
Nome de utilizador de início de sessão da SAP | Sim | Sim | Nome de utilizador para o SAP Recomendado: se o nome de utilizador mudar periodicamente, use uma macro. |
Palavra-passe de início de sessão da SAP | Sim | Sim | Palavra-passe da SAP. Recomendado: use macros seguras. |
ID do projeto da GCP | Sim | Sim | Google Cloud ID do projeto. |
Caminho do GCS da biblioteca SAP JCo | Sim | Sim | O caminho para o Cloud Storage onde carregou os ficheiros da biblioteca SAP JCo. |
Obter esquema | N/A | N/A | O plug-in gera um esquema com base nos metadados do SAP, que mapeia os tipos de dados do SAP para os tipos de dados do Cloud Data Fusion correspondentes. Consulte o artigo Mapeamento de tipos de dados. |
Nome do subscritor do SAP ODP | Sim | Sim | O subscritor do ODP para a extração de dados de uma origem de dados SAP válida
ou uma vista CDS. Tem de ter o seguinte:
|
Tempo de espera | Sim | Não | Esta propriedade permite que os engenheiros de dados selecionem um tempo de espera adequado após cada chamada de rede do Cloud Data Fusion para o SAP. |
Número de novas tentativas | Sim | Não | O número de tentativas de repetição enquanto aguarda a conclusão da chamada de rede. |
Opções de filtro (igual) | Sim | Não | O valor que um campo tem de ter para ser lido. As opções de filtro são listas de nomes de campos de metadados e os respetivos pares de valores. Definem a condição de filtro a aplicar quando lêem dados de uma SAP DataSource. Apenas são extraídos os registos que satisfazem as condições. A chave do filtro corresponde a um campo no esquema. Tem de ser de um tipo simples (não ARRAY , RECORD nem UNION ). Exemplo de utilização:Nome do campo: MTART Valor: FERT |
Opções de filtro (intervalo) | Sim | Não | Os limites inferior e superior do valor que um campo tem de ter para ser lido. As opções de filtro são listas de nomes de campos de metadados e os respetivos pares de valores. Definem a condição de filtro a aplicar quando lêem dados de uma SAP DataSource. Apenas são extraídos os registos que satisfazem as condições. A chave do filtro corresponde a um campo no esquema. Tem o formato baixo E alto. Exemplo de utilização: Nome do campo: ERDAT Valor baixo: 2023-11-01 Valor elevado: 2023-11-30 |
Opções de filtro (menor ou igual) | Sim | Não | O valor que um campo tem de ser inferior ou igual a. As opções de filtro são listas de nomes de campos de metadados e os respetivos pares de valores. Definem a condição de filtro a aplicar quando lêem dados de uma SAP DataSource. Apenas são extraídos os registos que satisfazem as condições. A chave do filtro corresponde a um campo no esquema. Tem de ser de um tipo simples (não ARRAY , RECORD nem UNION ). Exemplo de utilização:Nome do campo: MATNR Valor: 10008 |
Opções de filtro (maior ou igual) | Sim | Não | O valor que um campo tem de ser superior para ser lido. As opções de filtro são listas de nomes de campos de metadados e os respetivos pares de valores. Definem a condição de filtro a aplicar quando lêem dados de uma SAP DataSource. Apenas são extraídos os registos que satisfazem as condições. A chave do filtro corresponde a um campo no esquema. Tem de ser de um tipo simples (não ARRAY , RECORD nem UNION ). Exemplo de utilização:Nome do campo: MATNR Valor: 10008 |
Opções de filtro (não é igual) | Sim | Não | Define o valor ao qual um campo não deve ser igual para ser lido. As opções de filtro são listas de nomes de campos de metadados e os respetivos pares de valores. Definem a condição de filtro a aplicar quando lêem dados de uma SAP DataSource. Apenas são extraídos os registos que satisfazem as condições. A chave do filtro corresponde a um campo no esquema. Tem de ser de um tipo simples (não ARRAY , RECORD nem UNION ). Exemplo de utilização:Nome do campo: MTART Valor: FERT |
Número de divisões a gerar | Sim | Não | Cria partições para extrair registos em paralelo. O motor de tempo de execução cria o número especificado de partições (e ligações SAP) enquanto extrai os registos. Tenha cuidado ao aumentar este valor, uma vez que aumenta as ligações simultâneas com o SAP. Recomendado: planeie as ligações SAP para cada pipeline e o número total de pipelines em execução em simultâneo. Se o valor for 0 ou for deixado em branco, o Cloud Data Fusion escolhe um valor adequado, com base no número de executores disponíveis, nos registos a extrair e no tamanho do pacote. |
Tamanho do pacote (em KB) | Sim | Não | O número de registos a extrair numa única chamada de rede SAP. É o número de registos que o SAP armazena em buffer na memória durante cada chamada de extração de rede. Tenha cuidado ao definir esta propriedade. Vários pipelines de dados que extraem dados podem aumentar o uso de memória, o que provoca falhas devido a erros Out of memory .
|
Propriedades de associação SAP adicionais | Sim | Não | Defina propriedades SAP JCo adicionais para substituir as predefinições do SAP JCo.
Por exemplo, a definição de jco.destination.pool_capacity = 10
substitui a capacidade predefinida do conjunto de ligações. |
Mapeamentos de tipos de dados
A tabela seguinte é uma lista de tipos de dados SAP com os tipos de dados do Cloud Data Fusion correspondentes.
Tipo de dados SAP | Tipo ABAP | Descrição do SAP | Tipo de dados do Cloud Data Fusion |
---|---|---|---|
INT1 (numérico) |
b | Número inteiro de 1 byte | int |
INT2 (numérico) |
s | Número inteiro de 2 bytes | int |
INT4 (numérico) |
i | Número inteiro de 4 bytes | int |
INT8 (numérico) |
8 | Número inteiro de 8 bytes | longo |
DEC (numérico) |
p | Número compactado no formato BCD (DEC) | decimal |
DF16_DEC , DF16_RAW (numérico) |
a | Vírgula flutuante decimal de 8 bytes IEEE 754r | dupla |
DF34_DEC , DF34_RAW (numérico) |
e | Vírgula flutuante decimal de 16 bytes IEEE 754r | dupla |
FLTP (numérico) |
f | Número de vírgula flutuante binário | dupla |
CHAR , LCHR (personagem) |
c | String de carateres | de string |
SSTRING , GEOM_EWKB (personagem) |
de string | String de carateres | de string |
STRING (Caráter) |
de string | CLOB de string de carateres | bytes |
NUMC , ACCP (personagem) |
n | Texto numérico | de string |
RAW , LRAW (byte) |
x | Dados binários | bytes |
RAWSTRING (byte) |
xstring | BLOB de string de bytes | bytes |
DATS (data/hora) |
d | Data | data |
TIMS (data/hora) |
t | Hora | tempo |
TIMS (data/hora) |
utcl | Utclong), TimeStamp | timestamp |
Limitações
Para garantir que os pipelines estão corretamente definidos e executados, reveja as seguintes limitações dos plug-ins:
- Os tamanhos de pacotes superiores a 50 mil não são suportados.
- As origens de dados que não suportam a extração delta falham no modo de sincronização.
- Numa origem de dados personalizada, se o tamanho do pacote não for processado, o pipeline falha em extrações de dados grandes.
Exemplos de utilização
São suportados dois contextos de extração:
- Fontes de dados ou extratores (SAPI)
- Contexto ODP ABAP CDS (ABAP_CDS)
O plug-in de ODP suporta as seguintes origens de dados padrão e personalizadas para ambos os contextos:
Origem de dados da ODP | Contexto | Extração completa | Extração delta |
---|---|---|---|
SAP Standard pré-entregue | SAPI | Suportado | Suportado |
Personalizado (Z*) | SAPI | Suportado | Suportado |
SAP Standard pré-entregue | ABAP_CDS | Suportado | Suportado |
Personalizado (Z*) | ABAP_CDS | Suportado | Suportado |
Notas de lançamento
O que se segue?
- Saiba mais sobre o Cloud Data Fusion.
- Saiba mais sobre o SAP no Google Cloud.