Fuente de lotes de SAP ODP

En esta página, se proporcionan instrucciones para configurar el complemento de SAP ODP en Cloud Data Fusion.

El complemento ODP de SAP habilita la integración masiva de datos de aplicaciones de SAP con BigQuery o con otros sistemas de destino compatibles mediante Cloud Data Fusion. El complemento tiene las siguientes funciones clave:

Versiones de software compatibles

Software Versiones
SAP S4/HANA SAP S4/HANA 1909 y versiones posteriores
SAP ECC SAP ERP6 NW 7.31 SP16 y versiones posteriores
SAP JCo SAP JCo versión 3.0.20 y posteriores
Cloud Data Fusion 6.3 y versiones posteriores

Para obtener más información sobre SAP en Google Cloud, consulta la descripción general de SAP en Google Cloud.

Antes de comenzar

Configura los siguientes sistemas y servicios que usa el complemento de SAP ODP:

  1. Configura el sistema SAP ERP. Este proceso incluye los siguientes pasos:
    • Instala los archivos de transporte de SAP.
    • Configura las autorizaciones y los roles de SAP necesarios.
    • Configura el conector de Java de SAP.
  2. Implementa el complemento de ODP en Cloud Data Fusion.

    • Importante: Elige una versión del complemento que sea compatible con la versión de Cloud Data Fusion.
    • Si actualizas la versión de tu instancia o complemento de Cloud Data Fusion, evalúa el impacto de los cambios en el alcance funcional y el rendimiento de la canalización.
  3. Establece conectividad de RFC entre Cloud Data Fusion y SAP.

    • Asegúrate de que la comunicación esté habilitada entre la instancia de Cloud Data Fusion y el servidor de SAP.
    • Para las instancias privadas, configura el intercambio de tráfico entre redes de VPC.
    • Tanto el sistema SAP como la instancia de Cloud Data Fusion deben estar en el mismo proyecto.

Configura el complemento

  1. Ve a la interfaz web de Cloud Data Fusion y haz clic en Studio.
  2. Verifica que esté seleccionada la opción Data Pipeline - Batch (no Realtime).
  3. En el menú Source, haz clic en SapODP. El nodo de SAP ODP aparecerá en tu canalización.
  4. Para configurar la fuente, ve al nodo SAP ODP y haz clic en Properties.
  5. Ingresa las siguientes propiedades. Para obtener una lista completa, consulta Propiedades.

    1. Ingresa una etiqueta para el nodo de SAP ODP, por ejemplo, SAP ODP tables.
    2. Ingresa los detalles de la conexión. Puedes configurar una conexión nueva y única, o una conexión existente y reutilizable.

      Nueva conexión

      Para agregar una conexión única a SAP, sigue estos pasos:

      1. Mantén desactivada la opción Usar conexión.
      2. En la sección Connection, ingresa la siguiente información de la cuenta de SAP en estos campos:

        1. En el campo Reference name, ingresa un nombre para la conexión que identifica esta fuente para el linaje.
        2. En el campo Cliente de SAP, ingresa el nombre del cliente de una instancia o un entorno específicos dentro de SAP. Un administrador de SAP puede proporcionar el nombre del cliente.
        3. En el campo Lenguaje de SAP, ingresa un lenguaje de inicio de sesión de SAP. El valor predeterminado es EN (inglés).
        4. Selecciona uno de los siguientes tipos de conexión.

          • Directa (a través del servidor de aplicaciones de SAP) Si eliges este tipo predeterminado, ingresa información en los siguientes campos: Host del servidor de aplicaciones de SAP, Número de sistema de SAP y Router de SAP.
          • Balanceo de cargas (a través del servidor de mensajes de SAP) Si eliges este tipo, ingresa información en los siguientes campos: Host del servidor de mensajes de SAP, Número de puerto o servicio del servidor de mensajes de SAP, ID del sistema SAP (SID) y Nombre del grupo de acceso de SAP.
        5. En el campo Contexto, selecciona el tipo de fuente de datos que usas.

        6. En el campo Nombre de la fuente de la ODP de SAP, ingresa el nombre de la fuente de datos que usas.

        7. En el campo Tipo de extracción, selecciona el tipo de extracción de datos. El valor predeterminado es Completa (todos los datos).

        8. Proporciona las credenciales de SAP: pídele al administrador de SAP el nombre de usuario de inicio de sesión de SAP y la contraseña.

        9. En el campo Ruta de acceso de Cloud Storage de la biblioteca de JCo, ingresa la ruta de acceso de SAP Java Connector (SAP JCo) en Cloud Storage que contiene los archivos de la biblioteca de SAP JCo que subiste.

        10. Para generar un esquema basado en los metadatos de SAP que asigne los tipos de datos de SAP a los tipos de datos de Cloud Data Fusion correspondientes, haz clic en Obtener esquema. Para obtener más información, consulta Asignaciones de tipos de datos.

        11. Opcional: Para optimizar la carga de transferencia de SAP, ingresa información en los siguientes campos:

          1. En el campo Nombre del suscriptor de SAP ODP, identifica al suscriptor para la extracción de datos de una DataSource válida.
          2. El uso de las opciones de filtro te permite extraer registros según las condiciones de selección.
          3. En el campo Cantidad de divisiones, puedes crear particiones para extraer registros de datos en paralelo, lo que mejora el rendimiento. La cantidad de divisiones puede afectar los procesos de trabajo de SAP y se debe seleccionar con cuidado.
          4. En el campo Tamaño del paquete, especifica la cantidad de registros que se extraerán en una sola llamada de red a SAP. El tamaño del paquete afecta el rendimiento y los recursos disponibles, por lo que se debe seleccionar con cuidado.

      Conexión reutilizable

      Para volver a usar una conexión existente, sigue estos pasos:

      1. Activa Usar conexión.
      2. Haz clic en Browse connections.
      3. Haz clic en el nombre de la conexión.

      Si no existe una conexión, sigue estos pasos para crear una conexión reutilizable:

      1. Haz clic en Agregar conexión > SapOdp.
      2. En la página Create a SapOdp connection que se abre, ingresa un nombre y una descripción para la conexión.
      3. En el campo Cliente de SAP, ingresa el nombre del cliente de una instancia o un entorno específicos en SAP. Un administrador de SAP puede proporcionar el nombre del cliente.
      4. En el campo Lenguaje de SAP, ingresa un lenguaje de inicio de sesión de SAP. El valor predeterminado es EN (inglés).
      5. Selecciona uno de los siguientes tipos de conexión.

        • Directa (a través del servidor de aplicaciones de SAP) Si eliges este tipo predeterminado, ingresa información en los siguientes campos: Host del servidor de aplicaciones de SAP, Número de sistema SAP y Router de SAP.
        • Balanceo de cargas (a través del servidor de mensajes de SAP) Si eliges este tipo, ingresa información en los siguientes campos: Host del servidor de mensajes de SAP, Número de puerto o servicio del servidor de mensajes de SAP, ID del sistema SAP (SID) y Nombre del grupo de inicio de sesión de SAP.
      6. En el nombre de la fuente de SAP ODP, ingresa el nombre de la fuente de datos de ODP de SAP.

      7. Proporciona las credenciales de SAP: pídele al administrador de SAP los valores de nombre de usuario de acceso de SAP y Contraseña.

      8. En el campo Ruta de acceso de Cloud Storage de la biblioteca de JCo, ingresa la ruta de acceso de SAP Java Connector (SAP JCo) en Cloud Storage que contiene los archivos de la biblioteca de SAP JCo que subiste.

      9. En el campo Tiempo de espera, ingresa un tiempo de espera (en segundos) antes del próximo reintento, por ejemplo, 60.

      10. En el campo Recuento de reintentos, ingresa la cantidad máxima de reintentos, por ejemplo, 3.

      11. Opcional: En el campo Additional SAP connection properties, ingresa los pares clave-valor que deben anular los valores predeterminados de JCo de SAP.

      12. Haz clic en Crear.

Propiedades

Propiedad Macro habilitada Propiedad obligatoria Descripción
Etiqueta No Es el nombre del nodo en tu canalización de datos.
Cómo usar la conexión No No Usa una conexión reutilizable. Si se usa una conexión, no necesitas proporcionar las credenciales. Para obtener más información, consulta Administra conexiones.
Nombre No Es el nombre de la conexión reutilizable.
Cliente de SAP La instancia o el entorno específicos en un sistema SAP.
Lenguaje de SAP Es el idioma en el que se muestran y procesan los datos y la interfaz de usuario de SAP.
Tipo de conexión No El tipo de conexión de SAP: Direct o Balanceado de cargas
Host del servidor de aplicaciones de SAP No Solo para el tipo de conexión Direct, este nombre de host proviene del servidor de aplicaciones de SAP, que funciona como una capa de middleware entre los clientes de SAP (como la interfaz web de SAP, los navegadores web o las apps para dispositivos móviles) y la base de datos subyacente.
Número de sistema SAP No Solo para el tipo de conexión Direct, este número es el identificador único asignado a cada sistema SAP. Por ejemplo, 00.
Router SAP No Solo para el tipo de conexión Direct, esta es la cadena de router para el servidor proxy, que proporciona un canal seguro para la comunicación entre los sistemas SAP y los clientes o socios externos.
Host del servidor de mensajes de SAP No Solo para el tipo de conexión Balanced load, este es el nombre del host, que facilita el balanceo de cargas en varios servidores de aplicaciones en SAP.
Número de puerto o servicio del servidor de mensajes de SAP No Solo para el tipo de conexión Balanced load, este es el puerto de red en el que el servidor de mensajes de SAP escucha las conexiones entrantes de los clientes y servidores de aplicaciones de SAP.
ID del sistema SAP (SID) No Solo para el tipo de conexión Balanceada de cargas, este ID se asigna a cada sistema SAP.
Nombre del grupo de inicio de sesión de SAP No Es el nombre de la agrupación lógica o la configuración de varios servidores de aplicaciones de SAP. El valor predeterminado es PUBLIC.
Tipo de objeto N/A N/A Los tipos de objetos admitidos: DataSources/Extractors o ABAP Core Data Services.
Nombre de la fuente de SAP ODP El nombre de la DataSource o la vista de CDS de SAP (por ejemplo, 2LIS_02_ITM).
Tipo de extracción El complemento admite los siguientes dos tipos de extracción de datos:
  • Completa (todos los datos): Extrae todos los datos disponibles.
  • Sync (selección automática basada en la ejecución anterior): Determina si se debe ejecutar el modo completo, delta (incremental) o de recuperación (recuperar datos de la última ejecución) en función del tipo y el estado de la ejecución anterior disponibles en SAP. Extrae datos completos en la ejecución inicial de la canalización (modo F de ODP) y cambia los datos en ejecuciones posteriores de la canalización (modos D y R de ODP).
Nombre de usuario de inicio de sesión de SAP Nombre de usuario de SAP
Recomendación: Si el nombre de usuario cambia de forma periódica, usa una macro.
Contraseña de inicio de sesión de SAP Contraseña de SAP.
Se recomienda usar macros seguras.
ID del proyecto de GCP ID del proyecto deGoogle Cloud .
Ruta de acceso de GCS de la biblioteca de SAP JCo Es la ruta de acceso a Cloud Storage a la que subiste los archivos de la biblioteca de SAP JCo.
Obtener esquema N/A N/A El complemento genera un esquema basado en los metadatos de SAP, que asigna los tipos de datos de SAP a los tipos de datos de Cloud Data Fusion correspondientes. Consulta Asignación de tipos de datos.
Nombre del suscriptor de SAP ODP El suscriptor de ODP para la extracción de datos de una fuente de datos o una vista de CDS de SAP válida Debe tener lo siguiente:
  • Un máximo de 32 caracteres, sin espacios
  • Contiene solo a a z, A a Z, 0 a 9, _ o /
  • Es único para diferentes canalizaciones que extraen datos de la misma DataSource de SAP.
Si el campo se deja en blanco, Cloud Data Fusion genera un ID con una combinación del ID del proyecto, el espacio de nombres y los nombres de las canalizaciones. Puedes volver a usar una suscripción anterior, como una que creó una herramienta de terceros.
Tiempo de espera No Esta propiedad permite que los ingenieros de datos seleccionen un tiempo de espera adecuado después de cada llamada de red de Cloud Data Fusion a SAP.
Recuento de reintentos No Es la cantidad de intentos de reintento mientras se espera que se complete la llamada a la red.
Opciones de filtro (igual) No Es el valor que debe tener un campo para que se pueda leer.
Las opciones de filtro son listas de nombres de campos de metadatos y sus pares de valores. Definen la condición del filtro que se aplicará cuando se lean datos de una fuente de datos de SAP. Solo se extraen los registros que satisfacen las condiciones.
La clave de filtro corresponde a un campo del esquema. Debe ser de un tipo simple (no ARRAY, RECORD ni UNION). Ejemplo de uso:
Nombre del campo: MTART
Valor: FERT
Opciones de filtro (rango) No Los límites inferior y superior delimitan el valor que debe tener un campo para que se pueda leer.
Las opciones de filtro son listas de nombres de campos de metadatos y sus pares de valores. Definen la condición del filtro que se aplicará cuando se lean datos de una fuente de datos de SAP. Solo se extraen los registros que satisfacen las condiciones.
La clave de filtro corresponde a un campo del esquema. Tiene el formato bajo Y alto. Ejemplo de uso:
Nombre del campo: ERDAT
Valor bajo: 2023-11-01
Valor alto: 2023-11-30
Opciones de filtro (menor o igual que) No Es el valor que un campo debe ser menor o igual que.
Las opciones de filtro son listas de nombres de campos de metadatos y sus pares de valores. Definen la condición del filtro que se aplicará cuando se lean datos de una fuente de datos de SAP. Solo se extraen los registros que satisfacen las condiciones.
La clave de filtro corresponde a un campo del esquema. Debe ser de un tipo simple (no ARRAY, RECORD ni UNION). Ejemplo de uso:
Nombre del campo: MATNR
Valor: 10008
Opciones de filtro (mayor o igual que) No Es el valor que un campo debe ser mayor para poder leerlo.
Las opciones de filtro son listas de nombres de campos de metadatos y sus pares de valores. Definen la condición del filtro que se aplicará cuando se lean datos de una fuente de datos de SAP. Solo se extraen los registros que satisfacen las condiciones.
La clave de filtro corresponde a un campo del esquema. Debe ser de un tipo simple (no ARRAY, RECORD ni UNION). Ejemplo de uso:
Nombre del campo: MATNR
Valor: 10008
Opciones de filtro (no es igual) No Define el valor que un campo no debe ser igual para que se lea.
Las opciones de filtro son listas de nombres de campos de metadatos y sus pares de valores. Definen la condición del filtro que se aplicará cuando se lean datos de una fuente de datos de SAP. Solo se extraen los registros que satisfacen las condiciones.
La clave de filtro corresponde a un campo del esquema. Debe ser de un tipo simple (no ARRAY, RECORD ni UNION). Ejemplo de uso:
Nombre del campo: MTART
Valor: FERT
Cantidad de divisiones que se generarán No Crea particiones para extraer registros en paralelo.
El motor de tiempo de ejecución crea la cantidad especificada de particiones (y conexiones de SAP) mientras extrae los registros.
Ten cuidado cuando aumentes este valor, ya que aumenta las conexiones simultáneas con SAP.
Recomendado: Planifica las conexiones de SAP para cada canalización y la cantidad total de canalizaciones que se ejecutan de forma simultánea.
Si el valor es 0 o se deja en blanco, Cloud Data Fusion elige un valor apropiado, según la cantidad de ejecutores disponibles, los registros que se extraerán y el tamaño del paquete.
Tamaño del paquete (en KB) No Es la cantidad de registros que se deben extraer en una sola llamada de red de SAP. Es la cantidad de registros que SAP almacena en búfer en la memoria durante cada llamada de extracción de red.
Ten cuidado cuando configures esta propiedad. Varias canalizaciones de datos que extraen datos pueden aumentar el uso de la memoria, lo que provoca fallas debido a errores de Out of memory.
  • Ingresa un número entero positivo.
  • Si es 0 o se deja en blanco, el complemento usa un valor estándar de 70000 o un valor calculado de forma adecuada.
  • Si la canalización de datos falla debido a errores Out of memory, disminuye el tamaño del paquete o aumenta la memoria disponible para tus procesos de trabajo de SAP.
Propiedades de conexión de SAP adicionales No Establece propiedades adicionales de SAP JCo para anular los valores predeterminados de SAP JCo. Por ejemplo, configurar jco.destination.pool_capacity = 10 anula la capacidad predeterminada del grupo de conexiones.

Asignaciones de tipos de datos

La siguiente tabla es una lista de los tipos de datos de SAP con los tipos de Cloud Data Fusion correspondientes.

Tipo de datos SAP Tipo de ABAP SAP description Tipo de datos de Cloud Data Fusion
INT1 (numérico) b Número entero de 1 byte int
INT2 (numérico) s Número entero de 2 bytes int
INT4 (numérico) i Número entero de 4 bytes int
INT8 (numérico) 8 Entero de 8 bytes long
DEC (numérico) p Número empaquetado en formato BCD (DEC) decimal
DF16_DEC, DF16_RAW (numérico) a Punto flotante decimal de 8 bytes, IEEE 754r double
DF34_DEC, DF34_RAW (numérico) e Punto flotante decimal de 16 bytes, IEEE 754r double
FLTP (numérico) f Número de punto flotante binario double
CHAR, LCHR (carácter) c Cadena de caracteres string
SSTRING, GEOM_EWKB (carácter) string Cadena de caracteres string
STRING (carácter) string CLOB de string de caracteres bytes
NUMC, ACCP (carácter) n Texto numérico string
RAW, LRAW (byte) x Datos binarios bytes
RAWSTRING (byte) xstring BLOB de cadena de bytes bytes
DATS (Fecha y hora) d Fecha fecha
TIMS (Fecha y hora) t Hora hora
TIMS (Fecha y hora) utcl Utclong), TimeStamp timestamp

Limitaciones

Para garantizar que las canalizaciones se definan y ejecuten correctamente, revisa las siguientes limitaciones del complemento:

  • No se admiten tamaños de paquetes superiores a 50,000.
  • Las fuentes de datos que no admiten la extracción de delta fallan en el modo de sincronización.
  • En una fuente de datos personalizada, si no se controla el tamaño del paquete, la canalización falla en extracciones de datos grandes.

Casos de uso

Se admiten dos contextos de extracción:

  • DataSources o extractores (SAPI)
  • CDS de ABAP del contexto de ODP (ABAP_CDS)

El complemento de ODP admite las siguientes fuentes de datos estándar y personalizadas para ambos contextos:

Fuente de datos de ODP Contexto Extracción completa Extracción de delta
SAP Standard preentregado SAPI Admitido Admitido
Personalizado (Z*) SAPI Admitido Admitido
SAP Standard pre entregado ABAP_CDS Admitido Admitido
Personalizado (Z*) ABAP_CDS Admitido Admitido

¿Qué sigue?