콘텐츠로 이동하기
데이터 분석

Cloud Data Fusion을 사용한 SAP 통합 소개

2021년 6월 2일
Chai Pydimukkala

Product Lead, Dataplex, Data Sharing and Data Integration

Google Cloud 사용해 보기

$300의 무료 크레딧과 20개 이상의 항상 무료인 제품으로 Google Cloud 사용을 시작해보세요.

무료 체험

* 본 아티클의 원문은 2021년 4월 13일 Google Cloud 블로그(영문)에 게재되었습니다.   

오늘날 기업에서는 데이터 분석, 통찰력 기반 작업에 대한 수요가 증가하고 있습니다. 이러한 작업을 주도하는 귀중한 데이터는 업무상 중요한 운영체제에 있는 경우가 많습니다. 오늘날 시장에 나와 있는 모든 애플리케이션 중에서 SAP는 ERP 소프트웨어의 선도적인 공급업체이며, Google Cloud는 SAP 데이터의 가치를 빠르고 쉽게 활용할 수 있도록 SAP와의 통합을 도입하고 있습니다.

Google Cloud 기반 데이터 통합 플랫폼 Cloud Data Fusion이 이제 SAP Business Suite, SAP ERP, S/4HANA에서 데이터를 원활하게 가져올 수 있는 기능을 제공합니다. Cloud Data Fusion은 ETL 개발자, 데이터 엔지니어, 비즈니스 분석가가 BigQuery 또는 CloudSQL, Spanner 또는 기타 시스템의 운영 보고 시스템에서 데이터 웨어하우스, 데이터 마트, 데이터 레이크 빌드를 가속화하는 ETL/ELT 파이프라인을 효율적으로 빌드하고 관리할 수 있도록 돕는 클라우드 기반의 완전 관리형 데이터 통합 및 수집 서비스입니다. SAP 데이터 활용을 단순화하기 위해 오늘 SAP Table Batch Source의 정식 출시를 발표합니다. 이 기능을 사용하면 이제 Cloud Data Fusion으로 SAP 애플리케이션 데이터를 쉽게 통합하여 Looker를 통해 귀중한 통찰력을 얻을 수 있습니다. 또한 Google Cloud에서 동급 최고의 머신러닝 제품을 활용하여 SAP 데이터와 다른 데이터 세트의 결합을 통해 비즈니스에 대한 통찰력을 확보할 수 있습니다. 몇 가지 예로는 ERP 트랜잭션 데이터와 결합된 IoT 데이터에서 머신러닝을 실행한 예측 유지보수, SAP 및 CloudSQL 기반 애플리케이션과의 애플리케이션 간 통합, 사기 감지, 지출 분석, 수요 예측 등이 있습니다.

Cloud Data Fusion의 SAP Table Batch Source 이점을 자세히 살펴보겠습니다. 

개발자 생산성

Cloud Data Fusion은 완전한 시각적 환경이므로 사용자는 Pipeline Studio를 사용하여 SAP ECC 또는 S/4HANA에서 읽는 파이프라인을 빠르게 설계할 수 있습니다. Data Fusion의 사전 빌드된 변환을 사용하면 SAP 및 SAP 이외 시스템의 데이터를 쉽게 조인하고, 데이터 정리, 집계, 데이터 준비, 조회 등 복잡한 변환을 수행하여 데이터에서 신속하게 통찰력을 얻을 수 있습니다.

가치 창출 시간

전통적인 접근방식에서는 사용자가 데이터 웨어하우징 시스템의 모델을 정의해야 합니다. Cloud Data Fusion에서는 BigQuery를 사용할 때 사용자를 위해 이 작업이 자동으로 수행됩니다. BigQuery에 작성하는 데이터 파이프라인을 설계하고 실행하면 Data Fusion이 자동으로 BigQuery에 스키마를 생성합니다. 사용자가 모델을 사전 빌드할 필요가 없기 때문에 데이터에 대한 통찰력을 더 빨리 확보하여 조직의 생산성이 향상됩니다.

성능 및 확장성

Cloud Data Fusion은 수평으로 확장되어 파이프라인을 실행합니다. 사용자는 임시 클러스터 또는 전용 클러스터를 활용하여 파이프라인을 실행할 수 있습니다. SAP Batch Source 플러그인은 SAP 애플리케이션 서버 리소스와 Cloud Data Fusion 런타임 리소스 모두를 기반으로 SAP 시스템에서 데이터를 추출할 때 최적의 성능을 위해 데이터 파이프라인을 자동으로 조정합니다. 동시 로드가 잘못 구성되면 플러그인의 안전 조치 메커니즘이 소스 시스템의 모든 문제를 방지합니다.

SAP Table Batch Source의 작동 방식

SAP에서 BigQuery 또는 기타 시스템으로 전체 테이블 데이터 전송

Pipeline Studio에서는 여러 SAP 소스 테이블을 데이터 파이프라인에 추가한 다음 조이너 변환을 사용하여 다른 SAP 소스 테이블에 조인할 수 있습니다. 조이너가 Cloud Data Fusion 처리 레이어에서 실행되므로 SAP 시스템에는 추가적인 영향이 없습니다.  예를 들어 Customer Master 데이터 마트를 만들려면 플러그인을 사용하여 SAP의 모든 관련 테이블을 조인하고 Cloud Data Fusion의 Pipeline Studio에서 해당 데이터의 복잡한 파이프라인을 빌드할 수 있습니다.
https://storage.googleapis.com/gweb-cloudblog-publish/images/Data_Fusion_SAP_Blog.max-2200x2200.jpg

동시에 테이블 레코드 추출

동시에 레코드를 추출하려면 생성할 분할 수 속성을 사용하여 SAP Table Batch Source 플러그인을 구성하면 됩니다.이 속성을 비워두면 시스템에서 최적의 성능을 위한 적절한 값을 결정합니다.

조건에 따라 레코드 추출 

SAP Table Batch Source 플러그인을 사용하면 필터 옵션을 사용하여 필터 조건을 지정할 수 있습니다.  OpenSQL 구문에서 조건을 지정하면 플러그인은 SQL WHERE 절을 사용하여 테이블을 필터링합니다. 정의된 값 집합 또는 일정 범위의 값을 포함하는 특정 열과 같은 조건에 따라 레코드를 추출할 수 있습니다.  여러 조건을 AND 또는 OR 절과 결합한 복잡한 조건을 지정할 수도 있습니다(예: TIMESTAMP >= ' 20210130100000' AND TIMESTAMP <= ' 20210226000000').

추출할 레코드 수 제한

사용자는 가져올 행 수 속성을 사용하여 지정된 테이블에서 추출된 레코드 수를 제한할 수도 있습니다. 이는 개발 및 테스트 시나리오에서 특히 유용합니다.

데이터 반환 최적화

Google Cloud Platform을 사용하면 이미 엄청난 양의 소셜, 운영, 트랜잭션, IoT 데이터를 확장하고 처리하여 가치를 추출하고 빠른 통찰력을 얻을 수 있습니다. Cloud Data Fusion은 기존의 엔터프라이즈 애플리케이션 및 데이터 웨어하우스에 대한 다양한 커넥터를 제공합니다. Cloud Data Fusion을 사용하여 SAP 데이터를 BigQuery에 활용하는 기본 기능을 통해 이제 한 단계 더 나아가 신속하고 지능적인 의사결정으로 더 많은 것을 얻을 수 있습니다.

SAP Table Batch 커넥터를 사용할 준비가 되셨나요? Data Fusion의 새 인스턴스를 만들고 허브에서 SAP 플러그인을 배포하세요. 자세한 내용은 SAP Table Batch Source 사용자 가이드를 참조하세요. 선도 기업이 데이터 통합을 포함한 데이터 솔루션으로 혁신을 추진하는 방법에 대해 자세히 알아보려면 5월 26일, Google Cloud의 Data Cloud Summit을 확인해 보세요.

게시 위치