Trifacta의 Cloud Dataprep

분석 및 머신러닝에 사용할 데이터를 시각적으로 탐색, 정리, 준비하는 지능형 클라우드 데이터 서비스입니다.

지능형 데이터 준비

지능형 데이터 준비

Trifacta의 Cloud Dataprep은 구조화 및 비구조화 데이터를 시각적으로 탐색하고 정리하여 분석, 보고, 머신러닝용으로 준비하는 지능형 데이터 서비스입니다. Cloud Dataprep은 서버리스이며 규모와 상관없이 작동하기 때문에 배포하거나 관리해야 할 인프라가 없습니다. UI 동작 하나하나를 통해 가장 이상적인 데이터 변환을 제안하고 예측하므로 코드를 작성할 필요가 없습니다. 또한 자동 스키마, 데이터 유형, 가능한 조인 및 이상 탐지 기능을 사용하여 시간이 많이 소요되는 데이터 프로파일링을 생략하고 데이터 분석에 집중할 수 있습니다.

서버리스의 단순성

서버리스의 단순성

Cloud Dataprep은 Trifacta에서 운영하는 통합 파트너 서비스이며 업계 최고의 데이터 준비 솔루션인 Trifacta Wrangler를 기반으로 합니다. Google은 Trifacta와 긴밀하게 협력하여 소프트웨어 설치가 필요 없고 라이선스 비용이나 지속적인 운영 부담이 발생하지 않는 원활한 사용자 환경을 제공합니다. Cloud Dataprep은 완전 관리형 서비스이며 준비할 데이터 양에 따라 확장되므로 고객은 분석에만 집중할 수 있습니다.

빠른 탐색 및 이상 감지

빠른 탐색 및 이상 감지

데이터 분포를 시각적으로 파악하여 즉시 데이터를 이해하고 탐색할 수 있습니다. Cloud Dataprep은 자동으로 스키마와 데이터 유형, 잠재적 조인을 인식하고 값의 누락 또는 이상점, 중복 등과 같은 잘못된 부분을 감지합니다. 따라서 시간 소모가 큰 데이터 프로파일링을 건너뛰고 바로 데이터 분석을 시작할 수 있습니다.

쉽고도 효과적인 데이터 준비

쉽고도 효과적인 데이터 준비

Cloud Dataprep은 UI의 각 동작으로 가장 이상적인 데이터 변환을 자동으로 제안하고 예측해 줍니다. 변환 시퀀스를 정의하고 나면 Cloud Dataprep이 내부에서 Cloud Dataflow를 사용하여 코드 없이 클릭만으로 간편하게 구조화된 또는 구조화되지 않은 데이터세트를 규모에 상관없이 처리할 수 있습니다.

Cloud Dataprep 고객

Cloud Dataprep 덕분에 새로운 데이터세트를 빠르게 탐색할 수 있게 되었습니다. 또한 이 제품은 모든 데이터 변환 요구를 지원하는 유연성도 갖추고 있습니다. Merkle에서는 데이터 준비 작업이 몇 시간이나 며칠이 아닌 단 몇 분 만에 완료되면서 데이터 준비 시간이 90%나 단축되었습니다.

헨리 컬버, Merkle IT 설계자

Cloud Dataprep 아키텍처

Cloud Dataprep 아키텍처

Cloud Dataprep의 특징

예측 변환

Cloud Dataprep은 독점 추론 알고리즘을 사용해 사용자가 선택한 데이터의 데이터 변환 인텐트를 해석합니다. 일치시킬 선택 항목의 순위가 지정된 제안 집합 및 패턴을 자동으로 생성합니다.

매개변수화

새로고침할 때마다 변경되는 파일 경로의 일부를 대체하는 변수를 매개변수화하여 동일한 데이터세트의 여러 인스턴스에서 레시피를 실행합니다. 이 변수는 작업 런타임 중에 필요에 따라 수정할 수 있습니다.

공동작업

팀 환경에서는 여러 사용자가 동일한 애셋에 대해 작업할 수 있도록 하거나 좋은 품질의 작업을 사본으로 만들어 다른 사용자에게 템플릿으로 제공하면 유용합니다. Cloud Dataprep에서는 사용자가 동일한 흐름 객체에 대해 공동작업을 수행하거나 다른 사용자들이 독립적으로 작업에 사용할 사본을 만들 수 있습니다.

패턴 매칭

열 형식 패턴 일치를 활용해서 사용자가 관심을 가질 수 있는 데이터 패턴을 식별하고 레시피를 빌드할 때 사용할 수 있도록 인터페이스에 이를 표시합니다. 또한 레시피 단계에서 정규 표현식 또는 Cloud Dataprep 패턴을 적용하여 패턴을 찾아내고 데이터세트에서 일치하는 데이터를 변환할 수 있습니다.

시각적 프로파일링

대화형 시각적 데이터 분포를 사용하여 데이터를 확인하고 탐색함으로써 데이터 검색, 정리, 변환에 도움이 됩니다. 시각적 표현을 통해 대규모 데이터의 해석이 용이해지고, Cloud Dataprep의 혁신적인 프로파일링 기술을 활용하여 중요한 통계 정보를 사용하기 쉬운 동적 형식으로 시각화할 수 있습니다.

샘플링

성능 최적화를 위해 Cloud Dataprep에서는 클라이언트 애플리케이션에서 표시 및 조작할 수 있는 하나 이상의 데이터 샘플이 자동으로 생성됩니다. 하지만 샘플 크기, 샘플 범위, 샘플 생성 방법을 쉽게 변경할 수 있습니다.

예약

흐름에서 레시피가 반복적으로 또는 필요에 따라 실행되도록 예약할 수 있습니다. 예약된 작업이 성공적으로 실행되면 지정된 게시 형식으로 지정된 출력 위치에 제공되는 랭글링된 출력을 수집할 수 있습니다.

대상 일치

가져오거나 만든 데이터세트를 통해 대상 스키마를 정의하고 기존 레시피에 할당하여 랭글링 작업을 체계화하고 속도를 높일 수 있습니다. 대상은 변환기 페이지에 표시되며 전체 데이터세트 또는 랭글링해야 할 데이터세트의 선택한 열에 적용할 수 있습니다.

일반적인 데이터 유형

메가바이트 단위부터 테라바이트 단위까지 규모를 막론하고 CSV, JSON 또는 관계형 테이블 형식으로 저장된 구조화된 또는 구조화되지 않은 데이터세트를 간편하게 변환할 수 있습니다.

Google Cloud Platform과 통합

Cloud Storage, BigQuery 또는 데스크톱에 저장된 데이터를 처리한 후 처리된 데이터를 BigQuery 또는 Cloud Storage로 내보내 저장, 분석, 시각화, 머신러닝에 사용할 수 있습니다. Cloud Identity and Access Management로 사용자 액세스 및 데이터 보안을 원활하게 관리할 수 있습니다.

Cloud Dataprep 가격

Cloud Dataprep은 사용자가 데이터 샘플과 상호작용하여 데이터 준비 규칙을 정의하는 대화형 웹 애플리케이션입니다. 샘플 데이터 탐색, 변환 단계 정의, 변환된 샘플 내보내기에 이 애플리케이션을 사용해도 요금이 발생하지 않습니다. 전체 데이터세트에 대한 흐름을 실행할 때 이 흐름을 Cloud Dataprep 작업으로 실행할 수 있습니다(Google Cloud Dataflow 사용). 자세한 내용과 전체적인 세부정보는 가격 책정 가이드를 참조하세요.

리소스

블로그 아이콘

유용한 정보를 손쉽게 확보: 데이터 스튜디오 및 Cloud Dataprep의 일반 안정화 버전 제공

동영상 아이콘

Google Cloud OnAir: Cloud Dataprep으로 데이터 랭글링

빠른 시작 아이콘

Cloud Dataprep 빠른 시작 시작하기

Quicklab 아이콘

Cloud Dataprep 작업

Quicklab 아이콘

IoT Core 데이터를 Cloud Dataprep으로 스트리밍하는 방법

노트 아이콘

Cloud Dataprep 제품 공지 및 업데이트

사용자 아이콘

다른 Cloud Dataprep 사용자와 소통하기

페이지 아이콘

마케팅 데이터 웨어하우스 구축

Google Cloud

시작하기

학습 및 빌드

GCP를 처음 사용하시나요? $300 크레딧으로 모든 GCP 제품을 무료로 시작해 보세요.

도움이 더 필요하신가요?

전문가가 귀하의 필요에 맞게 적합한 솔루션을 빌드하거나 적절한 파트너를 찾을 수 있도록 도와드립니다.

다음에 대한 의견 보내기...

Cloud Dataprep by Trifacta