Apache Spark on Google Cloud

더 쉽고 스마트하며 빠르게 Spark를 실행하는 새로운 방법.

운영 오버헤드를 줄이고, AI 기반 지원을 늘리고, 가격 대비 성능을 개선하여 Google Cloud에서 Apache Spark 워크로드를 실행하세요. 인프라가 아닌 코드에 집중할 수 있습니다.


이점

Google Cloud 기반 Apache Spark를 위한 더 나은 환경

더 쉽게 - Spark의 운영 부담 해소

제로옵스(zero-ops) Apache Spark용 Google Cloud 서버리스 또는 관리형 Dataproc 클러스터 중에서 선택하세요. 두 서비스 모두 인프라 복잡성을 자동화하여 개발 수명 주기를 가속화할 수 있습니다.

두 가지 옵션 비교

더 스마트하게 - AI 지원 Spark 개발

DataprocApache Spark용 Google Cloud 서버리스에서 Gemini를 사용하여 전체 워크플로를 가속화하세요. Gemini 기반 지원을 받아 코드를 생성 및 디버그하고 실패한 작업을 해결하세요. 

Gemini Code Assist 알아보기

더 빠르게 - Spark 성능 가속화

업계를 선도하는 가격 대비 성능을 자동으로 확보하세요. 가장 까다로운 작업의 경우 Lightning Engine으로 4.3배 이상 빠른 성능을 실현할 수 있습니다. 이를 통해 TCO를 절감하고 인사이트 도출 시간을 단축할 수 있습니다.

Lightning Engine 살펴보기

주요 특징

워크로드에 적합한 Spark 선택

제로옵스(zero-ops) 단순성을 위한 Apache Spark용 서버리스 또는 심층적인 맞춤설정이 가능한 관리형 클러스터를 위한 Dataproc 중에서 선택하세요.

결정 가이드 보기

Apache Spark용 Google Cloud 서버리스

코드에만 집중하여 개발 속도를 높이세요. 비용 효율적인 일괄 처리와 고성능 AI/ML을 위한 등급을 모두 갖추고 있어 새로운 Apache Spark 파이프라인, 대화형 분석, 'NoOps' 모델이 선호되는 예측 불가능한 수요의 워크로드에 적합합니다.

권장: 데이터 과학자 및 ML 엔지니어, 임시 쿼리, 새로운 애플리케이션, 개발자 생산성

서버리스 Spark 살펴보기

Dataproc

클러스터 환경을 최대한 제어하세요. 기존 Apache Hadoop/Spark 워크로드를 마이그레이션하거나, 장기 지속 영구 클러스터를 실행하거나, 다양한 오픈소스 생태계를 사용하는 데 적합합니다.

권장: 엔터프라이즈 엔지니어링 및 운영, 온프렘 마이그레이션, 장기 실행 작업, 심층적인 맞춤설정

Dataproc 살펴보기

문서

문서

Tutorial

첫 번째 서버리스 Spark 작업 실행

이 빠른 시작에 따라 서버리스 Spark의 속도와 단순성을 경험해 보세요. Google Cloud CLI를 사용하여 PySpark 일괄 작업을 제출하는 방법을 알아봅니다.

Tutorial

관리형 Dataproc 클러스터 만들기

이 튜토리얼에서는 Google Cloud 콘솔을 사용하여 Dataproc 클러스터를 만드는 방법을 안내합니다. Spark 및 Hadoop 워크로드에 대한 관리형 환경을 구성하고 프로비저닝하는 방법을 알아봅니다.

Best Practice

분석 통합: 단일 데이터 사본에 SQL 및 Spark 활용

SQL의 강력한 기능과 Spark의 유연성 사이에서 고민하지 마세요. BigLake를 사용하면 제어 가능한 동일한 데이터에 두 엔진을 모두 사용할 수 있습니다. 모든 작업에 가장 적합한 도구를 사용할 수 있는 통합 환경입니다.

Best Practice

전체 AI 및 ML 수명 주기 가속화

데이터 준비부터 모델 학습 및 추론까지 더 빠르게 진행할 수 있습니다. 프리미엄 등급은 AI/ML용으로 설계되었으며 NVIDIA RAPIDS와 같은 GPU 지원이 기본 제공되는 사전 구성된 ML 런타임을 사용하여 복잡한 설정을 없앨 수 있습니다.

원하는 내용을 찾을 수 없으신가요?


Apache Spark는 Apache Software Foundation의 상표입니다.

** 쿼리는 TPC-DS 표준TPC-H 표준에서 파생되었으며, 이러한 실행은 TPC-DS 표준TPC-H 표준 사양의 모든 요구사항을 준수하지 않으므로 게시된 TPC-DS 표준TPC-H 표준 결과와 비교할 수 없습니다.

다음 단계 수행

해결해야 하는 문제를 알려주세요. 가장 적합한 솔루션을 찾을 수 있도록 Google Cloud 전문가가 도와드립니다.

Google Cloud