새로운 차원의 Spark 성능: Google Cloud 기반 Spark를 구동하는 벡터화된 엔진인 Lightning Engine은 4.3배 이상 빠른 Spark 성능을 제공합니다.

Apache Spark on Google Cloud

더 쉽고 스마트하며 빠르게 Spark를 실행하는 새로운 방법.

운영 오버헤드를 줄이고, AI 기반 지원을 늘리고, 가격 대비 성능을 개선하여 Google Cloud에서 Apache Spark 워크로드를 실행하세요. 인프라가 아닌 코드에 집중할 수 있습니다.

Google Cloud는 다른 클라우드 기반 Apache Spark 대안과 비교하여 18~60%의 비용 절감 효과를 제공할 수 있습니다

ESG 보고서 받기

이점

Google Cloud 기반 Apache Spark를 위한 더 나은 환경

더 쉽게 - Spark의 운영 부담 해소

제로옵스(zero-ops) Apache Spark용 Google Cloud 서버리스 또는 관리형 Dataproc 클러스터 중에서 선택하세요. 두 서비스 모두 인프라 복잡성을 자동화하여 개발 수명 주기를 가속화할 수 있습니다.

두 가지 옵션 비교

더 스마트하게 - AI 지원 Spark 개발

Dataproc 및 Apache Spark용 Google Cloud 서버리스에서 Gemini를 사용하여 전체 워크플로를 가속화하세요. Gemini 기반 지원을 받아 코드를 생성 및 디버그하고 실패한 작업을 해결하세요.

Gemini Code Assist 알아보기

더 빠르게 - Spark 성능 가속화

업계를 선도하는 가격 대비 성능을 자동으로 확보하세요. 가장 까다로운 작업의 경우 Lightning Engine으로 4.3배 이상 빠른 성능을 실현할 수 있습니다. 이를 통해 TCO를 절감하고 인사이트 도출 시간을 단축할 수 있습니다.

Lightning Engine 살펴보기

주요 특징

워크로드에 적합한 Spark 선택

제로옵스(zero-ops) 단순성을 위한 Apache Spark용 서버리스 또는 심층적인 맞춤설정이 가능한 관리형 클러스터를 위한 Dataproc 중에서 선택하세요.

결정 가이드 보기

Apache Spark용 Google Cloud 서버리스

코드에만 집중하여 개발 속도를 높이세요. 비용 효율적인 일괄 처리와 고성능 AI/ML을 위한 등급을 모두 갖추고 있어 새로운 Apache Spark 파이프라인, 대화형 분석, 'NoOps' 모델이 선호되는 예측 불가능한 수요의 워크로드에 적합합니다.

권장: 데이터 과학자 및 ML 엔지니어, 임시 쿼리, 새로운 애플리케이션, 개발자 생산성

서버리스 Spark 살펴보기

Dataproc

클러스터 환경을 최대한 제어하세요. 기존 Apache Hadoop/Spark 워크로드를 마이그레이션하거나, 장기 지속 영구 클러스터를 실행하거나, 다양한 오픈소스 생태계를 사용하는 데 적합합니다.

권장: 엔터프라이즈 엔지니어링 및 운영, 온프렘 마이그레이션, 장기 실행 작업, 심층적인 맞춤설정

Dataproc 살펴보기

고객

검증된 비즈니스 성과 제공

Video

New Way Now: 데이터 워크플로를 몇 분으로 단축하고 제품 응답 시간을 60%까지 단축한 Dun & Bradstreet

2:46

Video

BigQuery에서 Spark의 강력한 기능을 활용하는 trivago

45:00

파트너

첫 번째 서버리스 Spark 작업 실행

이 빠른 시작에 따라 서버리스 Spark의 속도와 단순성을 경험해 보세요. Google Cloud CLI를 사용하여 PySpark 일괄 작업을 제출하는 방법을 알아봅니다.

Tutorial

관리형 Dataproc 클러스터 만들기

이 튜토리얼에서는 Google Cloud 콘솔을 사용하여 Dataproc 클러스터를 만드는 방법을 안내합니다. Spark 및 Hadoop 워크로드에 대한 관리형 환경을 구성하고 프로비저닝하는 방법을 알아봅니다.

Best Practice

분석 통합: 단일 데이터 사본에 SQL 및 Spark 활용

SQL의 강력한 기능과 Spark의 유연성 사이에서 고민하지 마세요. BigLake를 사용하면 제어 가능한 동일한 데이터에 두 엔진을 모두 사용할 수 있습니다. 모든 작업에 가장 적합한 도구를 사용할 수 있는 통합 환경입니다.

Best Practice

전체 AI 및 ML 수명 주기 가속화

데이터 준비부터 모델 학습 및 추론까지 더 빠르게 진행할 수 있습니다. 프리미엄 등급은 AI/ML용으로 설계되었으며 NVIDIA RAPIDS와 같은 GPU 지원이 기본 제공되는 사전 구성된 ML 런타임을 사용하여 복잡한 설정을 없앨 수 있습니다.

원하는 내용을 찾을 수 없으신가요?

새로운 소식

Google Cloud 기반 Spark 최신 소식 확인

Blog post

Spark 데이터 파이프라인을 Gemini에 연결블로그 읽기

Blog post

데이터 과학 에이전트 및 Spark블로그 읽기

Blog post

Dataproc 멀티 테넌트 클러스터블로그 읽기

Apache Spark는 Apache Software Foundation의 상표입니다.

** 쿼리는 TPC-DS 표준 및 TPC-H 표준에서 파생되었으며, 이러한 실행은 TPC-DS 표준 및 TPC-H 표준 사양의 모든 요구사항을 준수하지 않으므로 게시된 TPC-DS 표준 및 TPC-H 표준 결과와 비교할 수 없습니다.

다음 단계 수행

해결해야 하는 문제를 알려주세요. 가장 적합한 솔루션을 찾을 수 있도록 Google Cloud 전문가가 도와드립니다.

빌드 시작
대화형 튜토리얼 사용해 보기
지금 바로 Google Cloud 사용
$300 크레딧 받기
기술 세부정보 살펴보기
문서 보기

Apache Spark on Google Cloud

Google Cloud 기반 Apache Spark를 위한 더 나은 환경

더 쉽게 - Spark의 운영 부담 해소

더 스마트하게 - AI 지원 Spark 개발

더 빠르게 - Spark 성능 가속화

워크로드에 적합한 Spark 선택

Apache Spark용 Google Cloud 서버리스

Dataproc

검증된 비즈니스 성과 제공

추천 파트너

개방형 클라우드 데이터 레이크하우스를 위한 엔진

문서

첫 번째 서버리스 Spark 작업 실행

관리형 Dataproc 클러스터 만들기

분석 통합: 단일 데이터 사본에 SQL 및 Spark 활용

전체 AI 및 ML 수명 주기 가속화

원하는 내용을 찾을 수 없으신가요?

Google Cloud 기반 Spark 최신 소식 확인

다음 단계 수행

빌드 시작

지금 바로 Google Cloud 사용

기술 세부정보 살펴보기