Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격은 Dataproc 클러스터의 크기와 실행 기간에 따라 책정됩니다. 클러스터 크기는 마스터 및 워커 노드를 포함한 전체 클러스터의 총 가상 CPU (vCPU) 수를 기준으로 결정됩니다. 클러스터의 기간은 클러스터가 생성되어 중지되거나 삭제되기까지의 시간입니다.
Dataproc 가격 책정 공식은 $0.010 * # of vCPUs * hourly duration
입니다.
가격 책정 공식에서는 시간 단위 요금을 사용하지만 Dataproc 요금은 초 단위로 청구되어 모든 Dataproc 클러스터는 1초 단위로 요금이 부과되며 최소 요금은 1분부터 시작됩니다. 초당 사용량에 시간당 요금을 적용하기 위해 사용량은 시간 단위(예: 30분은 0.5시간으로 표시)로 표기됩니다.
Dataproc 가격은 각 가상 머신의 Compute Engine 인스턴스당 가격에 추가로 부과됩니다(기타 Google Cloud 리소스 사용 참조).
발생한 비용
다음 Dataproc 작업과 시나리오에서는 요금이 부과됩니다.
확장 및 자동 확장: VM이 클러스터에 추가되면 VM이 활성 상태일 때 비용이 부과됩니다. 이러한 누적 요금은 VM이 삭제될 때까지 계속 청구됩니다.
오류 상태의 클러스터: Dataproc 클러스터가 오류 상태에 있으면 클러스터 VM이 활성 상태로 유지되고 요금이 계속 발생합니다. 이러한 누적 요금은 클러스터가 삭제될 때까지 계속 청구됩니다.
가격 책정 예시
예를 들어 다음과 같은 구성의 클러스터(마스터 및 워커 노드 사용)가 있다고 가정해 보겠습니다.
항목 | 머신 유형 | 가상 CPU | 연결된 영구 디스크 | 클러스터 번호 |
---|---|---|---|---|
마스터 노드 | n1-standard-4 | 4 | 500GB | 1 |
워커 노드 | n1-standard-4 | 4 | 500GB | 5 |
이 Dataproc 클러스터에는 24개의 가상 CPU가 있습니다(마스터용으로 4개, 작업자 전반에 분산된 20개). Dataproc 청구를 위해 이 클러스터는 24개의 가상 CPU와 클러스터가 실행된 기간을 기준으로 가격이 책정됩니다(축소되거나 선점된 노드는 없다고 가정). 클러스터가 2시간 동안 실행되는 경우 Dataproc 가격에 적용되는 공식은 다음과 같습니다.
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
이 예시에서는 Dataproc 요금 외에 클러스터에서 Compute Engine 및 표준 영구 디스크 프로비저닝 공간에 대한 요금도 발생합니다 (기타 Google CloudTrusted Cloud by S3NS 참조). 청구 계산기를 사용하면 각 Google Cloud 리소스 비용을 따로 확인할 수 있습니다.
기타 Google Cloud 리소스 사용
Dataproc은 관리형 통합 솔루션으로서 다른 Google Cloud 기술을 바탕으로 구축되었습니다. Dataproc 클러스터는 다음과 같은 리소스를 사용하며 각기 해당하는 가격에 따라 요금이 청구됩니다.
- Compute Engine - Dataproc 클러스터의 모든 Compute Engine 인스턴스는 최소 요금이 1분부터 시작되고 1초 단위로 요금이 부과되며 지속 사용 가격 규칙이 적용됩니다.
- 표준 영구 디스크 프로비저닝된 공간
- Cloud Monitoring: Google Cloud Observability 가격 책정 참조
원하는 경우 Dataproc 클러스터에서 다음을 포함한 여러 리소스를 활용할 수 있으며 각기 해당하는 가격에 따라 요금이 청구됩니다.
GKE 기반 Dataproc 가격 책정
이 섹션에서는 사용자 관리형 GKE에서 실행되는 가상 Dataproc 클러스터에만 적용되는 요금을 설명합니다. 사용자 관리형 GKE 클러스터에 적용되는 추가 요금에 대해 알아보려면 GKE 가격 책정을 참조하세요.
GKE 기반 Dataproc 가격 책정 공식
$0.010 * # of vCPUs * hourly duration
은 Compute Engine 기반 Dataproc 가격 책정 공식과 동일하며 클러스터의 Dataproc이 만든 노드 풀에서 VM 인스턴스에서 실행되는 가상 CPU의 합계 수에 적용됩니다. 가상 머신 인스턴스의 기간은 생성부터 삭제까지의
시간입니다. Compute Engine의 Dataproc과 마찬가지로
GKE의 Dataproc도 가상 머신 인스턴스당 1분의 최소 청구 기준에 따라
초 단위로 청구됩니다. Dataproc 요금 외에 다른 Google Cloud 요금
이 적용됩니다.
Dataproc에서 만든 노드 풀은 여러 클러스터에서 공유될 수 있으므로 Dataproc 클러스터를 삭제한 후에도 계속 존재합니다. 노드 풀을 삭제하거나 노드 풀을 0개 인스턴스로 축소하면 계속해서 Dataproc 요금이 청구되지 않습니다. 남아 있는 노드 풀 VM은 삭제할 때까지 계속 요금이 부과됩니다.
Dataproc Serverless 가격 책정
Dataproc 서버리스 가격 책정을 참조하세요.
다음 단계
- Dataproc 문서 읽어보기
- Dataproc 시작하기
- 가격 계산기 사용해 보기
- Dataproc 솔루션 및 사용 사례 알아보기