Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격은 Dataproc 클러스터의 크기와 실행 시간에 따라 결정됩니다. 클러스터 크기는 마스터 및 워커 노드를 포함한 전체 클러스터의 총 가상 CPU (vCPU) 수를 기준으로 결정됩니다. 클러스터의 기간은 클러스터가 생성되어 중지 또는 삭제되기까지의 시간입니다.
Dataproc 가격 책정 공식은 $0.010 * # of vCPUs * hourly duration입니다.
가격 책정 공식에서는 시간 단위 요금을 사용하지만 Dataproc 요금은 초 단위로 청구되어 모든 Dataproc 클러스터는 1초 단위로 요금이 부과되며 최소 요금은 1분부터 시작됩니다. 초당 사용량에 시간당 요금을 적용하기 위해 사용량은 시간 단위(예: 30분은 0.5시간으로 표시)로 표기됩니다.
Dataproc 가격은 각 가상 머신의 Compute Engine 인스턴스당 가격에 추가로 부과됩니다(기타 Google Cloud 리소스 사용 참조).
사용 시 Dataproc 클러스터의 Compute Engine 요금을 낮출 수 있습니다.발생한 요금
다음 Dataproc 작업 및 시나리오에서는 요금이 발생합니다.
확장 및 자동 확장: VM이 클러스터에 추가되면 VM이 활성 상태인 동안 요금이 발생합니다. 이러한 누적된 요금은 VM이 삭제될 때까지 계속 발생합니다.
오류 상태의 클러스터: Dataproc 클러스터가 오류 상태에 있으면 클러스터 VM이 활성 상태로 유지되고 요금이 계속 발생합니다. 이러한 누적된 요금은 클러스터가 삭제될 때까지 계속됩니다.
가격 책정 예시
예를 들어 다음과 같은 구성의 클러스터(마스터 및 워커 노드 사용)가 있다고 가정해 보겠습니다.
| 항목 | 머신 유형 | 가상 CPU | 연결된 영구 디스크 | 클러스터 번호 |
|---|---|---|---|---|
| 마스터 노드 | n1-standard-4 | 4 | 500GB | 1 |
| 워커 노드 | n1-standard-4 | 4 | 500GB | 5 |
이 Dataproc 클러스터에는 24개의 가상 CPU가 있습니다(마스터용으로 4개, 작업자 전반에 분산된 20개). Dataproc 청구를 위해 이 클러스터는 24개의 가상 CPU와 클러스터가 실행된 기간을 기준으로 가격이 책정됩니다(축소되거나 선점된 노드는 없다고 가정). 클러스터가 2시간 동안 실행되는 경우 Dataproc 가격에 적용되는 공식은 다음과 같습니다.
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
이 예시에서는 Dataproc 요금 외에 클러스터에서 Compute Engine 및 표준 영구 디스크 프로비저닝 공간에 대한 요금도 발생합니다 (기타 리소스 사용 참조). Google Cloud 청구 계산기를 사용하면 각 리소스 비용을 따로 확인할 수 있습니다. Google Cloud
기타 Google Cloud 리소스 사용
Dataproc은 관리형 통합 솔루션으로서 다른 Google Cloud 기술을 바탕으로 구축되었습니다. Dataproc 클러스터는 다음과 같은 리소스를 사용하며 각기 해당하는 가격에 따라 요금이 청구됩니다.
- Compute Engine - Dataproc 클러스터의 모든 Compute Engine 인스턴스는 최소 요금이 1분부터 시작되고 1초 단위로 요금이 부과되며 지속 사용 가격 규칙이 적용됩니다.
- 표준 영구 디스크 프로비저닝된 공간
- Cloud Monitoring— Google Cloud Observability 가격 책정 참고
원하는 경우 Dataproc 클러스터에서 다음을 포함한 여러 리소스를 활용할 수 있으며 각기 해당하는 가격에 따라 요금이 청구됩니다.
GKE 기반 Dataproc 가격 책정
이 섹션에서는 사용자 관리형 GKE에서 실행되는 가상 Dataproc 클러스터에만 적용되는 요금을 설명합니다. 사용자 관리형 GKE 클러스터에 적용되는 추가 요금에 대해 알아보려면 GKE 가격 책정을 참조하세요.
GKE 기반 Dataproc 가격 책정 공식인 $0.010 * # of vCPUs * hourly duration은 Compute Engine 기반 Dataproc 가격 책정 공식과 동일하며, 클러스터의 Dataproc에서 생성된 노드 풀에 있는 VM 인스턴스에서 실행되는 가상 CPU의 총 개수에 적용됩니다. 가상 머신 인스턴스의 수명은 인스턴스가 생성된 시점부터 삭제된 시점까지의 기간입니다. Compute Engine의 Dataproc과 마찬가지로 GKE의 Dataproc은 초 단위로 요금이 청구되며 가상 머신 인스턴스당 최소 1분 요금이 부과됩니다. Dataproc 요금 외에 기타 Google Cloud 요금
이 부과됩니다.
Dataproc 클러스터가 삭제된 후에도 Dataproc에서 생성된 노드 풀은 여러 클러스터에서 공유될 수 있으므로 계속 존재합니다. 노드 풀을 삭제하거나 노드 풀을 인스턴스 0개로 축소하면 Dataproc 요금이 계속 청구되지 않습니다. 남아 있는 노드 풀 VM은 삭제할 때까지 요금이 계속 청구됩니다.
Apache Spark용 서버리스 가격 책정
Apache Spark용 서버리스 가격 책정을 참조하세요.
다음 단계
- Dataproc 문서 읽어보기
- Dataproc 시작하기
- 가격 계산기 사용해 보기
- Dataproc 솔루션 및 사용 사례 알아보기