Compute Engine 인스턴스 프로비저닝 모델


이 문서에서는 Compute Engine 인스턴스의 프로비저닝 모델을 설명합니다. 배포 옵션에 대해 자세히 알아보려면 워크로드에 맞는 Compute Engine 배포 전략 선택을 참고하세요.

프로비저닝 모델은 인스턴스의 가용성, 수명, 가격을 결정합니다. 이러한 모델을 이해하면 워크로드에 가장 적합한 옵션을 선택할 수 있습니다.

사용 가능한 프로비저닝 모델

컴퓨팅 인스턴스를 만들 때 다음 프로비저닝 모델 중 하나를 지정할 수 있습니다. 프로비저닝 모델을 지정하지 않으면 Compute Engine에서 기본적으로 표준 프로비저닝 모델을 사용합니다.

다음 표를 통해 각 프로비저닝 모델의 사용 사례와 가격을 비교할 수 있습니다.

표준 스팟 flex-start(미리보기) 예약에 따름
요약
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • 리소스 가용성에 따라 인스턴스를 즉시 만들 수 있습니다.
  • 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다. 하지만 Compute Engine이 언제든지 인스턴스를 중지하거나 삭제하여 용량을 확보하도록 허용할 수도 있습니다.
  • 영역 관리형 인스턴스 그룹(MIG)을 만든 후 MIG에 GPU가 연결되어 있는 인스턴스를 추가하도록 Compute Engine에 요청합니다. Compute Engine은 리소스 가용성을 기반으로 인스턴스 프로비저닝을 예약합니다.
  • 인스턴스를 삭제할 시점을 제어할 수 있습니다. 하지만 중지하거나, 정지하거나, 다시 만들 수는 없습니다. 인스턴스는 최대 7일 동안 실행됩니다. 그런 다음 Compute Engine에서 자동으로 삭제합니다.
  • GPU 또는 TPU가 연결된 인스턴스를 만들기 위해 미래 날짜에 용량을 예약하도록 요청할 수 있습니다. Google Cloud 에서 요청을 승인하면 예약이 생성되고 지정된 날짜에 사용을 시작할 수 있습니다.
  • 승인된 예약 기간 동안 필요에 따라 인스턴스를 중지, 다시 시작, 삭제하거나 다시 만들어 예약을 사용할 수 있습니다. 예약 기간이 종료되면 Compute Engine은 예약을 자동으로 삭제하고 예약을 사용하는 인스턴스도 삭제합니다.
사용 사례 다음과 같이 안정성과 지속적인 작동이 필요한 워크로드에 적합합니다.
  • 웹 서버
  • 데이터베이스
  • 엔터프라이즈 애플리케이션
  • 개발 및 테스트
다음과 같이 중단을 허용할 수 있는 워크로드에 적합합니다.
  • 일괄 처리
  • 고성능 컴퓨팅(HPC)
  • 지속적 통합 및 지속적 배포(CI/CD)
  • 데이터 분석
  • 미디어 인코딩
  • 온라인 추론
다음과 같이 안정성이 필요하고 7일 이내로 실행해야 하는 워크로드에 적합합니다.
  • 소규모 모델 사전 학습
  • 모델 미세 조정
  • HPC 시뮬레이션
  • 일괄 추론
다음과 같이 안정성과 특정 실행 시간이 필요한 워크로드에 적합합니다.
  • 최대 90일 동안 지속되는 워크로드:
    • 모델 사전 학습 작업
    • 모델 미세 조정 작업
    • HPC 시뮬레이션 워크로드
    • 추론 워크로드의 단기 증가 예상
  • 90일 넘게 지속되는 워크로드:
    • 학습 워크로드
    • 추론 워크로드
가격 책정 인스턴스에는 표준 가격이 적용됩니다. 자세한 내용은 VM 인스턴스 가격 책정을 참조하세요. 대부분의 vCPU, GPU, 로컬 SSD는 60~91% 할인된 가격으로 제공됩니다. 자세한 내용은 스팟 VM 가격 책정을 참고하세요. 인스턴스에서 사용하는 머신 계열 또는 TPU 버전에 따라 vCPU, GPU, TPU에 최대 53% 할인이 적용됩니다. 동적 워크로드 스케줄러(DWS) 가격 책정을 참고하세요. 인스턴스에서 사용하는 머신 계열에 따라 vCPU 및 GPU에 최대 53% 할인이 적용됩니다. 자세한 내용은 가속기 최적화 VM 가격 책정을 참고하세요.
할당량 인스턴스를 만들면 표준 할당량이 사용됩니다. 인스턴스를 만들면 선점형 할당량이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. 스팟 VM에는 Google Cloud 무료 등급 크레딧이 적용되지 않습니다. MIG가 그룹에 인스턴스를 추가하면 선점형 할당량이 사용됩니다. 프로젝트에 선점형 할당량이 없으면 표준 할당량이 사용됩니다. '예약에 따름' 프로비저닝 모델에는 할당량이 적용되지 않습니다.

인스턴스 가용성 및 수명

다음 표에는 각 프로비저닝 모델의 컴퓨팅 인스턴스 가용성 및 수명이 나와 있습니다.

표준 스팟 flex-start(미리보기) 예약에 따름
생성 기본 요건 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다. 생성 기본 요건이 없습니다. 인스턴스를 만들려면 먼저 여러 블록에 대한 미래용 예약 요청을 만들어 용량을 예약해야 합니다. 지정된 날짜와 시간에 Compute Engine이 요청된 용량을 프로비저닝합니다. 그러면 인스턴스를 만들어 사용을 시작할 수 있습니다.
지원되는 머신 시리즈 A4 및 A3 Ultra를 제외한 모든 머신 시리즈를 사용할 수 있습니다. 다음 머신 시리즈를 제외한 모든 머신 시리즈를 사용할 수 있습니다.
  • M2 및 M3
  • 베어메탈 인스턴스
다음 머신 시리즈만 사용할 수 있습니다.
VM을 만들기 위해 용량을 예약하는 방식에 따라 다음 머신 시리즈만 사용할 수 있습니다.
인스턴스 가용성 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다. 요청한 리소스를 사용할 수 있는 한 언제든지 인스턴스를 만들 수 있습니다. MIG에서 크기 조절 요청을 만들어야만 인스턴스를 만들 수 있습니다. Compute Engine은 DWS를 사용하여 리소스 가용성을 기반으로 요청된 용량의 프로비저닝을 예약합니다. DWS는 GPU와 같이 수요가 많은 리소스를 확보하는 데 도움이 됩니다. 미래 날짜의 용량을 예약한 후에만 인스턴스를 만들 수 있습니다. Compute Engine은 요청된 날짜에 요청된 용량을 제공하며, 이 용량을 사용하여 인스턴스를 만들 수 있습니다. TPU를 예약하면 Compute Engine에서 DWS를 사용하여 요청된 용량을 프로비저닝합니다. DWS는 TPU와 같이 수요가 많은 리소스를 확보할 수 있도록 지원합니다.
인스턴스 수명 다음 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • 인스턴스에서 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않으면 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.
다음 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • Compute Engine은 언제든지 인스턴스를 중지하거나 삭제하여 용량을 확보할 수 있습니다. 이 프로세스를 선점이라고 합니다.
  • 인스턴스에서 사용하는 머신 유형이 라이브 마이그레이션을 지원하지 않으면 Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.
프로비저닝된 인스턴스는 선택한 실행 기간 동안 실행됩니다(최대 7일까지). 인스턴스를 중지하거나, 정지하거나, 다시 만들 수는 없습니다.

다음과 같은 상황 중 하나가 발생하면 Compute Engine에서 인스턴스를 삭제합니다.
  • 사용자가 인스턴스 삭제를 요청합니다.
  • 인스턴스의 실행 기간 종료일이 되었습니다.
다음 경우를 제외하고 인스턴스를 중지하거나 삭제할 시점을 제어할 수 있습니다.
  • Compute Engine은 호스트 유지보수 이벤트 중에 인스턴스를 중지합니다.
  • 요청된 용량을 프로비저닝하기 위해 자동으로 생성된 예약의 약정된 종료일이 도래했습니다. 이때 Compute Engine은 예약과 예약을 사용하는 인스턴스를 자동으로 삭제합니다.
  • 드물지만 호스트 오류로 인해 인스턴스가 중지될 수 있습니다.

다음 단계