GPU 정보


그래픽 처리 장치(GPU)를 가상 머신(VM) 인스턴스에 연결하여 Compute Engine의 특정 워크로드를 가속화할 수 있습니다.

이 문서에서는 Compute Engine에서 실행되는 GPU의 기능과 제한사항에 대해 설명합니다.

GPU 및 머신 계열

GPU는 N1 범용 및 가속기 최적화(A3, A2, G2) 머신 시리즈에서 지원됩니다. N1 머신 유형을 사용하는 VM의 경우 VM 생성 중에 또는 이후에 VM에 GPU를 연결합니다. A3, A2 또는 G2 머신 유형을 사용하는 VM의 경우 VM을 만들 때 GPU가 자동으로 연결됩니다. GPU는 다른 머신 시리즈와 함께 사용할 수 없습니다.

가속기 최적화 머신 시리즈

가속기 최적화 머신 유형마다 특정 NVIDIA GPU 모델이 연결되어 있습니다.

  • A3 가속기 최적화 머신 유형의 경우 NVIDIA H100 80GB GPU가 연결됩니다.
  • A2 가속기 최적화 머신 유형의 경우 NVIDIA A100 GPU가 연결됩니다. A100 40GB 및 A100 80GB 옵션 모두에서 사용 가능합니다.
  • G2 가속기 최적화 머신 유형의 경우 NVIDIA L4 GPU가 연결됩니다.

자세한 내용은 가속기 최적화 머신 시리즈를 참조하세요.

N1 범용 머신 시리즈

다른 모든 GPU 유형에 N1 공유 코어를 제외한 대부분의 N1 머신 유형을 사용할 수 있습니다.

이 머신 계열에서는 사전 정의된 머신 유형이나 커스텀 머신 유형을 사용할 수 있습니다.

선점형 인스턴스의 GPU

GPU에 대하여 저렴한 Spot 가격으로 선점형 VM 인스턴스에 GPU를 추가할 수 있습니다. 선점형 인스턴스에 연결된 GPU는 일반 GPU처럼 작동하지만 인스턴스 수명 기간에만 지속됩니다. GPU가 있는 선점형 인스턴스는 모든 선점형 인스턴스와 같은 선점 절차를 따릅니다.

선점형 인스턴스에서 GPU에 사용할 전용 Preemptible GPU 할당량을 요청하는 것이 좋습니다. 자세한 내용은 선점형 VM 인스턴스 할당량을 참조하세요.

유지관리 이벤트 중에 GPU가 있는 선점형 인스턴스가 기본적으로 선점되며 자동으로 재시작할 수 없습니다. 선점한 인스턴스를 다시 만들고 싶다면 관리형 인스턴스 그룹을 사용하세요. 관리형 인스턴스 그룹은 vCPU, 메모리, GPU 리소스가 있는 경우 인스턴스를 다시 생성합니다.

인스턴스를 선점하기 전에 경고를 표시하거나 유지관리 이벤트 후 인스턴스가 자동으로 재시작하도록 구성하고 싶다면 GPU가 있는 표준 인스턴스를 사용하세요. GPU가 있는 표준 인스턴스의 경우 Google에서는 선점 1시간 전에 사전 통보를 보냅니다.

Compute Engine은 실행이 시작된 후 1분 내에 선점된 인스턴스에 대해서는 GPU 비용을 청구하지 않습니다.

표준 인스턴스를 자동으로 다시 시작하는 방법은 인스턴스 업데이트 옵션을 참조하세요.

GPU가 연결된 선점형 인스턴스를 만드는 방법은 GPU가 연결된 VM 만들기를 참조하세요.

GPU 및 컨피덴셜 VM

컨피덴셜 VM 인스턴스에는 GPU를 연결할 수 없습니다. 컨피덴셜 VM에 대한 자세한 내용은 컨피덴셜 컴퓨팅 개념을 참조하세요.

GPU 및 호스트 유지보수

GPU가 연결된 VM은 라이브 마이그레이션을 수행할 수 없으며 호스트 유지보수 이벤트 시 중지되어야 합니다. 이러한 유지보수 이벤트는 일반적으로 2주에 한 번 발생합니다. 필요한 경우 유지보수 이벤트가 더 자주 발생할 수도 있습니다. 유지보수 이벤트 처리 방법은 GPU 호스트 유지보수 이벤트 처리를 참조하세요.

GPU 및 블록 스토리지

GPU가 연결된 VM에 로컬 SSD를 추가할 수 있습니다. GPU 유형 및 리전별 로컬 SSD 지원 목록은 GPU 리전 및 영역별 로컬 SSD 가용성을 참조하세요.

GPU 가격 책정

GPU가 연결된 대부분의 VM에는 vCPU와 마찬가지로 지속 사용 할인이 적용됩니다. 가상 워크스테이션용 GPU를 선택하면 NVIDIA RTX 가상 워크스테이션 라이선스가 VM에 추가됩니다.

GPU의 시간별 및 월별 가격 책정은 GPU 가격 책정 페이지를 참조하세요.

약정 사용 할인으로 GPU 예약

특정 영역에서 GPU 리소스를 예약하려면 Compute Engine 영역 리소스 예약을 참조하세요.

특정 영역에서 GPU에 대한 약정 사용 할인을 받으려면 GPU의 리소스 기반 약정을 구매하고 일치하는 GPU를 지정하는 예약을 약정에 연결해야 합니다. 자세한 내용은 리소스 기반 약정에 예약 연결을 참조하세요.

GPU 제한사항

연결된 GPU가 있는 VM의 경우 다음 제한사항이 적용됩니다.

  • VM에서 NVIDIA K80 GPU를 사용하려는 경우 VM은 Intel Skylake 이상의 CPU 플랫폼을 사용할 수 없습니다.

  • GPU는 현재 범용 N1 또는 가속기 최적화(A3, A2, G2) 머신 유형에서만 지원됩니다.

  • Compute Engine 시스템과 사용자를 보호하기 위해 새 프로젝트에는 지원되는 모든 영역에서 생성할 수 있는 총 GPU 수를 제한하는 글로벌 GPU 할당량이 적용됩니다. GPU 할당량을 요청하는 경우 각 리전에 생성하려는 GPU 모델의 할당량 외에도 전 영역 내 모든 유형의 총 GPU에 적용할 전역 할당량을 추가로 요청해야 합니다.

  • 1개 이상의 GPU가 있는 VM에는 인스턴스에 추가하는 각 GPU에 대한 최대 개수의 vCPU가 포함됩니다. 예를 들어 인스턴스 머신 유형에서 각 NVIDIA K80 GPU마다 최대 8개의 vCPU와 최대 52GB의 메모리를 지정할 수 있습니다. 여러 GPU 구성에 따라 사용 가능한 vCPU 및 메모리 범위를 보려면 GPU 목록을 참조하세요.

  • GPU가 올바르게 작동하려면 기기 드라이버가 필요합니다. Compute Engine에서 실행되는 NVIDIA GPU는 최소 드라이버 버전을 사용해야 합니다. 드라이버 버전에 대한 상세 설명은 필요한 NVIDIA 드라이버 버전을 참조하세요.

  • 특정 GPU 모델이 연결된 VM의 경우 연결된 GPU 모델이 일반 안정화 버전으로 제공되고 동일한 리전의 두 개 이상의 영역에서 지원될 때만 Compute Engine SLA가 적용됩니다. 다음 영역에 있는 GPU 모델에는 Compute Engine SLA가 적용되지 않습니다.

    • NVIDIA H100 80GB:
      • us-east5-a
    • NVIDIA L4:
      • europe-west3-b
      • europe-west6-b
    • NVIDIA A100 80GB:
      • asia-southeast1-c
      • us-east4-c
      • us-east5-b
    • NVIDIA A100 40GB:
      • us-east1-b
      • us-west1-b
      • us-west3-b
      • us-west4-b
    • NVIDIA T4:
      • europe-west3-b
      • southamerica-east1-c
      • us-west3-b
    • NVIDIA V100:
      • asia-east1-c
      • us-east1-c
    • NVIDIA P100:
      • australia-southeast1-c
      • europe-west4-a
    • NVIDIA K80:
      • us-west1-b
  • Compute Engine은 GPU당 동시 사용자 1명의 실행을 지원합니다.

다음 단계