일괄 생성 프로세스를 사용하여 그래픽 처리 장치(GPU)를 연결한 가상 머신(VM) 그룹을 만들 수 있습니다. 일괄 생성 프로세스를 사용하면 요청이 불가능한 경우 요청이 빠르게 실패하는 사전 검증을 받을 수 있습니다. 또한 지역 플래그를 사용하면 대량 생성 API가 요청을 처리할 수 있는 용량이 있는 영역을 자동으로 선택합니다. 일괄 생성에 관한 자세한 내용은 VM 일괄 생성 정보를 참고하세요.
시작하기 전에
- OS 이미지 선택 및 GPU 할당량 확인과 같은 추가적인 기본 요건 단계를 검토하려면 개요 문서를 검토하세요.
-
아직 인증을 설정하지 않았다면 설정합니다.
인증은 Google Cloud 서비스 및 API에 액세스하기 위해 ID를 확인하는 프로세스입니다.
로컬 개발 환경에서 코드 또는 샘플을 실행하려면 다음 옵션 중 하나를 선택하여 Compute Engine에 인증하면 됩니다.
Select the tab for how you plan to use the samples on this page:
gcloud
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
- 프로젝트에 대한
compute.instances.create
권한 -
커스텀 이미지를 사용하여 VM 만들기: 이미지에 대한
compute.images.useReadOnly
권한 -
스냅샷을 사용하여 VM 만들기: 스냅샷에 대한
compute.snapshots.useReadOnly
권한 -
인스턴스 템플릿을 사용하여 VM 만들기: 인스턴스 템플릿에 대한
compute.instanceTemplates.useReadOnly
권한 -
VM에 레거시 네트워크 할당: 프로젝트에 대한
compute.networks.use
권한 -
VM의 고정 IP 주소 지정: 프로젝트에 대한
compute.addresses.use
권한 -
레거시 네트워크 사용 시 VM에 외부 IP 주소 할당: 프로젝트에 대한
compute.networks.useExternalIp
권한 -
VM의 서브넷 지정: 프로젝트 또는 선택한 서브넷에 대한
compute.subnetworks.use
권한 -
VPC 네트워크를 사용할 때 VM에 외부 IP 주소 할당: 프로젝트 또는 선택한 서브넷에 대한
compute.subnetworks.useExternalIp
권한 -
VM에 VM 인스턴스 메타데이터 설정: 프로젝트에 대한
compute.instances.setMetadata
권한 -
VM에 태그 설정: VM에 대한
compute.instances.setTags
권한 -
VM에 라벨 설정: VM에 대한
compute.instances.setLabels
권한 -
VM에 사용할 서비스 계정 설정: VM에 대한
compute.instances.setServiceAccount
권한 -
VM의 새 디스크 만들기: 프로젝트에 대한
compute.disks.create
권한 -
기존 디스크를 읽기 전용 또는 읽기-쓰기 모드로 연결: 디스크에 대한
compute.disks.use
권한 -
기존 디스크를 읽기 전용 모드로 연결: 디스크에 대한
compute.disks.useReadOnly
권한 - A3 가속기 최적화 머신 유형의 경우 NVIDIA H100 80GB GPU가 연결됩니다. 다음과 같은 옵션으로 제공됩니다.
- A3 Mega: 이 머신 유형에는 H100 80GB GPU가 연결됩니다.
- A3 High: 이 머신 유형에는 H100 80GB GPU가 연결됩니다.
- A3 Edge: 이 머신 유형에는 H100 80GB GPU가 연결됩니다.
- A2 가속기 최적화 머신 유형의 경우 NVIDIA A100 GPU가 연결됩니다. 다음과 같은 옵션으로 제공됩니다.
- A2 Ultra: 이 머신 유형에는 A100 80GB GPU가 연결됩니다.
- A2 Standard: 이 머신 유형에는 A100 40GB GPU가 연결됩니다.
- G2 가속기 최적화 머신 유형의 경우 NVIDIA L4 GPU가 연결됩니다.
--provisioning-model=SPOT
은 VM을 스팟 VM으로 구성하는 선택적 플래그입니다. 워크로드가 내결함성이 있고 잠재적인 VM 선점을 견딜 수 있는 경우 스팟 VM을 사용하여 VM 및 연결된 GPU의 비용을 줄이는 것이 좋습니다. 자세한 내용은 스팟 VM의 GPU를 참조하세요. 스팟 VM의 경우 자동 재시작 및 호스트 유지보수 옵션 플래그가 사용 중지됩니다.--accelerator
플래그를 사용하여 가상 워크스테이션을 지정합니다. NVIDIA RTX 가상 워크스테이션(vWS)은 G2 VM에서만 지원됩니다.- VM 이름:
my-test-vm-1
,my-test-vm-2
- 각 VM에는 적절한 가속기 최적화 머신 유형을 사용하여 지정된 GPU 2개가 연결되어 있습니다.
REGION
: VM의 리전입니다. 이 리전은 선택한 GPU 모델을 지원해야 합니다.MACHINE_TYPE
: 선택한 머신 유형입니다. 다음 중 하나를 선택하세요.IMAGE
: GPU를 지원하는 운영체제 이미지입니다.이미지 계열에서 최신 이미지를 사용하려면
--image
플래그를--image-family
플래그로 바꾸고 GPU를 지원하는 이미지 계열로 값을 설정합니다. 예를 들면 다음과 같습니다.--image-family=rocky-linux-8-optimized-gcp
.커스텀 이미지 또는 Deep Learning VM Image를 지정할 수도 있습니다.
IMAGE_PROJECT
: OS 이미지가 속한 Compute Engine 이미지 프로젝트입니다. 커스텀 이미지 또는 Deep Learning VM Image를 사용하는 경우 해당 이미지가 속하는 프로젝트를 지정합니다.VWS_ACCELERATOR_COUNT
: 필요한 가상 GPU 수- VM 이름:
my-test-vm-1
,my-test-vm-2
각 VM에는 적절한 가속기 최적화 머신 유형을 사용하여 지정된 GPU 2개가 연결되어 있습니다.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instances/bulkInsert { "namePattern":"my-test-vm-#", "count":"2", "instanceProperties": { "machineType":MACHINE_TYPE, "disks":[ { "type":"PERSISTENT", "initializeParams":{ "diskSizeGb":"200", "sourceImage":SOURCE_IMAGE_URI }, "boot":true } ], "name": "default", "networkInterfaces": [ { "network": "projects/PROJECT_ID/global/networks/default" } ], "scheduling":{ "onHostMaintenance":"TERMINATE", ["automaticRestart":true] } } }
PROJECT_ID
: 프로젝트 ID입니다.REGION
: VM의 리전입니다. 이 리전은 선택한 GPU 모델을 지원해야 합니다.MACHINE_TYPE
: 선택한 머신 유형입니다. 다음 중 하나를 선택하세요.SOURCE_IMAGE_URI
: 사용할 특정 이미지나 이미지 계열의 URI입니다.예를 들면 다음과 같습니다.
- 특정 이미지:
"sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- 이미지 계열:
"sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp"
이미지 계열을 지정하면 Compute Engine이 해당 계열의 지원 중단되지 않은 최신 OS 이미지에서 VM을 만듭니다. 이미지 계열을 사용할 시기에 대한 자세한 내용은 이미지 계열 권장사항을 참조하세요.
- 특정 이미지:
워크로드가 내결함성이 있고 잠재적인 VM 선점을 견딜 수 있는 경우 스팟 VM을 사용하여 VM 및 연결된 GPU의 비용을 줄이는 것이 좋습니다. 자세한 내용은 스팟 VM의 GPU를 참조하세요. 스팟 VM을 사용하려면 요청에
"provisioningModel": "SPOT
옵션을 추가합니다. 스팟 VM의 경우 자동 재시작 및 호스트 유지보수 옵션 플래그가 사용 중지됩니다."scheduling": { "provisioningModel": "SPOT" }
G2 VM에서는 NVIDIA RTX 가상 워크스테이션(vWS)이 지원됩니다. 가상 워크스테이션을 지정하려면 요청에
guestAccelerators
옵션을 추가하세요.VWS_ACCELERATOR_COUNT
를 필요한 가상 GPU 수로 바꿉니다."guestAccelerators": [ { "acceleratorCount": VWS_ACCELERATOR_COUNT, "acceleratorType": "projects/PROJECT_ID/zones/ZONEacceleratorTypes/nvidia-l4-vws" } ]
- A3 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A3 머신 유형을 사용할 수 있습니다.
- A3 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- A3 머신 계열은 Sapphire Rapids 플랫폼에서만 사용할 수 있습니다.
- VM에서 A3 머신 유형을 사용하는 경우에는 머신 유형을 변경할 수 없습니다. 머신 유형을 변경해야 하는 경우에는 새 VM을 만들어야 합니다.
- VM 머신 유형을 A3 머신 유형으로 변경할 수 없습니다. A3 머신 유형을 사용하는 VM이 필요하면 새 VM을 만들어야 합니다.
- A3 머신 유형은 단독 테넌시를 지원하지 않습니다.
- A3 머신 유형에서는 Windows 운영체제를 실행할 수 없습니다.
- 특정 예약을 통해서만 A3 머신 유형을 예약할 수 있습니다.
a3-highgpu-1g
,a3-highgpu-2g
,a3-highgpu-4g
머신 유형의 경우 다음과 같은 제한사항이 적용됩니다.-
이러한 머신 유형의 경우 스팟 VM을 사용하거나 MIG의 크기 조절 요청과 같이 동적 워크로드 스케줄러 (DWS)를 사용하는 기능을 사용해야 합니다. 이러한 옵션에 관한 자세한 안내는 다음을 검토하세요.
- Spot VM을 만들려면 가속기 최적화 VM 만들기를 참고하고 프로비저닝 모델을
SPOT
로 설정하세요. - 동적 워크로드 스케줄러를 사용하는 MIG에서 크기 조절 요청을 만들려면 GPU VM으로 MIG 만들기를 참고하세요.
- Spot VM을 만들려면 가속기 최적화 VM 만들기를 참고하고 프로비저닝 모델을
- 이러한 머신 유형에서는 하이퍼디스크 균형을 사용할 수 없습니다.
- 예약을 만들 수 없습니다.
-
이러한 머신 유형의 경우 스팟 VM을 사용하거나 MIG의 크기 조절 요청과 같이 동적 워크로드 스케줄러 (DWS)를 사용하는 기능을 사용해야 합니다. 이러한 옵션에 관한 자세한 안내는 다음을 검토하세요.
- A2 표준 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A2 표준 머신 유형을 사용할 수 있습니다.
- A2 표준 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 A2 표준 머신 유형을 사용할 수 있습니다.
- VM에서 A2 표준 머신 유형을 사용하는 경우 한 A2 표준 머신 유형에서 다른 A2 표준 머신 유형으로만 전환할 수 있습니다. 그 밖의 다른 머신 유형으로는 변경할 수 없습니다. 자세한 내용은 가속기 최적화 VM 수정을 참조하세요.
- <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 표준 머신 유형에서는 Windows 운영체제를 사용할 수 없습니다. Windows 운영체제를 사용하는 경우 다른 A2 표준 머신 유형을 선택합니다.</codea2-megagpu-16g<>
- A2 표준 머신 유형을 사용하는 Windows VM에서는 연결된 로컬 SSD를 빠르게 포맷할 수 없습니다. 이러한 로컬 SSD를 포맷하려면 diskpart 유틸리티를 사용하고
format fs=ntfs label=tmpfs
를 지정하여 전체 포맷을 수행해야 합니다. - A2 표준 머신 유형은 단독 테넌시를 지원하지 않습니다.
- A2 울트라 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 A2 울트라 머신 유형을 사용할 수 있습니다.
- A2 울트라 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 A2 울트라 머신 유형을 사용할 수 있습니다.
- VM에서 A2 울트라 머신 유형을 사용하는 경우에는 머신 유형을 변경할 수 없습니다. 다른 A2 울트라 머신 유형이나 그 밖의 다른 머신 유형을 사용해야 하는 경우에는 새 VM을 만들어야 합니다.
- 다른 머신 유형을 A2 울트라 머신 유형으로 변경할 수 없습니다. A2 울트라 머신 유형을 사용하는 VM이 필요하면 새 VM을 만들어야 합니다.
- A2 울트라 머신 유형을 사용하는 Windows VM에서는 연결된 로컬 SSD를 빠르게 포맷할 수 없습니다. 이러한 로컬 SSD를 포맷하려면 diskpart 유틸리티를 사용하고
format fs=ntfs label=tmpfs
를 지정하여 전체 포맷을 수행해야 합니다. - G2 머신 유형을 사용하는 VM에는 지속 사용 할인 및 가변형 약정 사용 할인이 적용되지 않습니다.
- 특정 리전과 영역에서만 G2 머신 유형을 사용할 수 있습니다.
- G2 머신 유형을 사용하는 VM에서는 리전 영구 디스크를 사용할 수 없습니다.
- Cascade Lake 플랫폼에서만 G2 머신 유형을 사용할 수 있습니다.
- G2 표준 머신 유형을 사용하는 VM에서는 표준 영구 디스크(
pd-standard
)가 지원되지 않습니다. 지원되는 디스크 유형은 G2에 지원되는 디스크 유형을 참조하세요. - G2 머신 유형에서 멀티 인스턴스 GPU를 만들 수 없습니다.
- G2 VM 머신 유형을 변경해야 하는 경우 가속기 최적화 VM 수정을 참조하세요.
- Deep Learning VM Image를 G2 머신 유형을 사용하는 VM의 부팅 디스크로 사용할 수 없습니다.
- 현재 Container-Optimized OS의 기본 드라이버는 G2 머신 유형에서 실행되는 L4 GPU를 지원하지 않습니다. Container-Optimized OS는 선택한 드라이버 세트만 지원합니다.
G2 머신 유형에서 Container-Optimized OS를 사용하려면 다음 참고를 검토하세요.
- 권장되는 최소 NVIDIA 드라이버 버전
525.60.13
이상을 지원하는 Container-Optimized OS 버전을 사용합니다. 자세한 내용은 Container-Optimized OS 출시 노트를 참조하세요. - 드라이버 설치 시 L4 GPU에서 작동하는 최신 버전을 지정합니다.
예를 들면
sudo cos-extensions install gpu -- -version=525.60.13
입니다.
- 권장되는 최소 NVIDIA 드라이버 버전
- 다음 시나리오의 경우 G2 VM을 만들려면 Google Cloud CLI 또는 REST를 사용해야 합니다.
- 커스텀 메모리 값을 지정하려고 하는 경우
- 표시되는 CPU 코어 수를 맞춤설정하려고 하는 경우
- NVIDIA T4:
nvidia-tesla-t4
- NVIDIA P4:
nvidia-tesla-p4
- NVIDIA P100:
nvidia-tesla-p100
- NVIDIA V100:
nvidia-tesla-v100
- NVIDIA T4 가상 스테이션:
nvidia-tesla-t4-vws
- NVIDIA P4 가상 워크스테이션:
nvidia-tesla-p4-vws
NVIDIA P100 가상 워크스테이션:
nvidia-tesla-p100-vws
이러한 가상 워크스테이션의 경우 NVIDIA RTX 가상 워크스테이션(vWS) 라이선스가 VM에 자동으로 추가됩니다.
- VM 이름:
my-test-vm-1
,my-test-vm-2
- GPU를 지원하는
us-central1
의 모든 영역에서 생성된 VM - 각 VM에는 가속기 유형 및 가속기 수 플래그를 사용하여 지정된 2개의 T4 GPU가 연결되어 있습니다.
- 각 VM에 GPU 드라이버가 설치되어 있음
- 각 VM에는 Deep Learning VM Image
pytorch-latest-gpu-v20211028-debian-10
가 사용됩니다. - VM 이름:
my-test-vm-1
,my-test-vm-2
- GPU를 지원하는
us-central1
의 모든 영역에서 생성된 VM - 각 VM에는 가속기 유형 및 가속기 수 플래그를 사용하여 지정된 2개의 T4 GPU가 연결되어 있습니다.
- 각 VM에 GPU 드라이버가 설치되어 있음
- 각 VM에는 Deep Learning VM Image
pytorch-latest-gpu-v20211028-debian-10
가 사용됩니다. GPU 성능 모니터링 방법 알아보기
더 높은 네트워크 대역폭을 사용하는 방법 알아보기
GPU 호스트 유지보수 이벤트를 처리하는 방법 알아보기
- VM 및 GPU의 실제 및 예상 사용량을 확인하는 방법 알아보기
REST
로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참고하세요.
필요한 역할
VM을 만드는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Compute 인스턴스 관리자(v1)(
roles/compute.instanceAdmin.v1
) IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.이 사전 정의된 역할에는 VM을 만드는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.
필수 권한
VM을 만들려면 다음 권한이 필요합니다.
커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.
개요
일괄 생성 메서드를 사용하여 GPU가 연결된 VM을 만들 때 리전(예:
us-central1
) 또는 특정 영역(예:us-central1-a
)에 VM을 만들 수 있습니다.리전을 지정하면 Compute Engine은 GPU를 지원하는 리전 내의 영역에 VM을 배치합니다.
가속기 최적화 VM 그룹 만들기
가속기 최적화 머신 계열에는 여러 머신 유형이 포함됩니다.
각 가속기 최적화 머신 유형에는 특정 NVIDIA GPU 모델이 연결되어 있습니다.
Google Cloud CLI 또는 REST를 사용하여 가속기 최적화 VM 그룹을 만듭니다.
gcloud
VM 그룹을 만들려면
gcloud compute instances bulk create
명령어를 사용합니다. 매개변수와 이 명령어를 사용하는 방법에 대한 자세한 내용은 VM 일괄 생성을 참고하세요.예시 명령어에 다음과 같은 선택적 플래그가 표시됩니다.
예시
다음 예에서는 다음 사양을 사용하여 GPU가 연결된 2개의 VM을 만듭니다.
gcloud compute instances bulk create \ --name-pattern="my-test-vm-#" \ --region=REGION \ --count=2 \ --machine-type=MACHINE_TYPE \ --boot-disk-size=200 \ --image=IMAGE \ --image-project=IMAGE_PROJECT \ --on-host-maintenance=TERMINATE \ [--provisioning-model=SPOT] \ [--accelerator=type=nvidia-l4-vws,count=VWS_ACCELERATOR_COUNT]
다음을 바꿉니다.
성공하면 출력은 다음과 비슷합니다.
NAME ZONE my-test-vm-1 us-central1-b my-test-vm-2 us-central1-b Bulk create request finished with status message: [VM instances created: 2, failed: 0.]
REST
한 영역에 여러 VM을 만들려면 필수 매개변수와 함께
instances.bulkInsert
메서드를 사용하세요. 매개변수와 이 명령어를 사용하는 방법에 대한 자세한 내용은 VM 일괄 생성을 참고하세요.예시
다음 예에서는 다음 사양을 사용하여 GPU가 연결된 2개의 VM을 만듭니다.
다음을 바꿉니다.
추가 설정:
제한사항
A3 VM
A3 Edge, A3 High, A3 Mega 머신 유형을 사용하는 VM에는 다음 제한사항이 적용됩니다.
A2 표준 VM
A2 울트라 VM
G2 VM
N1 범용 VM 그룹 만들기
Google Cloud CLI 또는 REST를 사용하여 GPU가 연결된 VM 그룹을 만듭니다.
이 섹션에서는 다음 GPU 유형을 사용하여 여러 VM을 만드는 방법을 설명합니다.
NVIDIA GPU:
NVIDIA RTX 가상 워크스테이션(vWS)(이전의 NVIDIA GRID):
gcloud
VM 그룹을 만들려면
gcloud compute instances bulk create
명령어를 사용합니다. 매개변수와 이 명령어를 사용하는 방법에 대한 자세한 내용은 VM 일괄 생성을 참고하세요.예시
다음 예시에서는 다음 사양을 사용하여 GPU가 연결된 2개의 VM을 만듭니다.
gcloud compute instances bulk create \ --name-pattern="my-test-vm-#" \ --count=2 \ --region=us-central1 \ --machine-type=n1-standard-2 \ --accelerator type=nvidia-tesla-t4,count=2 \ --boot-disk-size=200 \ --metadata="install-nvidia-driver=True" \ --scopes="https://www.googleapis.com/auth/cloud-platform" \ --image=pytorch-latest-gpu-v20211028-debian-10 \ --image-project=deeplearning-platform-release \ --on-host-maintenance=TERMINATE --restart-on-failure
성공하면 출력은 다음과 비슷합니다.
NAME ZONE my-test-vm-1 us-central1-b my-test-vm-2 us-central1-b Bulk create request finished with status message: [VM instances created: 2, failed: 0.]
REST
한 영역에 여러 VM을 만들려면 필수 매개변수와 함께
instances.bulkInsert
메서드를 사용하세요. 매개변수와 이 명령어를 사용하는 방법에 대한 자세한 내용은 VM 일괄 생성을 참고하세요.예시
다음 예시에서는 다음 사양을 사용하여 GPU가 연결된 2개의 VM을 만듭니다.
PROJECT_ID
를 프로젝트 ID로 바꿉니다.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/region/us-central1/instances/bulkInsert { "namePattern":"my-test-vm-#", "count":"2", "instanceProperties": { "machineType":"n1-standard-2", "disks":[ { "type":"PERSISTENT", "initializeParams":{ "diskSizeGb":"200", "sourceImage":"projects/deeplearning-platform-release/global/images/pytorch-latest-gpu-v20211028-debian-10" }, "boot":true } ], "name": "default", "networkInterfaces": [ { "network": "projects/PROJECT_ID/global/networks/default" } ], "guestAccelerators": [ { "acceleratorCount": 2, "acceleratorType": "nvidia-tesla-t4" } ], "scheduling":{ "onHostMaintenance":"TERMINATE", "automaticRestart":true }, "metadata":{ "items":[ { "key":"install-nvidia-driver", "value":"True" } ] } } }
다음 단계
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-12-22(UTC)
-