사용 가능한 GPU

GPU는 워크로드를 가속화하는 데 사용되며 Cloud Workstations는 워크스테이션에 GPU 연결을 지원합니다. Cloud Workstations는 Compute Engine VM에 연결할 수 있는 다양한 GPU 모델을 지원합니다. 각 워크스테이션에 연결할 GPU 모델과 수량은 워크스테이션 구성에 지정됩니다. Cloud Workstations는 GPU 연결과 기기 드라이버 설치를 처리합니다.

GPU를 워크스테이션에 연결하면 Cloud Workstations 가격 책정 개요에 설명된 대로 비용이 영향을 받습니다.

제한사항

워크스테이션 구성은 다음 제한 사항에 따라 GPU를 지정할 수 있습니다.

Cloud Workstations는 N1 머신 계열 또는 A2 머신 계열에서 머신 유형을 지정하는 구성에만 GPU를 지원합니다. 자세한 내용은 지원되는 GPU 모델을 참조하세요.
구성에서 선택한 GPU 모델을 사용할 수 있는 복제본 영역을 지정해야 합니다.
한 번에 GPU 모델 2개 이상을 연결하도록 워크스테이션을 구성할 수 없습니다.

지원되는 GPU 모델

Cloud Workstations는 Compute Engine에서 사용할 수 있는 다양한 GPU 모델을 지원합니다. 지원되는 모델은 다음 표의 요약처럼 워크스테이션 구성에 선택된 머신 시리즈에 따라 다릅니다.

N1 머신 계열

N1 범용 머신 계열은 여러 GPU 모델을 지원하며 N1 머신 유형을 지정하는 워크스테이션 구성에서는 다음 GPU 모델 중 하나를 지정할 수도 있습니다. 선택한 GPU 모델에 대해 구성에서 각 워크스테이션에 연결할 GPU 카드 수를 지정할 수 있습니다.

GPU 모델	GPU 수
NVIDIA T4(`nvidia-tesla-t4`)	GPU 1개, 2개 또는 4개
NVIDIA P4(`nvidia-tesla-p4`)	GPU 1개, 2개 또는 4개
NVIDIA V100(`nvidia-tesla-v100`)	GPU 1개, 2개, 4개 또는 8개
NVIDIA P100(`nvidia-tesla-p100`)	GPU 1개, 2개 또는 4개

A2 머신 계열

A2 표준 가속기 최적화 머신 계열에는 선택한 머신 유형만을 기준으로 고정된 개수의 NVIDIA A100 GPU가 연결되어 있습니다.

다음 표에서는 머신 유형에서 연결할 카드 수로의 매핑을 보여줍니다.

GPU 모델	머신 유형	GPU 수
NVIDIA A100 40GB(`nvidia-tesla-a100`)	`a2-highgpu-1g`	GPU 1개
	`a2-highgpu-2g`	GPU 2개
	`a2-highgpu-4g`	GPU 4개
	`a2-highgpu-8g`	GPU 8개
	`a2-megagpu-16g`	GPU 16개

Cloud Workstations는 A2 울트라 머신 유형을 지원하지 않습니다.

기존 워크스테이션 구성에 GPU 추가

GPU를 워크스테이션 구성에 추가하려면 다음 탭 중 하나의 단계를 완료합니다.

시작하기 전에

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Install the Google Cloud CLI, then initialize it by running the following command:

gcloud init

Cloud Workstations 가격 책정 개요를 검토하여 GPU 구성이 비용에 미치는 영향을 알아봅니다. GPU는 구성의 빠른 시작 풀 크기에서 지정한 사전 시작된 가상 머신(VM)에 연결됩니다.

기존 구성 업데이트

콘솔

다음을 수행하여 Google Cloud 콘솔의 기존 워크스테이션 구성에서 GPU를 구성합니다.

Google Cloud 콘솔에서 워크스테이션 구성 페이지로 이동합니다.

워크스테이션 구성으로 이동
워크스테이션 구성 목록에서 GPU를 추가할 구성의 이름을 클릭합니다.
워크스테이션 구성 세부정보 페이지에서 수정 수정을 클릭합니다.
워크스테이션 구성 수정 페이지의 탐색 메뉴에서 머신 설정을 클릭합니다.
전환 버튼을 클릭하여 범용 머신 계열 대신 GPU를 선택합니다.

GPU 유형 필드에서 사용하려는 GPU 모델을 선택합니다.

GPU 수 필드에서 각 워크스테이션에 연결할 GPU 카드 수를 선택합니다.

머신 유형 필드에서 사용할 머신 유형을 선택합니다.

참고: 각 필드 옵션은 구성에 선택한 복제본 영역과 해당 영역의 GPU 및 머신 유형 가용성에 따라 달라집니다. 이 구성의 복제본 영역에서 적합한 GPU를 찾을 수 없으면 대신 GPU를 사용하여 새 구성을 만들면 됩니다.
저장을 클릭하여 구성을 업데이트합니다.

gcloud

gcloud workstations configs update 명령어를 실행하여 기존 워크스테이션 구성에서 GPU를 구성합니다.

하지만 먼저 사용 가능한 GPU 모델을 확인하고 구성에 적합한 GPU 모델을 선택하기 위해 몇 가지 정보를 수집합니다.

다음 gcloud CLI 명령어를 실행하여 구성에서 지정하는 복제본 영역을 확인합니다.
```
gcloud workstations configs describe \
  --format="table(name.scope(workstationConfigs),replicaZones.list())" \
  --project=PROJECT_ID \
  --region=LOCATION \
  --cluster=WORKSTATION_CLUSTER_ID \
  WORKSTATION_CONFIG_ID
```
다음을 바꿉니다.
- PROJECT_ID: 워크스테이션 구성이 포함된 프로젝트의 ID입니다.
- LOCATION: 워크스테이션 클러스터의 위치입니다.
- WORKSTATION_CLUSTER_ID: 워크스테이션 구성이 포함된 이름 워크스테이션 클러스터입니다.
- WORKSTATION_CONFIG_ID: 워크스테이션 구성의 이름입니다.
gcloud compute accelerator-types list 명령어를 실행하여 구성 복제본 영역 모두에서 사용할 수 있는 지원되는 GPU 모델을 선택합니다.
```
gcloud compute accelerator-types list \
  --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
  --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
  --project=PROJECT_ID
```
ZONES를 이전 단계에서 결정한 쉼표로 구분된 복제본 영역 목록으로 바꿉니다(예: us-central1-a,us-central1-c).

표에 두 번 나열된 GPU 모델을 선택합니다. 이는 두 복제본 영역에서 사용할 수 있음을 나타냅니다.

선택한 GPU 모델에 연결할 수 있는 최대 카드 수를 기록해 둡니다.

참고: 이 구성의 복제본 영역에 적합한 GPU 가용성이 없으면 대신 GPU를 사용하여 새 구성을 만들면 됩니다.
gcloud compute machine-types list 명령어를 사용하여 구성 복제본 영역 모두에서 사용할 수 있는 지원되는 머신 유형을 결정합니다.
1. 이전 단계에서 NVIDIA A100 40GB GPU 모델을 선택한 경우 구성에서 A2 머신 계열을 사용해야 합니다.
```
gcloud compute machine-types list \
  --format="table(name,zone,guestCpus:sort=1)" \
  --filter="name:a2-highgpu- OR name:a2-megagpu-" \
  --zones=ZONES \
  --project=PROJECT_ID
```
2. 이전 단계에서 다른 GPU 모델을 선택한 경우에는 구성에서 N1 머신 계열을 사용해야 합니다.
```
gcloud compute machine-types list \
  --format="table(name,zone,guestCpus:sort=1)" \
  --filter="name:n1-standard-" \
  --zones=ZONES \
  --project=PROJECT_ID
```
표에 두 번 나열된 머신 유형을 선택합니다. 이는 두 복제본 영역 모두에서 사용할 수 있음을 나타냅니다.
GPU 모델과 호환되는 머신 유형을 선택했습니다. 이제 구성을 업데이트합니다.
1. NVIDIA A100 40GB GPU의 경우 이 명령어를 실행하여 구성을 업데이트합니다.
```
gcloud beta workstations configs update \
  --project=PROJECT_ID \
  --region=LOCATION \
  --cluster=WORKSTATION_CLUSTER_ID \
  WORKSTATION_CONFIG_ID \
  --machine-type=A2_MACHINE_TYPE
```
  A2_MACHINE_TYPE을 이전 단계에서 결정한 선택한 A2 머신 유형으로 바꿉니다(예: a2-highgpu-1g).
  
  참고: A2 머신 계열의 경우 GPU 모델과 수량은 머신 유형에 따라 고정되어 있으므로 --accelerator-type 및 --accelerator-count 플래그를 생략할 수 있습니다.
2. 다른 모든 GPU 모델의 경우 다음 명령어를 실행합니다.
```
gcloud beta workstations configs update \
  --project=PROJECT_ID \
  --region=LOCATION \
  --cluster=WORKSTATION_CLUSTER_ID \
  WORKSTATION_CONFIG_ID \
  --machine-type=N1_MACHINE_TYPE \
  --accelerator-type=ACCELERATOR_TYPE \
  --accelerator-count=ACCELERATOR_COUNT
```
  다음을 바꿉니다.
  - N1_MACHINE_TYPE: N1 계열에서 선택한 머신 유형입니다(예: n1-standard-2).
  - ACCELERATOR_TYPE: 선택한 GPU 모델 이름입니다(예: nvidia-tesla-t4).
  - ACCELERATOR_COUNT: 각 워크스테이션에 연결할 GPU 수입니다(예: 1, 2, 4). GPU 모델의 최댓값보다 작은 2의 거듭제곱이어야 합니다.

GPU가 포함된 새 워크스테이션 구성 만들기

이를 기반으로 하는 워크스테이션에 GPU를 연결하는 새 워크스테이션 구성을 만들려면 다음 탭 중 하나의 단계를 완료합니다.

시작하기 전에

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Install the Google Cloud CLI, then initialize it by running the following command:

gcloud init

REST

로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.

Install the Google Cloud CLI, then initialize it by running the following command:

gcloud init

자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참고하세요.

GPU 모델을 선택하고 GPU 가용성 표를 참조하여 선택한 GPU 모델을 최소 2개 이상 영역에서 이상 사용할 수 있는 리전을 선택합니다.

새 구성을 만들 수 있는 선택한 리전에 클러스터가 아직 없으면 리전에서 워크스테이션 클러스터 만들기 단계를 수행합니다.

새 구성 만들기

콘솔

다음을 수행하여 Google Cloud 콘솔에서 GPU를 사용하여 새 워크스테이션 구성을 만듭니다.

Google Cloud 콘솔에서 워크스테이션 구성 페이지로 이동합니다.

워크스테이션 구성으로 이동
워크스테이션 구성 페이지에서 add_box 만들기를 클릭합니다.
워크스테이션 구성 만들기 페이지의 기본 정보 단계에서 이름 필드에 구성 이름을 지정합니다.

워크스테이션 클러스터 필드에서 선택한 리전의 클러스터를 선택합니다.

팁: GPU는 빠른 시작 워크스테이션에도 연결됩니다. 사용 중지됨을 선택하여 비용을 절약할 수 있습니다.

계속을 클릭하여 머신 설정 단계로 이동합니다.
워크스테이션 구성 만들기 페이지의 머신 설정 단계에서 전환 버튼을 클릭하여 범용 머신 계열 대신 GPU를 선택합니다.
1. 그런 다음 영역 필드에서 선택한 GPU 모델을 사용할 수 있는 두 영역 옆에 있는 체크박스를 선택합니다(GPU 가용성 표 참조).
2. GPU 유형 필드에서 사용하려는 GPU 모델을 선택합니다.
3. GPU 수 필드에서 각 워크스테이션에 연결할 GPU 카드 수를 선택합니다.
4. 머신 유형 필드에서 호환되는 머신 유형을 선택합니다.
만들기를 클릭하여 새 워크스테이션 구성을 프로비저닝하기 전에 계속을 클릭하여 환경 설정과 IAM 정책을 구성합니다.

gcloud

gcloud workstations configs create 명령어를 실행하여 gcloud CLI로 GPU가 포함된 새 워크스테이션 구성을 만듭니다.

NVIDIA A100 40GB GPU의 경우 다음 명령어를 실행하여 구성을 만듭니다.
```
gcloud beta workstations configs create \
  --project=PROJECT_ID \
  --region=LOCATION \
  --cluster=WORKSTATION_CLUSTER_ID \
  WORKSTATION_CONFIG_ID \
  --replica-zones=REPLICA_ZONES \
  --machine-type=A2_MACHINE_TYPE
```
다음을 바꿉니다.
- PROJECT_ID: 새 워크스테이션 구성이 포함될 프로젝트의 ID입니다.
- LOCATION: 구성이 포함될 워크스테이션 클러스터의 위치입니다.
- WORKSTATION_CLUSTER_ID: 새 워크스테이션 구성이 포함될 이름 워크스테이션 클러스터입니다.
- WORKSTATION_CONFIG_ID: 새 워크스테이션 구성 이름입니다.
- REPLICA_ZONES: 선택한 GPU 모델을 사용할 수 있는 클러스터 리전에서 정확히 영역 2개입니다(예: us-central1-a,us-central1-c).
- A2_MACHINE_TYPE: 선택한 A2 계열 머신 유형입니다(예: a2-highgpu-1g).
참고: A2 머신 계열의 경우 GPU 모델과 수량은 머신 유형에 따라 고정되어 있으므로 --accelerator-type 및 --accelerator-count 플래그를 생략할 수 있습니다.
다른 모든 GPU 모델의 경우 다음 명령어를 실행하여 구성을 만듭니다.
```
gcloud beta workstations configs create \
  --project=PROJECT_ID \
  --region=LOCATION \
  --cluster=WORKSTATION_CLUSTER_ID \
  WORKSTATION_CONFIG_ID \
  --replica-zones=REPLICA_ZONES \
  --machine-type=N1_MACHINE_TYPE \
  --accelerator-type=ACCELERATOR_TYPE \
  --accelerator-count=ACCELERATOR_COUNT
```
다음을 바꿉니다.
- PROJECT_ID: 새 워크스테이션 구성이 포함될 프로젝트의 ID입니다.
- LOCATION: 구성이 포함될 워크스테이션 클러스터의 위치입니다.
- WORKSTATION_CLUSTER_ID: 새 워크스테이션 구성이 포함될 이름 워크스테이션 클러스터입니다.
- WORKSTATION_CONFIG_ID: 새 워크스테이션 구성 이름입니다.
- REPLICA_ZONES: 선택한 GPU 모델을 사용할 수 있는 클러스터 리전에서 정확히 영역 2개입니다(예: us-central1-a,us-central1-c).
- N1_MACHINE_TYPE: 선택한 N1 계열 머신 유형입니다(예: n1-standard-2).
- ACCELERATOR_TYPE: 선택한 GPU 모델 이름입니다(예: nvidia-tesla-t4).
- ACCELERATOR_COUNT: 각 워크스테이션에 연결할 GPU 수입니다(예: 1, 2, 4).

NVIDIA GPU 기기 드라이버

Cloud Workstations는 VM 시작 중에 워크스테이션의 호스트 VM에 NVIDIA 기기 드라이버를 설치합니다.

워크스테이션에 설치된 기기 드라이버 버전을 확인하려면 다음 명령어를 실행합니다.

nvidia-smi --query-gpu=name,driver_version --format=csv

리전 및 영역별 GPU 가용성

위치 또는 GPU 모델별로 검색하거나 둘을 조합하여 검색할 수 있습니다.

영역	위치	GPU 플랫폼
`asia-east1-a`	아시아 태평양 타이완 창후아 현	T4, P100
`asia-east1-b`	아시아 태평양 타이완 창후아 현
`asia-east1-c`	아시아 태평양 타이완 창후아 현	T4, V100, P100
`asia-east2-a`	아시아 태평양 홍콩	T4
`asia-east2-b`	아시아 태평양 홍콩
`asia-east2-c`	아시아 태평양 홍콩	T4
`asia-northeast1-a`	아시아 태평양 일본 도쿄	A100 40GB, T4
`asia-northeast1-b`	아시아 태평양 일본 도쿄
`asia-northeast1-c`	아시아 태평양 일본 도쿄	A100 40GB, T4
`asia-northeast3-a`	아시아 태평양 대한민국 서울	A100 40GB
`asia-northeast3-b`	아시아 태평양 대한민국 서울	A100 40GB, T4
`asia-northeast3-c`	아시아 태평양 대한민국 서울	T4
`asia-south1-a`	아시아 태평양 인도 뭄바이	T4
`asia-south1-b`	아시아 태평양 인도 뭄바이	T4
`asia-south1-c`	아시아 태평양 인도 뭄바이	T4
`asia-southeast1-a`	아시아 태평양 싱가포르 주롱웨스트	T4
`asia-southeast1-b`	아시아 태평양 싱가포르 주롱웨스트	A100 40GB, T4, P4
`asia-southeast1-c`	아시아 태평양 싱가포르 주롱웨스트	A100 40GB, T4, P4
`australia-southeast1-a`	아시아 태평양 오스트레일리아 시드니	T4, P4
`australia-southeast1-b`	아시아 태평양 오스트레일리아 시드니	P4
`australia-southeast1-c`	아시아 태평양 오스트레일리아 시드니	T4, P100
`europe-north1-a` `europe-north1-b` `europe-north1-c`	유럽 핀란드 하미나
`europe-west1-b`	유럽 벨기에 셍기슬랑	T4, P100
`europe-west1-c`	유럽 벨기에 셍기슬랑	T4
`europe-west1-d`	유럽 벨기에 셍기슬랑	P100, T4
`europe-west2-a europe-west2-b`	유럽 잉글랜드 런던	T4
`europe-west2-c`	유럽 잉글랜드 런던
`europe-west3-a`	유럽 독일 프랑크푸르트
`europe-west3-b`	유럽 독일 프랑크푸르트	T4
`europe-west3-c`	유럽 독일 프랑크푸르트
`europe-west4-a`	유럽 네덜란드 엠스하벤	A100 40GB, T4, V100, P100
`europe-west4-b`	유럽 네덜란드 엠스하벤	A100 40GB, T4, P4, V100
`europe-west4-c`	유럽 네덜란드 엠스하벤	T4, P4, V100
`europe-west6-a` `europe-west6-b` `europe-west6-c`	유럽 스위스 취리히
`europe-west8-a` `europe-west8-b` `europe-west8-c`	유럽 이탈리아 밀라노
`europe-west9-a` `europe-west9-b` `europe-west9-c`	유럽 프랑스 파리
`europe-west12-a` `europe-west12-b` `europe-west12-c`	유럽 이탈리아 토리노
`europe-southwest1-a` `europe-southwest1-b` `europe-southwest1-c`	유럽 스페인 마드리드
`me-west1-a`	중동 이스라엘 텔아비브
`me-west1-b`	중동 이스라엘 텔아비브	A100 40GB, T4
`me-west1-c`	중동 이스라엘 텔아비브	A100 40GB, T4
`northamerica-northeast1-a`	북미 퀘벡 몬트리올	P4
`northamerica-northeast1-b`	북미 퀘벡 몬트리올	P4
`northamerica-northeast1-c`	북미 퀘벡 몬트리올	T4, P4
`southamerica-east1-a`	남미 브라질 상파울루 오사스쿠	T4
`southamerica-east1-c`	남미 브라질 상파울루 오사스쿠	T4
`southamerica-west1-a` `southamerica-west1-b` `southamerica-west1-c`	남미 칠레 산티아고
`us-central1-a`	북미 아이오와 카운슬블러프즈	A100 40GB, T4, P4, V100
`us-central1-b`	북미 아이오와 카운슬블러프즈	A100 40GB, T4, V100
`us-central1-c`	북미 아이오와 카운슬블러프즈	A100 40GB, T4, P4, V100, P100
`us-central1-f`	북미 아이오와 카운슬블러프즈	A100 40GB, T4, V100, P100
`us-east1-b`	북미 사우스캐롤라이나 몽크스 코너	A100 40GB, P100
`us-east1-c`	북미 사우스캐롤라이나 몽크스 코너	T4, V100, P100
`us-east1-d`	북미 사우스캐롤라이나 몽크스 코너	T4
`us-east4-a` `us-east4-b` `us-east4-c`	북미 버지니아 애쉬번	T4, P4
`us-east5-a us-east5-b us-east5-c`	북미 오하이오 콜럼버스
`us-west1-a`	북미 오리건 댈러스	T4, V100, P100
`us-west1-b`	북미 오리건 댈러스	A100 40GB, T4, V100, P100
`us-west1-c`	북미 오리건 댈러스
`us-west4-a`	북미 네바다 라스베이거스	T4
`us-west4-b`	북미 네바다 라스베이거스	A100 40GB, T4
`us-west4-c`	북미 네바다 라스베이거스

다음 단계

Cloud Workstations API를 사용하여 GPU 지정
GPU 가속기로 Compute Engine 인스턴스 실행 알아보기
Compute Engine 머신 유형의 전체 목록 참조하기