예약에 따름 모델을 사용하는 VM 만들기

이 문서에서는 예약 바운드 프로비저닝 모델을 사용하여 독립형 가상 머신 (VM) 인스턴스를 만드는 방법을 설명합니다. 이 프로비저닝 모델을 사용하면 사전 예약된 용량을 사용하여 A4X, A4 또는 A3 Ultra VM을 만들 수 있습니다.

예약에 따름 프로비저닝 모델을 사용하여 VM을 만드는 다른 방법은 AI 하이퍼컴퓨터 문서의 배포 옵션 개요를 참고하세요.

시작하기 전에

  • 아직 설정하지 않았다면 인증을 설정합니다. 인증은 Google Cloud 서비스 및 API에 액세스하기 위해 ID를 확인합니다. 로컬 개발 환경에서 코드 또는 샘플을 실행하려면 다음 옵션 중 하나를 선택하여 Compute Engine에 인증하면 됩니다.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Google Cloud CLI를 설치합니다. 설치 후 다음 명령어를 실행하여 Google Cloud CLI를 초기화합니다.

      gcloud init

      외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.

    2. Set a default region and zone.

    REST

    로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.

      Google Cloud CLI를 설치합니다. 설치 후 다음 명령어를 실행하여 Google Cloud CLI를 초기화합니다.

      gcloud init

      외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.

    자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참조하세요.

필요한 역할

예약 바인딩 프로비저닝 모델을 사용하여 VM을 만드는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Compute 인스턴스 관리자 (v1) (roles/compute.instanceAdmin.v1) IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

이 사전 정의된 역할에는 예약 바운드 프로비저닝 모델을 사용하여 VM을 만드는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

'예약에 따름' 프로비저닝 모델을 사용하여 VM을 만들려면 다음 권한이 필요합니다.

  • 프로젝트에 대한 compute.instances.create 권한
  • 커스텀 이미지를 사용하여 VM 만들기: 이미지에 대한 compute.images.useReadOnly 권한
  • 스냅샷을 사용하여 VM 만들기: 스냅샷에 대한 compute.snapshots.useReadOnly 권한
  • 인스턴스 템플릿을 사용하여 VM 만들기: 인스턴스 템플릿에 대한 compute.instanceTemplates.useReadOnly 권한
  • VM의 서브넷 지정: 프로젝트 또는 선택한 서브넷에 대한 compute.subnetworks.use 권한
  • VM의 고정 IP 주소 지정: 프로젝트에 대한 compute.addresses.use 권한
  • VPC 네트워크를 사용할 때 VM에 외부 IP 주소 할당: 프로젝트 또는 선택한 서브넷에 대한 compute.subnetworks.useExternalIp 권한
  • VM에 레거시 네트워크 할당: 프로젝트에 대한 compute.networks.use 권한
  • 레거시 네트워크 사용 시 VM에 외부 IP 주소 할당: 프로젝트에 대한 compute.networks.useExternalIp 권한
  • VM에 VM 인스턴스 메타데이터 설정: 프로젝트에 대한 compute.instances.setMetadata 권한
  • VM에 태그 설정: VM에 대한 compute.instances.setTags 권한
  • VM에 라벨 설정: VM에 대한 compute.instances.setLabels 권한
  • VM에 사용할 서비스 계정 설정: VM에 대한 compute.instances.setServiceAccount 권한
  • VM의 새 디스크 만들기: 프로젝트에 대한 compute.disks.create 권한
  • 기존 디스크를 읽기 전용 또는 읽기-쓰기 모드로 연결: 디스크에 대한 compute.disks.use 권한
  • 기존 디스크를 읽기 전용 모드로 연결: 디스크에 대한 compute.disks.useReadOnly 권한

커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

'예약에 따름' 프로비저닝 모델을 사용하는 VM 만들기

'예약에 따름' 프로비저닝 모델을 사용하여 A4X, A4 또는 A3 Ultra VM을 만들려면 사용하려는 자동 예약이 시작 시간에 도달할 때까지 기다려야 합니다. 또한 만들려는 VM은 다음 요구사항을 모두 충족해야 합니다.

다음 예에서는 A3 Ultra VM 5개에 대해 캘린더 모드의 미래용 예약 요청을 만든 다음 요청에 대해 자동 생성된 예약을 사용하여 A3 Ultra VM을 만듭니다.

'예약에 따름' 프로비저닝 모델을 사용하여 예시 VM을 만들려면 다음 옵션 중 하나를 선택합니다.

콘솔

  1. A3 Ultra VM 5개에 대한 예시 요청을 만들어 검토를 위해 제출합니다.

    1. Google Cloud 콘솔에서 예약 페이지로 이동합니다.

      예약으로 이동

    2. 미래용 예약 탭을 클릭합니다.

    3. 미래용 예약 만들기를 클릭합니다. 미래용 예약 만들기 페이지가 표시됩니다.

    4. 하드웨어 구성 섹션에서 머신 유형 지정을 선택한 후 A3 Ultra 인스턴스를 지정합니다.

    5. 확보 방법 섹션에서 다음 단계를 완료합니다.

      1. 최대 90일간의 용량 검색을 선택합니다.

      2. 리전영역 목록에서 리소스를 예약할 리전과 영역을 지정합니다. 이 예시에서는 각각 us-central1us-central1-a를 선택합니다.

      3. 필요한 총용량 필드에 5를 입력합니다.

      4. 예약 기간 섹션에서 예약의 예약 기간을 지정합니다.

    6. 나머지 필드를 지정한 다음 제출을 클릭합니다.

  2. 요청 시작 시간에 예시 자동 생성 예약을 사용하는 A3 Ultra VM을 만들려면 다음 단계를 따르세요.

    1. Google Cloud 콘솔에서 인스턴스 만들기 페이지로 이동합니다.

      인스턴스 만들기로 이동

    2. 이름 필드에 VM의 이름을 입력합니다. 이 예시에서는 example-vm를 입력합니다.

    3. 리소스를 예약할 리전영역을 지정합니다. 이 예시에서는 각각 us-central1us-central1-a를 선택합니다.

    4. GPU 탭을 클릭한 다음 GPU 유형 목록에서 NVIDIA H200 141GB를 선택합니다. 이 작업은 A3 Ultra VM을 지정하고 프로비저닝 모델을 예약에 따름으로 설정합니다.

    5. 탐색 메뉴에서 고급을 클릭합니다.

    6. 예약 섹션에서 예약 선택을 선택한 다음 예약 선택을 클릭합니다.

    7. 예약 선택 창에서 다음을 수행합니다.

      1. 특정 예약을 선택합니다. 다른 프로젝트에 있는 공유 예약을 사용하려면 프로젝트 목록에서 예약이 있는 프로젝트를 선택합니다.

      2. 선택을 클릭합니다.

    8. 프로비저닝 모델 섹션에서 VM 프로비저닝 모델 고급 설정 섹션을 펼칩니다.

    9. VM 종료 시 목록에서 중지(기본값) 또는 삭제를 선택합니다.

    10. 만들기를 클릭합니다.

gcloud

  1. A3 Ultra VM 5개에 대한 예시 요청을 만들어 검토를 위해 제출하려면 gcloud beta compute future-reservations create 명령어를 사용합니다.

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Google Cloud 에서 요청을 승인하고 Compute Engine에서 빈 예약을 자동으로 만든다고 가정해 보겠습니다. 2025년 10월 5일 요청 시작 시간에 Compute Engine이 예약에서 예약된 GPU VM 수를 늘립니다. 그러면 예약을 사용할 수 있습니다.

  2. 요청 시작 시간에 예시 자동 생성 예약을 사용하는 A3 Ultra VM을 만들려면 다음 플래그와 함께 gcloud compute instances create 명령어를 사용합니다.

    • --instance-termination-action 플래그

    • RESERVATION_BOUND로 설정된 --provisioning-model 플래그

    • --reservation 플래그

    • specific로 설정된 --reservation-affinity 플래그

    명령어는 다음과 비슷합니다. A3 Ultra VM을 만드는 데 필요한 전체 요구사항은 A3 Ultra 또는 A4 인스턴스 만들기를 참고하세요.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    이 명령어에는 다음 값이 포함됩니다.

    • TERMINATION_ACTION: 예약 기간이 끝날 때 Compute Engine이 VM을 중지(STOP)하거나 삭제(DELETE)하는지 여부입니다.

    • RESERVATION_URL: 예약의 URL입니다. 형식은 다음과 같습니다.

      • 자동 생성된 예약이 프로젝트에 있는 경우: example-reservation

      • 자동 생성된 예약이 다른 프로젝트에 있는 경우: projects/PROJECT_ID/reservations/example-reservation

REST

  1. A3 Ultra VM 5개에 대한 예시 요청을 만들어 검토를 위해 제출하려면 POST 요청을 베타 futureReservations.insert 메서드에 보냅니다.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Google Cloud 에서 요청을 승인하고 Compute Engine에서 빈 예약을 자동으로 만든다고 가정해 보겠습니다. 2025년 10월 5일 요청 시작 시간에 Compute Engine이 예약에서 예약된 GPU VM 수를 늘립니다. 그러면 예약을 사용할 수 있습니다.

  2. 요청 시작 시간에 예시 자동 생성 예약을 사용하는 A3 Ultra VM을 만들려면 POST 요청을 instances.insert 메서드에 보냅니다. 요청 본문에 다음 필드를 포함합니다.

    • SPECIFIC_RESERVATION으로 설정된 reservationAffinity.consumeReservationType 필드

    • compute.googleapis.com/reservation-name으로 설정된 reservationAffinity.key 필드

    • 예약의 URL로 설정된 reservationAffinity.values 필드

    • scheduling.instanceTerminationAction 필드

    • RESERVATION_BOUND로 설정된 scheduling.provisioningModel 필드

    요청은 다음과 비슷합니다. A3 Ultra VM을 만드는 데 필요한 전체 요구사항은 A3 Ultra 또는 A4 인스턴스 만들기를 참고하세요.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    요청 본문에는 다음 값이 포함됩니다.

    • RESERVATION_URL: 예약의 URL입니다. 형식은 다음과 같습니다.

      • 자동 생성된 예약이 프로젝트에 있는 경우: example-reservation

      • 자동 생성된 예약이 다른 프로젝트에 있는 경우: projects/PROJECT_ID/reservations/example-reservation

    • TERMINATION_ACTION: 예약 기간이 끝날 때 Compute Engine이 VM을 중지(STOP)하거나 삭제(DELETE)하는지 여부입니다.

다음 단계

직접 사용해 보기

Google Cloud를 처음 사용하는 경우 계정을 만들어 실제 시나리오에서 Compute Engine의 성능을 평가할 수 있습니다. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.

Compute Engine 무료로 사용해 보기