공유 VPC를 사용하는 Cloud TPU가 있는 GKE 클러스터

이 가이드에서는 다음 방법을 설명합니다.

  • 공유 VPC 네트워크를 사용하여 Cloud TPU GKE 클러스터를 설정합니다.
  • 클러스터, 공유 VPC, Google 관리형 서비스 간 통신을 보장하기 위해 필요한 APIIP 범위를 설정합니다.
  • 클러스터 포드 및 서비스에 대한 보조 CIDR 범위를 만듭니다.

개념

이 가이드 전체에서 자주 사용되는 개념은 다음과 같습니다.

  • 호스트 프로젝트: 하나 이상의 공유 VPC 네트워크가 포함된 프로젝트입니다. 이 가이드에서는 이 프로젝트에 공유 VPC가 포함됩니다.

  • 서비스 프로젝트: 공유 VPC 관리자가 호스트 프로젝트에 연결한 프로젝트입니다. 이 연결을 사용하면 이 프로젝트가 공유 VPC에 참여할 수 있습니다. 이 가이드에서는 이 프로젝트에 Cloud TPU 클러스터가 포함됩니다.

요구사항

API 사용 설정

  1. Google Cloud 콘솔에서 호스트 프로젝트에 다음 API를 사용 설정합니다.

  2. Google Cloud 콘솔에서 서비스 프로젝트에 다음 API를 사용 설정합니다.

Google 관리형 서비스에 대해 VPC 피어링의 IP 범위 설정

이러한 단계에 따라 호스트 프로젝트의 공유 VPC 네트워크에서 IP 범위를 예약합니다. 범위는 이 VPC 네트워크에 있는 모든 Google 관리형 서비스에 사용됩니다. Cloud TPU는 Google 관리형 서비스 중 하나입니다.

  1. 공유 VPC 네트워크의 기존 IP 범위를 나열합니다.

    $ gcloud beta compute networks list-ip-addresses network \
    --project=host-project-id
    
  2. 사용 가능한 범위를 선택하고 이를 공유 VPC 네트워크에서 예약합니다.

    $ gcloud beta compute addresses create peering-name \
      --global \
      --prefix-length=16 \
      --network=network \
      --purpose=VPC_PEERING \
      --project=host-project-id
    

    peering-name은 VPC 피어링 연결 이름을 지정합니다. 이름은 다음 단계에 사용됩니다.

  3. 호스트 프로젝트와 Google 관리형 서비스 사이의 VPC 네트워크 피어링 연결을 만듭니다.

    $ gcloud beta services vpc-peerings connect \
      --service=servicenetworking.googleapis.com \
      --network=network \
      --ranges=peering-name \
      --project=host-project-id
    

클러스터의 보조 IP 범위 만들기

공유 VPC 네트워크에서 서브네트워크를 선택하거나 만들고 클러스터 포드 및 서비스에 대해 2개의 보조 CIDR 범위를 추가합니다.

이러한 범위는 각각 클러스터 포드 및 서비스에 사용됩니다. 범위 이름은 다음 단계에 사용됩니다.

  • subnet은 호스트 프로젝트의 network 네트워크에 있는 서브네트워크가 됩니다.

  • tier-1-namesubnet에서 GKE 포드에 사용되는 보조 범위 이름입니다.

  • tier-2-namesubnet에서 GKE 서비스에 사용되는 보조 범위 이름입니다.

Cloud TPU로 GKE 클러스터 만들기

다음 명령어는 공유 VPC 네트워크에서 기존 CIDR 범위를 사용하여 GKE를 만들어 Cloud TPU를 사용 설정하는 방법을 보여줍니다.

$ gcloud beta container clusters create cluster-name \
  --enable-ip-alias \
  --network projects/host-project-id/global/networks/network \
  --subnetwork projects/host-project-id/regions/region/subnetworks/subnet \
  --cluster-secondary-range-name tier-1-name \
  --services-secondary-range-name tier-2-name \
  --scopes=cloud-platform \
  --enable-tpu \
  --enable-tpu-service-networking \
  --project=service-project-id

GKE에서 Cloud TPU 애플리케이션 실행 가이드의 포드 사양 단계에 따라 Cloud TPU 리소스를 사용하는 작업을 빌드합니다.

삭제

GKE에서 Cloud TPU 작업을 마쳤으면 Cloud Billing 계정에 추가 비용이 발생하지 않도록 리소스를 삭제합니다.

  1. 예약된 피어링 IP 범위를 삭제합니다.

    $ gcloud beta compute addresses delete peering-name \
      --global \
      --project=host-project-id
    
  2. 공유 VPC를 사용하여 클러스터 설정 시 삭제 안내에 따라 클러스터 및 네트워크 리소스를 삭제합니다.