이 기존 AI Platform Prediction 버전은 지원 중단되었으며 2025년 1월 31일 이후에는 Google Cloud에서 더 이상 사용할 수 없습니다. 모든 모델, 관련 메타데이터, 배포는 2025년 1월 31일 이후에 삭제됩니다. 리소스를 Vertex AI로 마이그레이션하여 AI Platform에서 사용할 수 없는 새로운 머신러닝 기능을 사용하세요.

리전

Google Cloud에서는 여러 영역으로 하위 분할된 리전을 사용하여 실제 컴퓨팅 리소스의 지리적 위치를 정의합니다. AI Platform Prediction에서 작업을 실행하는 경우 작업을 실행할 리전을 지정합니다.

일반적으로 물리적 위치에서 가장 가까운 리전이나 의도한 사용자의 물리적 위치를 사용해야 하지만, 아래에 열거된 서비스별 이용 가능한 리전을 확인해 보세요.

사용 가능한 리전

AI Platform 예측은 다음 리전에서 사용할 수 있습니다.

미주

리전	오리건 us-west1	로스앤젤레스 us-west2	솔트레이크시티 us-west3	몬트리올 northamerica-northeast1	상파울루 southamerica-east1
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측	*	*	*	*	*

유럽

리전	런던 europe-west2	네덜란드 europe-west4	취리히 europe-west6	프랑크푸르트 europe-west3	핀란드 europe-north1
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측	*	*	*	*	*

아시아 태평양

리전	뭄바이 asia-south1	싱가포르 asia-southeast1	홍콩 asia-east2	타이완 asia-east1	오사카 asia-northeast2	시드니 australia-southeast1	서울 asia-northeast3
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측	*	*	*	*	*	*	*

Google Cloud는 AI Platform Prediction 이외의 제품에도 추가 리전을 제공합니다.

리전 고려사항

리소스 부족

us-central1 리전에서는 GPU와 컴퓨팅 리소스의 수요가 높습니다. 작업 로그에 'Resources are insufficient in region: <region>. Please try a different region.'이라는 오류 메시지가 나타날 수 있습니다.

이 문제를 해결하려면 다른 리전을 사용하거나 나중에 다시 시도하세요.

Cloud Storage

AI Platform Prediction 작업은 해당 작업 데이터를 읽고 쓰는 데 사용하는 Cloud Storage 버킷과 같은 리전에서 실행되어야 합니다.
AI Platform Prediction 작업에 데이터를 읽고 쓰는 데 사용하는 모든 Cloud Storage 버킷에는 표준 스토리지 클래스를 사용해야 합니다.

온라인 예측

온라인 예측을 위해 모델 배포 시 예측을 실행할 리전을 지정합니다. 전역 엔드포인트(ml.googleapis.com) 또는 리전 엔드포인트(REGION-ml.googleapis.com)를 통해 온라인 예측과 상호작용하는지에 관계없이 온라인 예측은 항상 모델에 지정된 기본 리전에서 제공됩니다. 온라인 예측에 리전 엔드포인트를 사용하면 다른 리전으로부터 모델과 버전 리소스가 분리되기 때문에 다른 리전의 중단으로부터 모델을 추가적으로 보호할 수 있습니다. 리전 엔드포인트 사용과 전역 엔드포인트 사용의 차이점에 대해 자세히 알아보기
온라인 예측용 Compute Engine(N1) 머신 유형은 리전 엔드포인트에서만 사용할 수 있습니다. 전역 엔드포인트를 사용하는 경우 Compute Engine(N1) 머신 유형을 사용할 수 없습니다.

온라인 예측에 GPU 사용

온라인 예측용 GPU 사용은 리전 엔드포인트의 특정 리전에서만 사용할 수 있습니다. 전역 엔드포인트에서 GPU를 사용할 수 없습니다. 다음 표에는 각 리전 엔드포인트에서 온라인 예측에 사용할 수 있는 모든 가속기가 나와 있습니다.

미주

리전	오리건 us-west1	아이오와 us-central1	사우스캐롤라이나 us-east1	북 버지니아 us-east4	몬트리올 northamerica-northeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

유럽

리전	런던 europe-west2	벨기에 europe-west1	네덜란드 europe-west4	프랑크푸르트 europe-west3
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

아시아 태평양

리전	싱가포르 asia-southeast1	타이완 asia-east1	도쿄 asia-northeast1	시드니 australia-southeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

일괄 예측

일괄 예측을 수행하려면 리전별 엔드포인트가 아닌 전역 API 엔드포인트를 사용해야 합니다.
일괄 예측을 위한 모델 및 모델 버전은 다음 리전에만 배포할 수 있습니다.
- us-central1
- us-east1
- us-east4
- europe-west1
- asia-northeast1
사용 가능한 리전 표에 별표로 표시된 다른 사용 가능한 리전에서 일괄 예측을 수행하려면 Cloud Storage에 저장된 TensorFlow 저장된 모델을 사용해야 합니다.
일괄 예측에서 최상의 성능을 얻기 위해서는 특히 매우 대규모 데이터 세트의 경우 같은 리전에서 예측 작업을 실행하고 입력 및 출력 데이터를 저장해야 합니다
일괄 예측을 위해 모델 배포 시 예측을 실행할 리전을 지정합니다. 일괄 예측 작업을 시작할 때 기본 리전을 재정의해 작업을 실행할 리전을 지정할 수 있습니다.

리소스 위치 제한

조직 정책 관리자는 리소스 위치 제약조건을 만들어 모델 및 일괄 예측 작업에 사용 가능한 리전을 제한할 수 있습니다. 리소스 위치 제약조건이 AI Platform Prediction에 적용되는 방법에 대해 읽어보세요.