Google Cloud에서는 여러 영역으로 하위 분할된 리전을 사용하여 실제 컴퓨팅 리소스의 지리적 위치를 정의합니다. AI Platform Prediction에서 작업을 실행하는 경우 작업을 실행할 리전을 지정합니다.
일반적으로 물리적 위치에서 가장 가까운 리전이나 의도한 사용자의 물리적 위치를 사용해야 하지만, 아래에 열거된 서비스별 이용 가능한 리전을 확인해 보세요.
사용 가능한 리전
AI Platform 예측은 다음 리전에서 사용할 수 있습니다.
미주
리전 | 오리건 us-west1 |
로스앤젤레스 us-west2 |
솔트레이크시티 us-west3 |
아이오와 us-central1 |
사우스캐롤라이나 us-east1 |
북 버지니아 us-east4 |
몬트리올 northamerica-northeast1 |
상파울루 southamerica-east1 |
---|---|---|---|---|---|---|---|---|
온라인 예측(기존 MLS1 머신 유형) | ||||||||
온라인 예측(N1 머신 유형) | ||||||||
일괄 예측 | * | * | * | * | * |
유럽
리전 | 런던 europe-west2 |
벨기에 europe-west1 |
네덜란드 europe-west4 |
취리히 europe-west6 |
프랑크푸르트 europe-west3 |
핀란드 europe-north1 |
---|---|---|---|---|---|---|
온라인 예측(기존 MLS1 머신 유형) | ||||||
온라인 예측(N1 머신 유형) | ||||||
일괄 예측 | * | * | * | * | * |
아시아 태평양
리전 | 뭄바이 asia-south1 |
싱가포르 asia-southeast1 |
홍콩 asia-east2 |
타이완 asia-east1 |
도쿄 asia-northeast1 |
오사카 asia-northeast2 |
시드니 australia-southeast1 |
서울 asia-northeast3 |
---|---|---|---|---|---|---|---|---|
온라인 예측(기존 MLS1 머신 유형) | ||||||||
온라인 예측(N1 머신 유형) | ||||||||
일괄 예측 | * | * | * | * | * | * | * |
Google Cloud는 AI Platform Prediction 이외의 제품에도 추가 리전을 제공합니다.
리전 고려사항
리소스 부족
us-central1
리전에서는 GPU와 컴퓨팅 리소스의 수요가 높습니다.
작업 로그에 'Resources are
insufficient in region: <region>. Please try a different region.
'이라는 오류 메시지가 나타날 수 있습니다.
이 문제를 해결하려면 다른 리전을 사용하거나 나중에 다시 시도하세요.
Cloud Storage
AI Platform Prediction 작업은 해당 작업 데이터를 읽고 쓰는 데 사용하는 Cloud Storage 버킷과 같은 리전에서 실행되어야 합니다.
AI Platform Prediction 작업에 데이터를 읽고 쓰는 데 사용하는 모든 Cloud Storage 버킷에는 표준 스토리지 클래스를 사용해야 합니다.
온라인 예측
온라인 예측을 위해 모델 배포 시 예측을 실행할 리전을 지정합니다. 전역 엔드포인트(
ml.googleapis.com
) 또는 리전 엔드포인트(REGION-ml.googleapis.com
)를 통해 온라인 예측과 상호작용하는지에 관계없이 온라인 예측은 항상 모델에 지정된 기본 리전에서 제공됩니다. 온라인 예측에 리전 엔드포인트를 사용하면 다른 리전으로부터 모델과 버전 리소스가 분리되기 때문에 다른 리전의 중단으로부터 모델을 추가적으로 보호할 수 있습니다. 리전 엔드포인트 사용과 전역 엔드포인트 사용의 차이점에 대해 자세히 알아보기온라인 예측용 Compute Engine(N1) 머신 유형은 리전 엔드포인트에서만 사용할 수 있습니다. 전역 엔드포인트를 사용하는 경우 Compute Engine(N1) 머신 유형을 사용할 수 없습니다.
온라인 예측에 GPU 사용
온라인 예측용 GPU 사용은 리전 엔드포인트의 특정 리전에서만 사용할 수 있습니다. 전역 엔드포인트에서 GPU를 사용할 수 없습니다. 다음 표에는 각 리전 엔드포인트에서 온라인 예측에 사용할 수 있는 모든 가속기가 나와 있습니다.
미주
리전 | 오리건 us-west1 |
아이오와 us-central1 |
사우스캐롤라이나 us-east1 |
북 버지니아 us-east4 |
몬트리올 northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
유럽
리전 | 런던 europe-west2 |
벨기에 europe-west1 |
네덜란드 europe-west4 |
프랑크푸르트 europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
아시아 태평양
리전 | 싱가포르 asia-southeast1 |
타이완 asia-east1 |
도쿄 asia-northeast1 |
시드니 australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
일괄 예측
일괄 예측을 수행하려면 리전별 엔드포인트가 아닌 전역 API 엔드포인트를 사용해야 합니다.
일괄 예측을 위한 모델 및 모델 버전은 다음 리전에만 배포할 수 있습니다.
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
사용 가능한 리전 표에 별표로 표시된 다른 사용 가능한 리전에서 일괄 예측을 수행하려면 Cloud Storage에 저장된 TensorFlow 저장된 모델을 사용해야 합니다.
일괄 예측에서 최상의 성능을 얻기 위해서는 특히 매우 대규모 데이터 세트의 경우 같은 리전에서 예측 작업을 실행하고 입력 및 출력 데이터를 저장해야 합니다
일괄 예측을 위해 모델 배포 시 예측을 실행할 리전을 지정합니다. 일괄 예측 작업을 시작할 때 기본 리전을 재정의해 작업을 실행할 리전을 지정할 수 있습니다.
리소스 위치 제한
조직 정책 관리자는 리소스 위치 제약조건을 만들어 모델 및 일괄 예측 작업에 사용 가능한 리전을 제한할 수 있습니다. 리소스 위치 제약조건이 AI Platform Prediction에 적용되는 방법에 대해 읽어보세요.