Vertex AI의 Google 및 파트너 모델과 생성형 AI 기능은 특정 리전 엔드포인트와 전역 엔드포인트로 노출됩니다. 전역 엔드포인트는 전 세계를 포괄하며 단일 리전보다 높은 가용성과 신뢰성을 제공합니다.
모델 엔드포인트는 리전 가용성이나 리전 내 ML 처리를 보장하지 않습니다. 데이터 상주에 대한 자세한 내용은 데이터 상주를 참조하세요.
전역 엔드포인트
요청에 전역 엔드포인트를 선택하면 전반적인 가용성이 향상되면서 리소스 부족(429) 오류가 줄어들 수 있습니다. 요청이 전송될 때 ML 처리 요청이 전송되는 리전을 제어하거나 알 수 없으므로 ML 처리 요구사항이 있는 경우 전역 엔드포인트를 사용하지 마세요.
지원되는 모델
지정된 리전에 있는 다음 Google 모델에서는 전역 엔드포인트를 사용할 수 없습니다. 전역 엔드포인트를 지원하는 리전에 대한 자세한 내용은 Google 모델 엔드포인트 위치 테이블의 전역 탭을 참조하세요.
- Gemini 2.5 Flash Image Preview
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
파트너 모델의 전역 엔드포인트 가용성에 대한 자세한 내용은 Google Cloud 파트너 모델 엔드포인트 위치 테이블의 전역 탭을 참조하세요.
전역 엔드포인트 사용
전역 엔드포인트를 사용하려면 엔드포인트 이름에서 위치를 제외하고 리소스 위치를 global
로 구성합니다. 예를 들어 다음은 전역 엔드포인트 URL입니다.
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Google Gen AI SDK의 경우 global
위치를 사용하는 클라이언트를 만듭니다.
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Vertex AI SDK for Python의 경우 global
위치를 사용하여 SDK를 초기화합니다.
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
제한사항
전역 엔드포인트를 사용하는 경우에는 다음 기능을 사용할 수 없습니다.
- 조정
- 일괄 예측
- 검색 증강 생성(RAG) 코퍼스(RAG 요청이 지원됨)
다음 모델에서만 프로비저닝된 처리량과 함께 전역 엔드포인트를 사용할 수 있습니다.
모델 | 지원되는 최신 모델 버전 |
---|---|
Gemini 2.5 Flash Image Preview(프리뷰) | gemini-2.5-flash-image-preview |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Google 모델 엔드포인트 위치
다음 리전에서 Vertex AI의 생성형 AI용 Google 모델 엔드포인트를 사용할 수 있습니다.
미국
오하이오주 콜럼버스(us-east5) | 텍사스주 댈러스(us-south1) | 아이오와(us-central1) | 네바다주 라스베이거스(us-west4) | 사우스캐롤라이나주 몽크스 코너(us-east1) | 북 버지니아(us-east4) | 오리건(us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini 임베딩 ( gemini-embedding-001 ) |
|||||||
텍스트용 임베딩 | |||||||
멀티모달 임베딩 | |||||||
자막 및 VQA용 Imagen | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3(프리뷰)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast(프리뷰)
( veo-3.0-fast-generate-preview ) |
캐나다
몬트리올(northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini 임베딩 ( gemini-embedding-001 ) |
|
텍스트용 임베딩 | |
멀티모달 임베딩 | |
자막 및 VQA용 Imagen | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
남아메리카
브라질 상파울루(southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini 임베딩 ( gemini-embedding-001 ) |
|
텍스트용 임베딩 | |
멀티모달 임베딩 | |
자막 및 VQA용 Imagen | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
유럽
네덜란드(europe-west4) | 프랑스 파리(europe-west9) | 영국 런던(europe-west2) | 독일 프랑크푸르트(europe-west3) | 벨기에(europe-west1) | 스위스 취리히(europe-west6) | 스페인 마드리드(europe-southwest1) | 이탈리아 밀라노(europe-west8) | 핀란드(europe-north1) | 폴란드 바르샤바(europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
+ | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
||||||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
||||||||||
Gemini 임베딩 ( gemini-embedding-001 ) |
||||||||||
텍스트용 임베딩 | ||||||||||
멀티모달 임베딩 | ||||||||||
자막 및 VQA용 Imagen | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
아시아 태평양
일본 도쿄(asia-northeast1) | 오스트레일리아 시드니(australia-southeast1) | 싱가포르(asia-southeast1) | 대한민국 서울(asia-northeast3) | 타이완(asia-east1) | 중국 홍콩(asia-east2) | 인도 뭄바이(asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | ||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini 임베딩 ( gemini-embedding-001 ) |
|||||||
텍스트용 임베딩 | |||||||
멀티모달 임베딩 | |||||||
자막 및 VQA용 Imagen | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
중동
사우디아라비아 담맘(me-central2) | 카타르 도하(me-central1) | 이스라엘 텔아비브(me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||
Gemini 임베딩 ( gemini-embedding-001 ) |
|||
텍스트용 임베딩 | |||
멀티모달 임베딩 | |||
자막 및 VQA용 Imagen | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
|||
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||
Imagen 4
( imagen-4.0-generate-001 ) |
|||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
전역
Global(전역) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini 임베딩 ( gemini-embedding-001 ) |
|
텍스트용 임베딩 | |
멀티모달 임베딩 | |
자막 및 VQA용 Imagen | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 수정 및 맞춤설정 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 실험용
( imagen-4.0-ultra-generate-001 ) |
* 리전은 단일 영역 프로비저닝된 처리량을 사용하는 동안에만 사용 가능하며 이 리전에서는 지도 미세 조정이 지원되지 않습니다.
+ 이 리전에서는 지도 미세 조정이 지원되지 않습니다.
Google Cloud 파트너 모델 엔드포인트 위치
Google은 지정한 리전에서 요청을 처리합니다. 일부 모델의 경우 Google은 전반적인 가용성을 향상시키고 오류율을 줄이기 위해 전역 엔드포인트도 제공합니다. 전역 엔드포인트는 리전 엔드포인트와 별도의 할당량을 가질 수 있으며 데이터 상주 요구사항을 지원하지 않습니다. 자세한 내용은 MaaS용 Vertex AI 파트너 모델의 '리전 및 전역 엔드포인트' 섹션을 참조하세요.
Vertex AI의 생성형 AI용 파트너 모델 엔드포인트는 다음 리전에서 사용 가능합니다.
미국
오하이오주 콜럼버스(us-east5) | 텍사스주 댈러스(us-south1) | 아이오와(us-central1) | 네바다주 라스베이거스(us-west4) | 사우스캐롤라이나주 몽크스 코너(us-east1) | 북 버지니아(us-east4) | 오리건(us-west1) | |
---|---|---|---|---|---|---|---|
Anthropic의 Claude Opus 4.1 | |||||||
Anthropic의 Claude Opus 4 | |||||||
Anthropic의 Claude Sonnet 4 | |||||||
Anthropic의 Claude 3.7 Sonnet | |||||||
Anthropic의 Claude 3.5 Haiku | |||||||
Anthropic의 Claude 3 Haiku | |||||||
DeepSeek R1(0528) | |||||||
Llama 4 Maverick 17B-128E(프리뷰) | |||||||
Llama 4 Scout 17B-16E(프리뷰) | |||||||
Llama 3.3 70B(프리뷰) | |||||||
Llama 3.2 90B(프리뷰) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B(프리뷰) | |||||||
Llama 3.1 8B(프리뷰) | |||||||
Mistral OCR(25.05) | |||||||
Mistral Small 3.1(25.03) | |||||||
Mistral Large | |||||||
Codestral |
유럽
네덜란드(europe-west4) | 벨기에(europe-west1) | ||
---|---|---|---|
Anthropic의 Claude Opus 4.1 | |||
Anthropic의 Claude Opus 4 | |||
Anthropic의 Claude Sonnet 4 | |||
Anthropic의 Claude 3.7 Sonnet | |||
Anthropic의 Claude 3.5 Haiku | |||
Anthropic의 Claude 3 Haiku | |||
DeepSeek R1(0528) | |||
Llama 4 Maverick 17B-128E(프리뷰) | |||
Llama 4 Scout 17B-16E(프리뷰) | |||
Llama 3.3 70B(프리뷰) | |||
Llama 3.2 90B(프리뷰) | |||
Llama 3.1 405B | |||
Llama 3.1 70B(프리뷰) | |||
Llama 3.1 8B(프리뷰) | |||
Mistral OCR(25.05) | |||
Mistral Small 3.1(25.03) | |||
Mistral Large | |||
Codestral |
아시아 태평양
싱가포르(asia-southeast1) | 타이완(asia-east1) | |
---|---|---|
Anthropic의 Claude Opus 4.1 | ||
Anthropic의 Claude Opus 4 | ||
Anthropic의 Claude Sonnet 4 | ||
Anthropic의 Claude 3.7 Sonnet | ||
Anthropic의 Claude 3.5 Haiku | ||
Anthropic의 Claude 3 Haiku | ||
DeepSeek R1(0528) | ||
Llama 4 Maverick 17B-128E(프리뷰) | ||
Llama 4 Scout 17B-16E(프리뷰) | ||
Llama 3.3 70B(프리뷰) | ||
Llama 3.2 90B(프리뷰) | ||
Llama 3.1 405B | ||
Llama 3.1 70B(프리뷰) | ||
Llama 3.1 8B(프리뷰) | ||
Mistral OCR(25.05) | ||
Mistral Small 3.1(25.03) | ||
Mistral Large | ||
Codestral |
전역
Global(전역) | ||
---|---|---|
Anthropic의 Claude Opus 4.1 | ||
Anthropic의 Claude Opus 4 | ||
Anthropic의 Claude Sonnet 4 | ||
Anthropic의 Claude 3.7 Sonnet | ||
Anthropic의 Claude 3.5 Haiku | ||
Anthropic의 Claude 3 Haiku | ||
DeepSeek R1(0528) | ||
Llama 4 Maverick 17B-128E(프리뷰) | ||
Llama 4 Scout 17B-16E(프리뷰) | ||
Llama 3.3 70B(프리뷰) | ||
Llama 3.2 90B(프리뷰) | ||
Llama 3.1 405B | ||
Llama 3.1 70B(프리뷰) | ||
Llama 3.1 8B(프리뷰) | ||
Mistral OCR(25.05) | ||
Mistral Small 3.1(25.03) | ||
Mistral Large | ||
Codestral |
다음 단계
- 전역 엔드포인트를 보여주는 노트북 튜토리얼은 Vertex AI 전역 엔드포인트 소개 참조
- Vertex AI의 생성형 AI 데이터 상주 자세히 알아보기
- Google Cloud 리전 알아보기
- 기능별 보안 제어 자세히 알아보기
- Vertex AI의 생성형 AI를 지원하는 모델에 대해 알아보기. 생성형 AI 기본 모델 참조를 확인하세요.
- Vertex AI 위치 알아보기