이 페이지는 Cloud Translation API를 통해 번역되었습니다.

조정된 모델, 텍스트 임베딩, Vertex AI Agent Engine 할당량 및 한도

이 페이지에서는 조정된 모델 할당량, 텍스트 임베딩 한도, Vertex AI Agent Engine 할당량을 제공합니다.

조정된 모델 할당량

특정 프로젝트 및 리전의 Vertex AI의 생성형 AI 조정 모델에 적용되는 할당량은 다음과 같습니다.

할당량	값
리전에 따라 제한된 이미지 학습 TPU V3 포드 코어 * 지원되는 리전 - europe-west4	64
리전에 따라 제한된 이미지 학습 Nvidia A100 80GB GPU * 지원되는 리전 - us-central1 * 지원되는 리전 - us-east4	8 2

* 조정 시나리오에는 특정 리전에 가속기 예약이 있습니다. 조정에 대한 할당량이 지원되며 특정 리전에서 요청해야 합니다.

각 텍스트 임베딩 모델 요청에는 최대 250개의 입력 텍스트(입력 텍스트당 임베딩 1개 생성)와 요청당 20,000개의 토큰이 포함될 수 있습니다.

각 입력 텍스트의 처음 8,192개 토큰만 임베딩을 계산하는 데 사용됩니다. 각 요청에는 하나의 입력 텍스트만 포함될 수 있습니다.

다음 한도는 각 리전의 특정 프로젝트에 대한 Vertex AI Agent Engine에 적용됩니다.

설명	한도
분당 Vertex AI Agent Engine 만들기/삭제/업데이트 수	10
분당 Vertex AI Agent Engine 쿼리/스트림 쿼리	60
최대 Vertex AI Agent Engine 리소스 수	100