이 페이지에서는 조정된 모델 할당량, 텍스트 임베딩 한도, Vertex AI Agent Engine 할당량을 제공합니다.
조정된 모델 할당량
특정 프로젝트 및 리전의 Vertex AI의 생성형 AI 조정 모델에 적용되는 할당량은 다음과 같습니다.
할당량 | 값 |
---|---|
리전에 따라 제한된 이미지 학습 TPU V3 포드 코어 * 지원되는 리전 - europe-west4 |
64 |
리전에 따라 제한된 이미지 학습 Nvidia A100 80GB GPU * 지원되는 리전 - us-central1 * 지원되는 리전 - us-east4 |
8 2 |
텍스트 임베딩 한도
각 텍스트 임베딩 모델 요청에는 최대 250개의 입력 텍스트(입력 텍스트당 임베딩 1개 생성)와 요청당 20,000개의 토큰이 포함될 수 있습니다.
각 입력 텍스트의 처음 8,192개 토큰만 임베딩을 계산하는 데 사용됩니다. 각 요청에는 하나의 입력 텍스트만 포함될 수 있습니다.
Vertex AI Agent Engine 제한사항
다음 한도는 각 리전의 특정 프로젝트에 대한 Vertex AI Agent Engine에 적용됩니다.
설명 | 한도 |
---|---|
분당 Vertex AI Agent Engine 만들기/삭제/업데이트 수 | 10 |
분당 Vertex AI Agent Engine 쿼리/스트림 쿼리 | 60 |
최대 Vertex AI Agent Engine 리소스 수 | 100 |
다음 단계
- Vertex AI의 할당량 및 한도에 대한 자세한 내용은 Vertex AI 할당량 및 한도를 참조하세요.
- Google Cloud 할당량 및 한도에 대한 자세한 내용은 할당량 값 및 시스템 한도 이해를 참조하세요.