Vertex AI에서 AI 모델을 빌드하고 배포하는 비용
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
200 응답 코드를 반환하는 요청에 대해서만 요금이 청구됩니다. 4xx 및 5xx 코드와 같은 다른 응답 코드를 반환하는 요청에는 입력 또는 출력에 대한 요금이 청구되지 않습니다.
이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.
Google 모델
Gemini 3
| 모델 | 유형 | 가격 (/1백만 토큰) <= 200,000개 입력 토큰 | 가격 (/1백만 토큰) > 200,000개 입력 토큰 | 가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰 | 가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰 | 가격(/1백만 토큰) <= 20만 개의 입력 토큰(Batch API 사용) | 가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰 |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro 프리뷰 | |||||||
| 입력 (텍스트, 이미지, 동영상, 오디오) | $2 | $4 | $0.2 | $0.4 | $1 | $2 | |
| 텍스트 출력 (대답 및 추론) | $12 | $18 | 해당 사항 없음 | 해당 사항 없음 | $6 | $9 | |
| 이미지 출력** | $120 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | $60 | 해당 사항 없음 | |
| Gemini 3 Flash 프리뷰 | |||||||
| 입력(텍스트, 이미지, 동영상) | $0.5 | $0.5 | $0.05 | $0.05 | $0.25 | $0.25 | |
| 입력 (오디오) | $1 | $1 | $0.1 | $0.1 | $0.5 | $0.5 | |
| 텍스트 출력 (대답 및 추론) | $3 | $3 | 해당 사항 없음 | 해당 사항 없음 | $1.5 | $1.5 | |
| Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩 |
모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다. 이러한 한도를 초과하는 검색 쿼리는 검색 쿼리 1,000개당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 검색 (또는 Enterprise용 웹 그라운딩)에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 개별 검색 쿼리마다 요금이 청구됩니다. 요금 청구는 2026년 1월 5일부터 시작됩니다. Google 검색을 사용한 그라운딩 또는 엔터프라이즈용 웹 그라운딩에서 제공하는 입력 토큰에는 요금이 청구되지 않습니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||||
| Google 지도를 사용한 그라운딩 |
모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다. 이 한도를 초과하는 Maps 쿼리는 1,000건당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 지도에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 개별 쿼리마다 요금이 청구됩니다. 2026년 1월 5일부터 청구 시작 Google 지도에서 제공하는 입력 토큰은 청구되지 않습니다. |
||||||
| 데이터를 사용한 그라운딩 | 프롬프트 1,000개당 $2.50 | ||||||
* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
** 1K (1024x1024) 및 2K (2048x2048) 출력 이미지는 1,120개의 이미지 출력 토큰을 소비하며, 이는 이미지 생성당 $0.134에 해당합니다. 4K (4096x4096) 이미지는 2,000개의 이미지 출력 토큰을 소비하며, 이는 이미지 1개당 $0.24에 해당합니다.
Gemini 2.5
| 모델 | 유형 | 가격 (/1백만 토큰) <= 200,000개 입력 토큰 | 가격 (/1백만 토큰) > 200,000개 입력 토큰 | 가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰 | 가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰 | 가격(/1백만 토큰) <= 20만 개의 입력 토큰(Batch API 사용) | 가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰 |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| 입력 (텍스트, 이미지, 동영상, 오디오) | $1.25 | $2.5 | $0.125 | $0.250 | $0.625 | $1.25 | |
| 텍스트 출력 (대답 및 추론) | $10 | $15 | 해당 사항 없음 | 해당 사항 없음 | $5 | $7.5 | |
| Gemini 2.5 Pro 컴퓨터 사용-프리뷰 |
|||||||
| 입력 (텍스트, 이미지, 동영상, 오디오) | $1.25 | $2.5 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
| 텍스트 출력 (대답 및 추론) | $10.00 | $15.00 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.5 Flash |
|||||||
| 입력(텍스트, 이미지, 동영상) | $0.30 | $0.30 | $0.030 | $0.030 | $0.15 | $0.15 | |
| 오디오 입력 | $1 | $1 | $0.100 | $0.100 | $0.5 | $0.5 | |
| 텍스트 출력 (대답 및 추론) | $2.50 | $2.50 | 해당 사항 없음 | 해당 사항 없음 | $1.25 | $1.25 | |
| 이미지 출력*** | $30 | $30 | 해당 사항 없음 | 해당 사항 없음 | $15 | $15 | |
Gemini 2.5 Flash Live API |
|||||||
| 입력 텍스트 토큰 1백만 개 | $0.5 | $0.5 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
| 입력 오디오 토큰 1백만 개 | $3 | $3 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
| 입력 동영상/이미지 토큰 1백만 개 | $3 | $3 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
| 출력 텍스트 토큰 1백만 개 | $2 | $2 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
| 1백만 개의 출력 오디오 토큰 | $12 | $12 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.5 Flash Lite |
|||||||
| 입력(텍스트, 이미지, 동영상) | $0.1 | $0.1 | $0.010 | $0.010 | $0.05 | $0.05 | |
| 오디오 입력 | $0.3 | $0.3 | $0.030 | $0.030 | $0.15 | $0.15 | |
| 텍스트 출력 (대답 및 추론) | $0.4 | $0.4 | 해당 사항 없음 | 해당 사항 없음 | $0.2 | $0.2 | |
Google 검색을 사용한 그라운딩 |
Gemini 2.0 Flash, 2.5 Flash, 2.5 Flash-Lite에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. Gemini 2.5 Pro에는 하루에 10,000개의 그라운딩된 프롬프트가 추가 비용 없이 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 검색에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다**. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||||
엔터프라이즈용 웹 그라운딩 |
그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다**. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||||
| 데이터를 사용한 그라운딩 | 요청 1,000개당 $2.5 | ||||||
| Google 지도를 사용한 그라운딩 | 1,000개의 그라운딩된 프롬프트당$25. 그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다. |
||||||
* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 부과됩니다.
** Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환한 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
*** 1024x1024 이미지의 경우 1290개의 토큰이 사용됩니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
**** Computer Use 청구는 Gemini 2.5 Pro SKU를 사용하며, Computer Use 비용을 분할하려면 청구 태그를 적용하세요. 자세한 내용은 여기를 참조하세요.
- LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
- 능동적 오디오 모드: 사용 설정하면 LiveAPI가 수신 대기하는 동안 입력 토큰이 청구됩니다. 출력 토큰은 API가 응답할 때만 청구됩니다.
- 오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.
Gemini 2.0
Gemini 2.0은 토큰을 기준으로 요금이 청구됩니다. 요청을 보내기 전에 요청의 입력 토큰 수를 계산하려면 SDK 토크나이저 또는 countTokens API를 사용하면 됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.
가격 책정 표의 전환 버튼을 사용하여 토큰 기반 가격 책정과 모달리티 기반 가격 책정을 비교해 보세요.
토큰 기반 가격 책정
| 모델 | 유형 | 가격 | Batch API 가격 | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 입력 토큰 1백만 개 | $0.15 | $0.075 | |||
| 입력 오디오 토큰 1백만 개 | $1.00 | $0.50 | |||
| 1백만 개의 출력 텍스트 토큰 | $0.60 | $0.30 | |||
| 1백만 개의 학습 토큰에 맞게 조정 | $3.00 | ||||
Gemini 2.0 Flash 이미지 생성 |
|||||
| 입력 토큰 100만 개 | $0.15 | ||||
| 입력 오디오 토큰 1백만 개 | $1.00 | ||||
| 입력 동영상 토큰 1백만 개 | $3 | ||||
| 출력 텍스트 토큰 1백만 개 | $0.60 | ||||
| 1백만 개의 출력 이미지 토큰 | $30.00 | ||||
Gemini 2.0 Flash Live API |
|||||
| 입력 텍스트 토큰 1백만 개 | $0.5 | ||||
| 입력 오디오 토큰 1백만 개 | $3 | ||||
| 입력 동영상/이미지 토큰 1백만 개 | $3 | ||||
| 출력 텍스트 토큰 1백만 개 | $2 | ||||
| 1백만 개의 출력 오디오 토큰 | $12 | ||||
Gemini 2.0 Flash Lite |
|||||
| 입력 토큰 1백만 개 | $0.075 | $0.0375 | |||
| 입력 오디오 토큰 1백만 개 | $0.075 | $0.0375 | |||
| 1백만 개의 출력 텍스트 토큰 | $0.30 | $0.15 | |||
| 1백만 개의 학습 토큰에 맞게 조정 | $1.00 | ||||
Google 검색을 사용한 그라운딩 |
Gemini 2.0 Flash 및 2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||
엔터프라이즈용 웹 그라운딩 |
그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||
| 데이터를 사용한 그라운딩 | 2025년 6월 16일부터 요청 1,000개당 $2.5 | ||||
Google 지도 기반 그라운딩 |
Gemini 모델에는 추가 비용 없이 사용할 수 있는 여러 개의 그라운딩된 일일 프롬프트가 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$25의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||
형식 기반 가격 책정
아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.
- 4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.
- 1024x1024 이미지의 경우 1290개의 토큰을 소비합니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
- 동영상 입력은 초당 1프레임의 샘플링 속도로 초당 258개의 토큰을 소비합니다. 오디오가 포함된 동영상은 동영상 토큰과 오디오 토큰 모두에 대해 요금이 청구됩니다.
- 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.
| 모델 | 유형 | 가격 | Batch API 가격 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 입력 텍스트(문자 백만 개당 비용($)) | $0.0375 | $0.01875 | |
| 입력 이미지 ($/이미지) | $0.0001935 | $0.00009675 | |
| 입력 동영상 ($/초) | $0.0000387 | $0.00001935 | |
| 입력 오디오 ($/초) | $0.000025 | $0.0000125 | |
| 출력 텍스트 (백만 문자당 $) | $0.15 | $0.075 | |
Gemini 2.0 Flash 이미지 생성 |
|||
| 입력 텍스트(문자 백만 개당 비용($)) | $0.0375 | ||
| 입력 이미지 ($/이미지) | $0.0001935 | ||
| 입력 동영상 ($/초) | $0.0000387 | ||
| 입력 오디오 ($/초) | $0.000025 | ||
| 출력 텍스트 (백만 문자당 $) | $0.15 | ||
| 출력 이미지 이미지 (이미지당 $) | $0.04 | ||
Gemini 2.0 Flash Lite |
|||
| 입력 텍스트(문자 백만 개당 비용($)) | $0.01875 | $0.009375 | |
| 입력 이미지 ($/이미지) | $0.00009675 | $0.000048375 | |
| 입력 동영상 ($/초) | $0.00001935 | $0.000009675 | |
| 입력 오디오 ($/초) | $0.000001875 | $0.000000938 | |
| 출력 텍스트 (백만 문자당 $) | $0.075 | $0.0375 | |
Google 검색을 사용한 그라운딩 |
Gemini 2.0 Flash 및 2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||
엔터프라이즈용 웹 그라운딩 |
그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
* Gemini 2.0 Flash Live API: 오디오 (입력/출력) 초당 25개 토큰, 동영상 (입력) 초당 258개 토큰 Gemini 2.0 Flash Live API가 프리뷰 버전인 동안에는 Google 검색을 사용한 그라운딩이 무료로 제공됩니다.
- LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
- 오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.
Vertex AI Model Optimizer 가격 책정 (실험용)*
Vertex AI Model Optimizer는 Gemini 모델 요청을 위한 단일 메타 엔드포인트를 제공하여 엔터프라이즈 고객의 Gemini 사용을 간소화합니다. 이 서비스를 사용하는 고객은 Flash, Pro 또는 특정 버전을 사용할지 지정할 필요가 없습니다. 대신 구성 가능한 설정 (비용, 품질 또는 균형)을 제공하여 선호도를 나타내면 Model Optimizer가 각 쿼리를 가장 적합한 모델로 전송하여 작업에 적합한 수준의 인텔리전스를 적용합니다.
Vertex AI Model Optimizer는 동적 가격 책정을 적용합니다. 즉, 토큰당 평균 가격은 작업을 완료하는 데 적용되는 모델 인텔리전스 수준에 따라 달라집니다. 따라서 아래 표에 구성 설정을 기반으로 한 예상 시나리오를 보여주는 가격 책정 예시를 제공합니다. Model Optimizer SKU는 결제에 적용하기 위한 구매 단위로 기능하는 $1 SKU이며, 모델을 사용한 후에도 사용량 기준으로 요금이 청구됩니다.
| 5:1 I/O 비율 | 예시 1 챗봇 |
참고: 이 범위는 보장되지 않으며 개별 고객의 결과는 다를 수 있습니다. | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 고객 선호도 | MO에 전송된 고객 입력 토큰 | 고객 출력 토큰이 MO로 전송됨 | 토큰 100만 개당 평균 입력 가격 (높은 범위) | 토큰 100만 개당 평균 출력 가격 (높은 범위) | 토큰 100만 개당 평균 입력 가격 (낮은 범위) | 토큰 100만 개당 평균 출력 가격 (낮은 범위) | |||||
| 비용 | 10,000,000 | 2,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| 균형 | 10,000,000 | 2,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| 품질 | 10,000,000 | 2,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
| 1:20 I/O 비율 | 예 2 콘텐츠 생성 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 고객 선호도 | MO에 전송된 고객 입력 토큰 | 고객 출력 토큰이 MO로 전송됨 | 토큰 100만 개당 평균 입력 가격 (높은 범위) | 토큰 100만 개당 평균 출력 가격 (높은 범위) | 토큰 100만 개당 평균 입력 가격 (낮은 범위) | 토큰 100만 개당 평균 출력 가격 (낮은 범위) | |||||
| 비용 | 1,000,000 | 20,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| 균형 | 1,000,000 | 20,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| 품질 | 1,000,000 | 20,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
기타 Gemini 모델
Gemini 2.0 또는 Gemini 2.5를 제외한 모든 Gemini 모델은 문자, 이미지, 동영상/오디오 초와 같은 모달리티를 기준으로 요금이 청구됩니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 토큰당 약 4개의 문자가 포함됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.
| 모델 | 기능 | 유형 | 가격 ( 입력 토큰 128,000개 이하) |
가격 (입력 토큰 128,000개 초과) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자 $0.000002 / 초 |
$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자 $0.000004 / 초 |
||
| 텍스트 출력 | $0.000075 / 1000자 | $0.00015 / 1,000자 | ||||
| 조정* | 학습 토큰 | 토큰 백만 개당 8달러 | ||||
| Gemini 1.5 Pro | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00032875 / 이미지 $0.00032875 / 초 $0.0003125 / 1,000자 $0.00003125 / 초 |
$0.0006575 / 이미지 $0.0006575 / 초 $0.000625 / 1,000자 $0.0000625 / 초 |
||
| 텍스트 출력 | $0.00125 / 1000자 | $0.0025 / 1,000자 | ||||
| 조정* | 학습 토큰 | 토큰 백만 개당 80달러 | ||||
| Gemini 1.0 Pro | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 |
$0.0025/이미지 $0.002/초 $0.000125/1,000자 |
|||
| 텍스트 출력 | $0.000375/1000자 | |||||
| Google 검색을 사용하는 그라운딩 | 텍스트 | 그라운딩된 프롬프트 1,000개당 35달러. 그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||
| 엔터프라이즈용 웹 그라운딩 | 텍스트 | 그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈용 웹 그라운딩에 하나 이상의 쿼리를 만듭니다*. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요. |
||||
| 데이터를 사용한 그라운딩 | 텍스트 | 2025년 6월 16일부터 요청 1,000개당 $2.5가 청구됩니다. |
||||
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128, 000개 토큰보다 길면 모든 토큰에 긴 컨텍스트 요금이 청구됩니다.
* Gemini 모델은 일괄 모드에서 50% 할인된 가격으로 제공됩니다.
* Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
Imagen
Vertex AI 기반 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.
| 모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
|---|---|---|---|---|---|
| Imagen 4 Ultra | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.06 |
| Imagen 4 | 업스케일링 | 생성된 이미지의 해상도를 2K, 3K, 4K로 높입니다. | 이미지 | 이미지 | 이미지당 $0.06 |
| Imagen 4 | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.04 |
| Imagen 4 Fast | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.02 |
| Imagen 3 | 이미지 생성 | 이미지 생성 이미지 수정 이미지 맞춤설정 |
텍스트 프롬프트 | 이미지 | 이미지당 $0.04 |
| Imagen 3 Fast | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.02 |
| Imagen 2, Imagen 1 | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.020 |
| Imagen 2, Imagen 1 | 이미지 수정 | 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 | 이미지/텍스트 프롬프트 | 이미지 | 이미지당 $0.020 |
| Imagen 1 | 업스케일링 | 생성된 이미지의 해상도를 2k 및 4k로 높입니다. | 이미지 | 이미지 | 이미지당 $0.003 |
| Imagen 1 | 세부 조정 | 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 | 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 | 미세 조정된 모델(사용자 제공 주제로 학습한 후) | 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정) |
| Imagen | 시각적 캡셔닝 | 이미지에 대한 짧거나 긴 텍스트 설명 생성 | 이미지 | 텍스트 캡션 | $0.0015/이미지 |
| Imagen | 시각적 질의 응답 | 이미지를 참조하는 질문에 따라 답변 제공 | 이미지/텍스트 프롬프트 | 텍스트 대답 | $0.0015/이미지 |
| Imagen | 제품 재컨텍스트화 | 새로운 장면에서 제품을 재해석하세요 | 동일한 제품의 이미지 1~3개와 원하는 장면을 설명하는 텍스트 프롬프트 | 이미지 | 이미지당 $0.12 |
| Vertex 가상 테스트 | 다양한 옷을 입은 사람들의 이미지를 생성하세요. | 사람 이미지 1개와 의류 이미지 1개 | 이미지 | 이미지당 $0.06 |
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
Veo
Veo는 다양한 주제와 스타일로 놀라울 정도로 고품질의 동영상을 제작하며, 실제 물리 법칙과 인간의 움직임 및 표현의 뉘앙스에 대한 이해도를 높입니다.
| 모델 | 기능 | 설명 | 입력 | 출력 | 출력 해상도 | 가격 |
|---|---|---|---|---|---|---|
| Veo 3.1 | 동영상 + 오디오 생성 | 텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 + 오디오 | 720p, 1080p | $0.40/초 |
| Veo 3.1 | 동영상 생성 | 텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 720p, 1080p | $0.20/초 |
| Veo 3.1 Fast | 동영상 + 오디오 생성 | 텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성 | 텍스트/이미지 프롬프트 | 동영상 + 오디오 | 720p, 1080p | $0.15/초 |
| Veo 3.1 Fast | 동영상 생성 | 텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 720p, 1080p | $0.10/초 |
| Veo 3 | 동영상 + 오디오 생성 | 텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 + 오디오 | 720p, 1080p | $0.40/초 |
| Veo 3 | 동영상 생성 | 텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 720p, 1080p | $0.20/초 |
| Veo 3 Fast | 동영상 + 오디오 생성 | 텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성 | 텍스트/이미지 프롬프트 | 동영상 + 오디오 | 720p, 1080p | $0.15/초 |
| Veo 3 Fast | 동영상 생성 | 텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 720p, 1080p | $0.10/초 |
| Veo 2 | 동영상 생성 | 텍스트 프롬프트 또는 참고 이미지에서 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 720p | $0.50/초 |
| Veo 2 | 고급 제어 | 시작 및 종료 프레임 보간을 통해 동영상을 생성하고, 생성된 동영상을 확장하고, 카메라 컨트롤을 적용합니다. | 텍스트/이미지/동영상 프롬프트 | 동영상 | 720p | $0.50/초 |
Lyria
Lyria 2는 정교한 작곡과 세밀한 창의적 탐색에 이상적인 고품질 악기 음악을 생성하며, 미묘한 뉘앙스가 중요한 출력에 적합합니다.
| 모델 | 기능 | 설명 | 입력 | 출력 | 가격 |
|---|---|---|---|---|---|
| Lyria 2 | 음악 생성 | 텍스트 프롬프트에서 음악 생성 | 텍스트 프롬프트 | 음악 | 30초당 $0.06 |
AI 애플리케이션의 임베딩 비용 이해
| 모델 | 유형 | 리전 | 입력 토큰 1,000개당 가격 |
|---|---|---|---|
| Gemini 임베딩 | 입력 | 전역 |
|
| 출력 | 글로벌 |
|
| 모델 | 유형 | 리전 | 1,000자당 가격 |
|---|---|---|---|
| 텍스트용 임베딩 (Gemini 임베딩 제외) |
입력 | 전역 |
|
| 출력 | 글로벌 |
|
| 모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
|---|---|---|---|---|---|
| multimodalembedding | 멀티모달용 임베딩: 텍스트 | 텍스트를 입력으로 사용하여 임베딩 생성 | 텍스트 | 임베딩 | $0.0002 / 1,000자 입력 |
| 멀티모달용 임베딩: 이미지 | 이미지를 입력으로 사용하여 임베딩 생성 | 이미지 | 임베딩 | $0.0001 / 이미지 입력 | |
| 멀티모달용 임베딩: 동영상 플러스 | Video Plus | 동영상 | 임베딩(동영상 분당 최대 15개의 임베딩) | 동영상 초당 $0.0020 | |
| 멀티모달용 임베딩: 동영상 표준 | Video Standard | 동영상 | 임베딩(동영상 분당 최대 8개의 임베딩) | 동영상 초당 $0.0010 | |
| 멀티모달용 임베딩: 동영상 필수사항 | Video Essential | 동영상 | 임베딩(동영상 분당 최대 4개의 임베딩) | 동영상 초당 $0.0005 |
| 오픈소스 모델 | 유형 | 입력 토큰 1,000개당 가격 |
|---|---|---|
| multilingual-e5-small | 입력: 출력: 일괄 입력: 일괄 출력: |
온라인 요청: $0.000015 온라인 요청: 무료 일괄 요청: $0.0000075 일괄 요청: 무료 |
| multilingual-e5-large | 입력: 출력: 일괄 입력: 일괄 출력: |
온라인 요청: $0.000025 온라인 요청: 무료 일괄 요청: $0.0000125 일괄 요청: 무료 |
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
Vertex AI의 코드 완성 가격 책정
Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.
| 모델 | 유형 | 리전 | 1,000자당 가격 |
|---|---|---|---|
| 코드 완성용 Codey | 입력 | 글로벌 |
|
| 출력 | 글로벌 |
|
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
번역 (텍스트)
Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 유창하고 인간의 언어에 가깝지만, 언어 지원이 더 제한적입니다 (자세히 알아보기).
| 모델 | 메서드 | 사용 | 백만 자당 가격 |
|---|---|---|---|
| LLM | 텍스트 번역* | 월별 입력 문자 수 |
백만 자당 $10* |
| 월별 출력 문자 수 |
백만 자당 $10* |
가격은 미국 달러(USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
*가격은 모델에서 처리한 문자 수를 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.
명시적 캐싱의 컨텍스트 캐시 스토리지 가격
| 모델 | 기능 | 유형 | 가격(토큰 100만 개당) <= 20만 개의 입력 토큰 |
가격 (/1백만 토큰) > 20만 입력 토큰 |
|---|---|---|---|---|
| Gemini 3 Pro | 컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $4.5 (/M 토큰/시간) | $4.5 (/M 토큰/시간) |
| Gemini 2.5 Pro | 컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $4.5 (/M 토큰/시간) | $4.5 (/M 토큰/시간) |
| Gemini 2.5 Flash | 컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $1 (/M 토큰/시간) | $1 (/M 토큰/시간) |
| Gemini 2.5 Flash Lite | 컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $1 (/M 토큰/시간) | $1 (/M 토큰/시간) |
Gemini 2.0 모델
토큰 기반 가격 책정
모델 |
유형 |
스토리지 (M 토크 시간) |
가격 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 입력 토큰 1백만 개 | $1.00 | $0.0375 | |
| 입력 오디오 토큰 1백만 개 | $1.00 | $0.25 | |
| 1백만 개의 출력 텍스트 토큰 | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.0 Flash Lite |
|||
| 입력 토큰 1백만 개 | $1.00 | $0.01875 | |
| 입력 오디오 토큰 1백만 개 | $1.00 | $0.01875 | |
| 1백만 개의 출력 텍스트 토큰 | 해당 사항 없음 | 해당 사항 없음 |
형식 기반 가격 책정
아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.
- 4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.
- 1024x1024 이미지의 경우 1290개의 토큰을 소비합니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
- 동영상 입력은 초당 1프레임의 샘플링 속도로 초당 258개의 토큰을 소비합니다. 오디오가 포함된 동영상은 동영상 토큰과 오디오 토큰 모두에 대해 요금이 청구됩니다.
- 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.
모델 |
유형 |
스토리지 (모달리티 시간) |
가격 |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 입력 텍스트(문자 백만 개당 비용($)) | $0.25 | $0.009375 | |
| 입력 이미지 ($/이미지) | $0.00129 | $0.000048375 | |
| 입력 동영상 ($/초) | $0.000258 | $0.000009675 | |
| 입력 오디오 ($/초) | $0.000025 | $0.00000625 | |
| 출력 텍스트 (백만 문자당 $) | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.0 Flash Lite |
|||
| 입력 텍스트(문자 백만 개당 비용($)) | $0.25 | $0.0046875 | |
| 입력 이미지 ($/이미지) | $0.00129 | $0.0000241875 | |
| 입력 동영상 ($/초) | $0.000258 | $0.000009675 | |
| 입력 오디오 ($/초) | $0.000258 | $0.0000048375 | |
| 출력 텍스트 (백만 문자당 $) | 해당 사항 없음 | 해당 사항 없음 | |
Google 검색을 사용한 그라운딩 |
Gemini 2.0 Flash에는 일일 최대 1,500개의 그라운딩된 요청이 추가 비용 없이 포함되어 있습니다. 일일 1,500회를 초과하는 그라운딩된 요청 은 요청 1,000회당 35달러의 요금이 청구됩니다 (일일 최대 100만 회). 하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||
엔터프라이즈용 웹 그라운딩 |
2025년 5월 5일부터 요청 1,000개당 $45 (일일 최대 요청 100만 개) 하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 이용한 그라운딩은 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과를 반환하는 요청에 대해서만 요금이 청구됩니다. Gemini Standard 모델 사용료도 적용됩니다.
프로비저닝된 처리량
프로비저닝된 처리량은 생성형 AI 요구사항에 대한 처리량을 보장하며 생성형 AI 확장 단위(GSU)를 통해 거래됩니다. 각 GSU가 제공하는 처리량에 대해 여기에서 자세히 알아보고 여기에서 온라인 추정기를 사용해 보세요.
| 기간 | GSU당 가격 | |
|---|---|---|
| 1주 커밋 | $1,200 | 주 |
| 1개월 약정 | $2,700 | 월 |
| 3개월 약정 | $2,400 | 월 |
| 1년 약정 | $2,000 | 월 |
비용 계산 예시
사용자는 gemini-2.0-flash를 사용하여 텍스트 토큰 1,000개와 오디오 토큰 500개의 입력으로 초당 10개의 쿼리 (QPS)를 지원하여 텍스트 토큰 300개의 출력을 수신할 수 있는지 확인해야 합니다.
gemini-2.0-flash의 처리량 및 소진율 표를 사용하면 입력 텍스트 토큰의 소진율은 1토큰, 입력 오디오 토큰의 소진율은 7토큰, 출력 텍스트 토큰의 소진율은 4토큰임을 알 수 있습니다.
사용자의 총 입력 토큰은 1,000* (입력 텍스트 토큰당 1개 토큰) + 500* (입력 오디오 토큰당 7개 토큰) = 소진 조정 입력 토큰 4,500개입니다. 사용자의 총 출력 토큰은 300* (출력 텍스트 토큰당 4개 토큰) = 소진 조정 출력 토큰 1,200개입니다. 이를 합하면 소진 조정 입력 토큰 4,500개 + 소진 조정 출력 토큰 1,200개 = 쿼리당 총 토큰 5,700개가 됩니다.
쿼리당 총 토큰에 QPS를 곱하면 쿼리당 총 토큰 5,700개 * 10 QPS = 초당 총 토큰 57,000개가 됩니다.
이를 GSU당 초당 총 처리량으로 나누면 초당 총 토큰 57,000개 ÷ GSU당 초당 처리량 3,360개 = GSU 16.96개가 됩니다. 이 모델의 최소 GSU 구매 증분은 1이므로 사용자에게는 17개의 GSU가 필요합니다.
사용자가 1주일 동안 이 처리량을 유지하려면 주당 $1,200 * 17 GSU = $20,400의 비용이 듭니다. 이 처리량을 1개월 동안 유지하려면 월 $2,700 * 17 GSU = $45,900의 비용이 듭니다. 이 처리량을 3개월 동안 유지하려면 월 $2,400 * 17 GSU = $40,800의 비용이 듭니다. 마지막으로, 이 처리량을 1년 동안 유지하려면 월 $2,000 * 17 GSU = $34,000의 비용이 듭니다.
모델 조정
모델 조정은 대규모 모델을 태스크에 맞게 맞춤설정할 수 있는 효과적인 방법입니다. 이는 모델의 품질과 효율성을 개선하기 위한 핵심 단계입니다. 모델 조정 이점은 다음과 같습니다.
- 특정 태스크의 품질 개선
- 모델의 안정성 향상
- 짧아진 프롬프트로 인한 추론 지연 시간 단축 및 비용 절감
조정은 학습 토큰 100만 개당 요금이 청구됩니다. 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다. 모델 추론의 경우 Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
| 모델 | 유형 | 가격(백만 학습 토큰당) |
|---|---|---|
| Gemini 2.5 Pro | 지도 미세 조정 | $25 |
| Gemini 2.5 Flash | 지도 미세 조정 선호도 조정 |
$5 |
| Gemini 2.5 Flash Lite | 지도 미세 조정 선호도 조정 |
$1.5 |
| Gemma 3 27B IT | 지도 미세 조정 | $6.83 |
| Llama 3.1 8B | 지도 미세 조정 | $0.67 |
| Llama 3.2 1B | 지도 미세 조정 | $0.28 |
| Llama 3.2 3B | 지도 미세 조정 | $0.61 |
| Llama 3.3 70B | 지도 미세 조정 | 6.72달러 |
| Llama 4 Scout 17B 16E | 지도 미세 조정 | $5.77 |
| Qwen3 32B | 지도 미세 조정 | $6.57 |
* 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
* Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
Vertex AI의 파트너 모델 가격 비교
파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.
AI21 Lab의 모델
| 모델 | 가격 책정 |
|---|---|
| Jamba 1.5 Large (지원 중단됨) | 입력: 토큰 100만 개당 $2 출력: 토큰 100만 개당 $8 |
| Jamba 1.5 Mini (지원 중단됨) | 입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.40 |
Anthropic의 Claude 모델
지역별 가격 책정 모델
전역
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Opus 4.5 | 입력: $5.00 출력: $25.00 일괄 입력: $2.50 일괄 출력: $12.50 5분 캐시 쓰기: $6.25 1시간 캐시 쓰기: $10.00 캐시 적중: $0.50 5분 일괄 캐시 쓰기: $3.125 1시간 일괄 캐시 쓰기: $5.00 일괄 캐시 적중: $0.25 |
|
| Claude Sonnet 4.5 | 입력: $3.00 출력: $15.00 일괄 입력: $1.50 일괄 출력: $7.50 5분 캐시 쓰기: $3.75 1시간 캐시 쓰기: $6.00 캐시 적중: $0.30 일괄 캐시 쓰기: $1.88 일괄 캐시 적중: $0.15 |
입력: $6.00 출력: $22.50 일괄 입력: $3.00 일괄 출력: $11.25 5분 캐시 쓰기: $7.50 1시간 캐시 쓰기: $12.00 캐시 적중: $0.60 일괄 캐시 쓰기: $3.75 일괄 캐시 적중: $0.30 |
| Claude Haiku 4.5 | 입력: $1.00 출력: $5.00 일괄 입력: $0.50 일괄 출력: $2.50 5분 캐시 쓰기: $1.25 1시간 캐시 쓰기: $2.00 캐시 적중: $0.10 일괄 캐시 쓰기: $0.625 일괄 캐시 적중: $0.05 |
us-east5
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Opus 4.5 | 입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275 |
|
| Claude Sonnet 4.5 | 입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17 |
입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33 |
| Claude Haiku 4.5 | 입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 쓰기: $1.375 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055 |
europe-west1
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Opus 4.5 | 입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275 |
|
| Claude Sonnet 4.5 | 입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17 |
입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33 |
| Claude Haiku 4.5 | 입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055 |
asia-southeast1
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Opus 4.5 | 입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275 |
|
| Claude Sonnet 4.5 | 입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17 |
입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33 |
asia-east1
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Haiku 4.5 | 입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 쓰기: $1.375 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055 |
* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
모든 리전에서 동일한 가격 책정 모델
| 모델 | 가격 (/1백만 토큰) < 20만 입력 토큰 | 가격 (/1백만 토큰) >= 20만 입력 토큰 |
|---|---|---|
| Claude Opus 4.1 | 입력: $15 출력: $75 일괄 입력: $7.50 일괄 출력: $37.50 5분 캐시 쓰기: $18.75 1시간 캐시 쓰기: $30 캐시 적중: $1.50 일괄 캐시 쓰기: $9.375 일괄 캐시 적중: $0.75 |
해당 사항 없음 |
| Claude Opus 4 | 입력: $15 출력: $75 일괄 입력: $7.50 일괄 출력: $37.50 5분 캐시 쓰기: $18.75 1시간 캐시 쓰기: $30 캐시 적중: $1.50 일괄 캐시 쓰기: $9.375 일괄 캐시 적중: $0.75 |
해당 사항 없음 |
| Claude Sonnet 4 | 입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 5분 캐시 쓰기: $3.75 1시간 캐시 쓰기: $6.00 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15 |
입력: $6 출력: $22.50 일괄 입력: $3 일괄 출력: $11.25 5분 캐시 쓰기: $7.50 1시간 캐시 쓰기: $12.00 캐시 적중: $0.60 일괄 캐시 쓰기: $3.75 일괄 캐시 적중: $0.30 |
| Claude 3.5 Haiku | 입력: $0.80 출력: $4 일괄 입력: $0.40 일괄 출력: $2 5분 캐시 쓰기: $1 1시간 캐시 쓰기: $1.60 캐시 적중: $0.08 일괄 캐시 쓰기: $0.50 일괄 캐시 적중: $0.04 |
해당 사항 없음 |
| Claude 3 Haiku | 입력: $0.25 출력: $1.25 5분 캐시 쓰기: $0.30 1시간 캐시 쓰기: $0.50 캐시 적중: $0.03 | 해당 사항 없음 |
| Claude 3.7 Sonnet (지원 중단됨) | 입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 캐시 쓰기: $3.75 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15 |
해당 사항 없음 |
| Claude 3.5 Sonnet v2 (지원 중단됨) | 입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 캐시 쓰기: $3.75 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15 |
해당 사항 없음 |
| Claude 3.5 Sonnet (지원 중단됨) | 입력: $3 출력: $15 캐시 쓰기: $3.75 캐시 적중: $0.30 |
해당 사항 없음 |
| Claude 3 Opus (지원 중단) | 입력: $15 출력: $75 캐시 쓰기: $18.75 캐시 적중: $1.50 |
해당 사항 없음 |
* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
도구 가격 책정
| 도구 | 가격 |
|---|---|
| 웹 검색 요청 | 검색 1,000회당$10
지원되는 모델: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, Claude Opus 4 |
* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
Deepseek의 모델
| 모델 | 가격 책정 |
|---|---|
| DeepSeek-V3.1 | 입력: 토큰 100만 개당 $0.60 출력: 토큰 100만 개당 $1.70 일괄 입력: 토큰 100만 개당 $0.30 일괄 출력: 토큰 100만 개당 $0.85 |
| DeepSeek-V3.2 * | 입력: 토큰 100만 개당 $0.56 출력: 토큰 100만 개당 $1.68 일괄 입력: 토큰 100만 개당 $0.28 일괄 출력: 토큰 100만 개당 $0.84 |
| DeepSeek-R1 (0528) | 입력: 토큰 100만 개당 $1.35 출력: 토큰 100만 개당 $5.40 일괄 입력: 토큰 100만 개당 $0.675 일괄 출력: 토큰 100만 개당 $2.70 |
| DeepSeek-OCR | 입력: 토큰 100만 개당 $0.30 (또는 페이지당 $0.0003) 출력: 토큰 100만 개당 $1.20 (또는 페이지당 $0.00012) |
- 2025년 12월 17일까지 무료로 사용할 수 있습니다.
MiniMax의 모델
| 모델 | 가격 책정 |
|---|---|
| MiniMax-M2 | 입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $1.20 |
Moonshot의 모델
| 모델 | 가격 책정 |
|---|---|
| Kimi-K2-Thinking | 입력: 토큰 100만 개당 $0.60 출력: 토큰 100만 개당 $2.50 |
Qwen 모델
| 모델 | 가격 책정 |
|---|---|
| Qwen3-Next-80B-Thinking | 입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $1.20 |
| Qwen3-Next-80B-Instruct | 입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $1.20 |
| Qwen3-Coder-480B-A35B-Instruct | 입력: 토큰 100만 개당 $0.22 출력: 토큰 100만 개당 $1.80 일괄 입력: 토큰 100만 개당 $0.11 일괄 출력: 토큰 100만 개당 $0.90 |
| Qwen3-235B-A22B-Instruct-2507 | 입력: 토큰 100만 개당 $0.22 출력: 토큰 100만 개당 $0.88 일괄 입력: 토큰 100만 개당 $0.11 일괄 출력: 토큰 100만 개당 $0.44 |
OpenAI 모델
| 모델 | 가격 책정 |
|---|---|
| gpt-oss-120b | 입력: 토큰 100만 개당 $0.09 출력: 토큰 100만 개당 $0.36 일괄 입력: 토큰 100만 개당 $0.045 일괄 출력: 토큰 100만 개당 $0.18 |
| gpt-oss-20b | 입력: 토큰 100만 개당 $0.07 출력: 토큰 100만 개당 $0.25 일괄 입력: 토큰 100만 개당 $0.035 일괄 출력: 토큰 100만 개당 $0.125 |
Meta의 Llama 모델
| 모델 | 가격 책정 |
|---|---|
| Llama 3.1 405B | 입력: 토큰 100만 개당 $5.00 출력: 토큰 100만 개당 $16.00 |
| Llama 3.3 70B | 입력: 토큰 100만 개당 $0.72 출력: 토큰 100만 개당 $0.72 일괄 입력: 토큰 100만 개당 $0.36 일괄 출력: 토큰 100만 개당 $0.36 |
| Llama 4 Scout | 입력: 100만 토큰당 $0.25 출력: 100만 토큰당 $0.70 일괄 입력: 100만 토큰당 $0.125 일괄 출력: 100만 토큰당 $0.35 |
| Llama 4 Maverick | 입력: 토큰 100만 개당 $0.35 출력: 토큰 100만 개당 $1.15 일괄 입력: 토큰 100만 개당 $0.175 일괄 출력: 토큰 100만 개당 $0.575 |
Mistral AI 모델
| 모델 | 가격 책정 |
|---|---|
| Mistral OCR(25.05) | 입력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005) 출력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005) |
| Mistral Medium 3 | 입력: 토큰 100만 개당 $0.40 출력: 토큰 100만 개당 $2.00 |
| Mistral Small 3.1(25.03) | 입력: 토큰 100만 개당 $0.10 출력: 토큰 100만 개당 $0.30 |
| Mistral Large (24.11) (지원 중단) | 입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00 |
| Codestral 2 | 입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90 |
| Codestral (25.01) (지원 중단) | 입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90 |