Vertex AI에서 AI 모델을 빌드하고 배포하는 비용

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

200 응답 코드를 반환하는 요청에 대해서만 요금이 청구됩니다. 4xx 및 5xx 코드와 같은 다른 응답 코드를 반환하는 요청에는 입력 또는 출력에 대한 요금이 청구되지 않습니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini 3

모델	유형	가격 (/1백만 토큰) <= 200,000개 입력 토큰	가격 (/1백만 토큰) > 200,000개 입력 토큰	가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰	가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰	가격(/1백만 토큰) <= 20만 개의 입력 토큰(일괄 API 사용)	가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰
Gemini 3 Pro 프리뷰
	입력 (텍스트, 이미지, 동영상, 오디오)	$2	$4	$0.2	$0.4	$1	$2
	텍스트 출력 (대답 및 추론)	$12	$18	해당 사항 없음	해당 사항 없음	$6	$9
	이미지 출력**	$120	해당 사항 없음	해당 사항 없음	해당 사항 없음	$60	해당 사항 없음
Gemini 3 Flash 프리뷰
	입력(텍스트, 이미지, 동영상)	$0.5	$0.5	$0.05	$0.05	$0.25	$0.25
	입력 (오디오)	$1	$1	$0.1	$0.1	$0.5	$0.5
	텍스트 출력 (대답 및 추론)	$3	$3	해당 사항 없음	해당 사항 없음	$1.5	$1.5
Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩	모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다. 이러한 한도를 초과하는 검색 쿼리는 검색 쿼리 1,000개당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 검색 (또는 Enterprise용 웹 그라운딩)에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 개별 검색 쿼리마다 요금이 청구됩니다. 요금 청구는 2026년 1월 5일부터 시작됩니다. Google 검색을 사용한 그라운딩 또는 엔터프라이즈용 웹 그라운딩에서 제공하는 입력 토큰에는 요금이 청구되지 않습니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
Google 지도를 사용한 그라운딩	모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다. 이 한도를 초과하는 Maps 쿼리는 쿼리 1,000개당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 지도에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 각 개별 쿼리에 대해 요금이 청구됩니다. 2026년 1월 5일부터 청구 시작 Google 지도에서 제공하는 입력 토큰은 청구되지 않습니다.
데이터를 사용한 그라운딩	프롬프트 1,000개당 $2.50

* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
** 1K (1024x1024) 및 2K (2048x2048) 출력 이미지는 1,120개의 이미지 출력 토큰을 소비하며, 이는 이미지 생성당 $0.134에 해당합니다. 4K (4096x4096) 이미지는 2,000개의 이미지 출력 토큰을 소비하며, 이는 이미지당 $0.24에 해당합니다.

Gemini 2.5

모델	유형	가격 (/1백만 토큰) <= 200,000개 입력 토큰	가격 (/1백만 토큰) > 200,000개 입력 토큰	가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰	가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰	가격(/1백만 토큰) <= 20만 개의 입력 토큰(일괄 API 사용)	가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰
Gemini 2.5 Pro
	입력 (텍스트, 이미지, 동영상, 오디오)	$1.25	$2.5	$0.125	$0.250	$0.625	$1.25
	텍스트 출력 (대답 및 추론)	$10	$15	해당 사항 없음	해당 사항 없음	$5	$7.5
Gemini 2.5 Pro 컴퓨터 사용-프리뷰
	입력 (텍스트, 이미지, 동영상, 오디오)	$1.25	$2.5	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
	텍스트 출력 (대답 및 추론)	$10.00	$15.00	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
Gemini 2.5 Flash
	입력(텍스트, 이미지, 동영상)	$0.30	$0.30	$0.030	$0.030	$0.15	$0.15
	오디오 입력	$1	$1	$0.100	$0.100	$0.5	$0.5
	텍스트 출력 (대답 및 추론)	$2.50	$2.50	해당 사항 없음	해당 사항 없음	$1.25	$1.25
	이미지 출력***	$30	$30	해당 사항 없음	해당 사항 없음	$15	$15
Gemini 2.5 Flash Live API
	입력 텍스트 토큰 1백만 개	$0.5	$0.5	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
	입력 오디오 토큰 1백만 개	$3	$3	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
	입력 동영상/이미지 토큰 1백만 개	$3	$3	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
	출력 텍스트 토큰 100만 개	$2	$2	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
	1백만 개의 출력 오디오 토큰	$12	$12	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
Gemini 2.5 Flash Lite
	입력(텍스트, 이미지, 동영상)	$0.1	$0.1	$0.010	$0.010	$0.05	$0.05
	오디오 입력	$0.3	$0.3	$0.030	$0.030	$0.15	$0.15
	텍스트 출력 (대답 및 추론)	$0.4	$0.4	해당 사항 없음	해당 사항 없음	$0.2	$0.2
Google 검색을 사용한 그라운딩	Gemini 2.0 Flash, 2.5 Flash, 2.5 Flash-Lite에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. Gemini 2.5 Pro에는 하루에 10,000개의 그라운딩된 프롬프트가 추가 비용 없이 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 검색에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다&ast;&ast;. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다**. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터를 사용한 그라운딩	요청 1,000개당 $2.5
Google 지도를 사용한 그라운딩	1,000개의 그라운딩된 프롬프트당 25달러. 그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다.

* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 부과됩니다.
** Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환한 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
*** 1024x1024 이미지의 경우 1290개의 토큰이 사용됩니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
**** Computer Use 청구는 Gemini 2.5 Pro SKU를 사용합니다. Computer Use 비용을 분할하려면 청구 태그를 적용하세요. 자세한 내용은 여기를 참조하세요.

LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
능동적 오디오 모드: 사용 설정하면 LiveAPI가 수신 대기하는 동안 입력 토큰이 청구됩니다. 출력 토큰은 API가 응답할 때만 요금이 청구됩니다.
오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.

Gemini 2.0

Gemini 2.0은 토큰을 기준으로 요금이 청구됩니다. 요청을 보내기 전에 요청의 입력 토큰 수를 계산하려면 SDK 토크나이저 또는 countTokens API를 사용하면 됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.

가격 책정 표의 전환 버튼을 사용하여 토큰 기반 가격 책정과 모달리티 기반 가격 책정을 비교해 보세요.

토큰 기반 가격 책정

모델	유형	가격	Batch API 가격
Gemini 2.0 Flash
	입력 토큰 1백만 개	$0.15	$0.075
	입력 오디오 토큰 1백만 개	$1.00	$0.50
	1백만 개의 출력 텍스트 토큰	$0.60	$0.30
	1백만 학습 토큰에 대한 튜닝	$3.00
Gemini 2.0 Flash 이미지 생성
	입력 토큰 1백만 개	$0.15
	입력 오디오 토큰 1백만 개	$1.00
	입력 동영상 토큰 1백만 개	$3
	출력 텍스트 토큰 100만 개	$0.60
	1백만 개의 출력 이미지 토큰	$30.00
Gemini 2.0 Flash Live API
	입력 텍스트 토큰 1백만 개	$0.5
	입력 오디오 토큰 1백만 개	$3
	입력 동영상/이미지 토큰 1백만 개	$3
	출력 텍스트 토큰 100만 개	$2
	1백만 개의 출력 오디오 토큰	$12
Gemini 2.0 Flash Lite
	입력 토큰 1백만 개	$0.075	$0.0375
	입력 오디오 토큰 1백만 개	$0.075	$0.0375
	1백만 개의 출력 텍스트 토큰	$0.30	$0.15
	1백만 학습 토큰에 대한 튜닝	$1.00
Google 검색을 사용한 그라운딩	Gemini 2.0 Flash 및 2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, Google 검색에 하나 이상의 쿼리를 만듭니다.* 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터를 사용한 그라운딩	2025년 6월 16일부터 요청 1,000개당 $2.5
Google 지도 기반 그라운딩	Gemini 모델에는 추가 비용 없이 사용할 수 있는 여러 개의 그라운딩된 일일 프롬프트가 포함되어 있습니다. Gemini Flash 및 Flash-Lite: 하루에 1,500개의 그라운딩된 프롬프트(합산) Gemini Pro: 하루에 10,000개의 그라운딩된 프롬프트 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$25의 요금이 청구됩니다. 그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

형식 기반 가격 책정

아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.

4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.

1024x1024 이미지의 경우 1290개의 토큰을 소비합니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.

동영상 입력은 초당 1프레임의 샘플링 속도로 초당 258개의 토큰을 소비합니다. 오디오가 포함된 동영상은 동영상 토큰과 오디오 토큰 모두에 대해 요금이 청구됩니다.

오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.

모델	유형	가격	Batch API 가격
Gemini 2.0 Flash
	입력 텍스트(문자 백만 개당 비용($))	$0.0375	$0.01875
	입력 이미지 ($/이미지)	$0.0001935	$0.00009675
	입력 동영상 ($/초)	$0.0000387	$0.00001935
	입력 오디오 ($/초)	$0.000025	$0.0000125
	출력 텍스트 (백만 문자당 $)	$0.15	$0.075
Gemini 2.0 Flash 이미지 생성
	입력 텍스트(문자 백만 개당 비용($))	$0.0375
	입력 이미지 ($/이미지)	$0.0001935
	입력 동영상 ($/초)	$0.0000387
	입력 오디오 ($/초)	$0.000025
	출력 텍스트 (백만 문자당 $)	$0.15
	출력 이미지 이미지 (이미지당 $)	$0.04
Gemini 2.0 Flash Lite
	입력 텍스트(문자 백만 개당 비용($))	$0.01875	$0.009375
	입력 이미지 ($/이미지)	$0.00009675	$0.000048375
	입력 동영상 ($/초)	$0.00001935	$0.000009675
	입력 오디오 ($/초)	$0.000001875	$0.000000938
	출력 텍스트 (백만 문자당 $)	$0.075	$0.0375
Google 검색을 사용한 그라운딩	Gemini 2.0 Flash 및 2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, Google 검색에 하나 이상의 쿼리를 만듭니다.* 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
* Gemini 2.0 Flash Live API: 오디오 (입력/출력) 초당 25개 토큰, 동영상 (입력) 초당 258개 토큰 Gemini 2.0 Flash Live API가 프리뷰 버전으로 제공되는 동안에는 Google 검색을 사용한 그라운딩이 무료로 제공됩니다.

LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.

Vertex AI Model Optimizer 가격 책정 (실험용)*

Vertex AI Model Optimizer는 Gemini 모델 요청을 위한 단일 메타 엔드포인트를 제공하여 엔터프라이즈 고객의 Gemini 사용을 간소화합니다. 이 서비스를 사용하는 고객은 Flash, Pro 또는 특정 버전을 사용할지 지정할 필요가 없습니다. 대신 구성 가능한 설정 (비용, 품질 또는 균형)을 제공하여 선호도를 나타내면 Model Optimizer가 각 쿼리를 가장 적합한 모델로 전송하여 작업에 적합한 수준의 인텔리전스를 적용합니다.

Vertex AI Model Optimizer는 동적 가격 책정을 적용합니다. 즉, 토큰당 평균 가격은 작업을 완료하는 데 적용되는 모델 인텔리전스 수준에 따라 달라집니다. 따라서 아래 표에 구성 설정을 기반으로 한 예상 시나리오를 보여주는 가격 책정 예시를 제공합니다. Model Optimizer SKU는 결제에 적용하기 위한 구매 단위로 기능하는 $1 SKU이며, 모델을 사용한 후에도 사용량 기준으로 요금이 청구됩니다.

5:1 I/O 비율	예시 1 챗봇	참고: 이 범위는 보장되지 않으며 개별 고객의 결과는 다를 수 있습니다.
고객 선호도	MO에 전송된 고객 입력 토큰	MO로 전송된 고객 출력 토큰	토큰 100만 개당 평균 입력 가격 (높은 범위)	토큰 100만 개당 평균 출력 가격 (높은 범위)	토큰 100만 개당 평균 입력 가격 (낮은 범위)	토큰 100만 개당 평균 출력 가격 (낮은 범위)
비용	10,000,000	2,000,000	$0.63	$2.50	$0.16	$0.63
균형	10,000,000	2,000,000	$1.26	$5.00	$0.63	$2.50
품질	10,000,000	2,000,000	$1.89	$7.50	$1.26	$5.00

1:20 I/O 비율	예 2 콘텐츠 생성
고객 선호도	MO에 전송된 고객 입력 토큰	MO로 전송된 고객 출력 토큰	토큰 100만 개당 평균 입력 가격 (높은 범위)	토큰 100만 개당 평균 출력 가격 (높은 범위)	토큰 100만 개당 평균 입력 가격 (낮은 범위)	토큰 100만 개당 평균 출력 가격 (낮은 범위)
비용	1,000,000	20,000,000	$0.63	$2.50	$0.16	$0.63
균형	1,000,000	20,000,000	$1.26	$5.00	$0.63	$2.50
품질	1,000,000	20,000,000	$1.89	$7.50	$1.26	$5.00

* 모델 옵티마이저는 유료 실험 버전으로, Vertex의 Gemini 실험 버전에 요청을 라우팅할 수 있습니다.

기타 Gemini 모델

Gemini 2.0 또는 Gemini 2.5를 제외한 모든 Gemini 모델은 문자, 이미지, 동영상/오디오 초와 같은 모달리티를 기준으로 요금이 청구됩니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 토큰당 약 4개의 문자가 포함됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.

모델	기능	유형	가격 ( 입력 토큰 128,000개 이하)	가격 (입력 토큰 128,000개 초과)
Gemini 1.5 Flash	멀티모달	이미지 입력 동영상 입력 텍스트 입력 오디오 입력	$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자 $0.000002 / 초	$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자 $0.000004 / 초
		텍스트 출력	$0.000075 / 1000자	$0.00015 / 1,000자
	조정*	학습 토큰	토큰 백만 개당 8달러
Gemini 1.5 Pro	멀티모달	이미지 입력 동영상 입력 텍스트 입력 오디오 입력	$0.00032875 / 이미지 $0.00032875 / 초 $0.0003125 / 1,000자 $0.00003125 / 초	$0.0006575 / 이미지 $0.0006575 / 초 $0.000625 / 1,000자 $0.0000625 / 초
		텍스트 출력	$0.00125 / 1000자	$0.0025 / 1,000자
	조정*	학습 토큰	토큰 백만 개당 80달러
Gemini 1.0 Pro	멀티모달	이미지 입력 동영상 입력 텍스트 입력	$0.0025/이미지 $0.002/초 $0.000125/1,000자
Gemini 1.0 Pro		텍스트 출력	$0.000375/1000자
Google 검색을 사용하는 그라운딩	텍스트	그라운딩된 프롬프트 1,000개당 35달러. 그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	텍스트	그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈용 웹 그라운딩에 하나 이상의 쿼리를 만듭니다*. 여러 검색어가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대해서는 한 번만 요금이 청구됩니다. 하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터를 사용한 그라운딩	텍스트	2025년 6월 16일부터 요청 1,000개당 $2.5의 요금이 청구됩니다.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128, 000개 토큰보다 길면 모든 토큰에 긴 컨텍스트 요금이 청구됩니다.
* Gemini 모델은 일괄 모드에서 50% 할인된 가격으로 제공됩니다.
* Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.

Imagen

Vertex AI 기반 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.

모델	기능	Description(설명)	입력	출력	가격
Imagen 4 Ultra	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.06
Imagen 4	업스케일링	생성된 이미지의 해상도를 2K, 3K, 4K로 높입니다.	이미지	이미지	이미지당 $0.06
Imagen 4	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.04
Imagen 4 Fast	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.02
Imagen 3	이미지 생성	이미지 생성 이미지 수정 이미지 맞춤설정	텍스트 프롬프트	이미지	이미지당 $0.04
Imagen 3 Fast	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.02
Imagen 2, Imagen 1	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.020
Imagen 2, Imagen 1	이미지 수정	마스크 없음 또는 마스크 방식을 사용하여 이미지 수정	이미지/텍스트 프롬프트	이미지	이미지당 $0.020
Imagen 1	업스케일링	생성된 이미지의 해상도를 2k 및 4k로 높입니다.	이미지	이미지	이미지당 $0.003
Imagen 1	세부 조정	사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정	텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제	미세 조정된 모델(사용자 제공 주제로 학습한 후)	노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
Imagen	시각적 캡셔닝	이미지에 대한 짧거나 긴 텍스트 설명 생성	이미지	텍스트 캡션	$0.0015/이미지
Imagen	시각적 질의 응답	이미지를 참조하는 질문에 따라 답변 제공	이미지/텍스트 프롬프트	텍스트 대답	$0.0015/이미지
Imagen	제품 재맥락화	새로운 장면에서 제품을 재해석하세요	동일한 제품의 이미지 1~3개와 원하는 장면을 설명하는 텍스트 프롬프트	이미지	이미지당 $0.12
	Vertex 가상 테스트	다양한 옷을 입은 사람들의 이미지를 생성하세요.	사람 이미지 1개와 의류 이미지 1개	이미지	이미지당 $0.06

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

Veo

Veo는 다양한 주제와 스타일로 놀라울 정도로 고품질의 동영상을 제작하며, 실제 물리 법칙과 인간의 움직임 및 표현의 뉘앙스에 대한 이해도를 높입니다.

모델	기능	설명	입력	출력	출력 해상도	가격
Veo 3.1	동영상 + 오디오 생성	텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성	텍스트/이미지 프롬프트	동영상 + 오디오	720p, 1080p	$0.40/초
Veo 3.1	동영상 생성	텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성	텍스트/이미지 프롬프트	동영상	720p, 1080p	$0.20/초
Veo 3.1 Fast	동영상 + 오디오 생성	텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성	텍스트/이미지 프롬프트	동영상 + 오디오	720p, 1080p	$0.15/초
Veo 3.1 Fast	동영상 생성	텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성	텍스트/이미지 프롬프트	동영상	720p, 1080p	$0.10/초
Veo 3	동영상 + 오디오 생성	텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성	텍스트/이미지 프롬프트	동영상 + 오디오	720p, 1080p	$0.40/초
Veo 3	동영상 생성	텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성	텍스트/이미지 프롬프트	동영상	720p, 1080p	$0.20/초
Veo 3 Fast	동영상 + 오디오 생성	텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성	텍스트/이미지 프롬프트	동영상 + 오디오	720p, 1080p	$0.15/초
Veo 3 Fast	동영상 생성	텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성	텍스트/이미지 프롬프트	동영상	720p, 1080p	$0.10/초
Veo 2	동영상 생성	텍스트 프롬프트 또는 참고 이미지에서 동영상 생성	텍스트/이미지 프롬프트	동영상	720p	$0.50/초
Veo 2	고급 제어	시작 및 종료 프레임 보간을 통해 동영상을 생성하고, 생성된 동영상을 확장하고, 카메라 컨트롤을 적용합니다.	텍스트/이미지/동영상 프롬프트	동영상	720p	$0.50/초

Lyria

Lyria 2는 정교한 작곡과 세밀한 창의적 탐구에 이상적인 고품질 악기 음악을 생성하며, 미묘한 뉘앙스가 중요한 결과물을 만들어 냅니다.

모델	기능	설명	입력	출력	가격
Lyria 2	음악 생성	텍스트 프롬프트에서 음악 생성	텍스트 프롬프트	음악	30초당 $0.06

AI 애플리케이션의 임베딩 비용 이해

모델	유형	리전	입력 토큰 1,000개당 가격
Gemini 임베딩	입력	전역	온라인 요청: $0.00015 일괄 요청: $0.00012
Gemini 임베딩	출력	글로벌	온라인 요청: 무료 일괄 요청: 무료

모델	유형	리전	1,000자당 가격
텍스트용 임베딩 (Gemini 임베딩 제외)	입력	전역	온라인 요청: $0.000025 일괄 요청: $0.00002
텍스트용 임베딩 (Gemini 임베딩 제외)	출력	글로벌	온라인 요청: 무료 일괄 요청: 무료

모델	기능	Description(설명)	입력	출력	가격
multimodalembedding	멀티모달용 임베딩: 텍스트	텍스트를 입력으로 사용하여 임베딩 생성	텍스트	임베딩	$0.0002 / 1,000자 입력
	멀티모달용 임베딩: 이미지	이미지를 입력으로 사용하여 임베딩 생성	이미지	임베딩	$0.0001 / 이미지 입력
	멀티모달용 임베딩: 동영상 플러스	Video Plus	동영상	임베딩(동영상 분당 최대 15개의 임베딩)	동영상 초당 $0.0020
	멀티모달용 임베딩: 동영상 표준	Video Standard	동영상	임베딩(동영상 분당 최대 8개의 임베딩)	동영상 초당 $0.0010
	멀티모달용 임베딩: 동영상 필수사항	Video Essential	동영상	임베딩(동영상 분당 최대 4개의 임베딩)	동영상 초당 $0.0005

오픈소스 모델	유형	입력 토큰 1,000개당 가격
multilingual-e5-small	입력: 출력: 일괄 입력: 일괄 출력:	온라인 요청: $0.000015 온라인 요청: 무료 일괄 요청: $0.0000075 일괄 요청: 무료
multilingual-e5-large	입력: 출력: 일괄 입력: 일괄 출력:	온라인 요청: $0.000025 온라인 요청: 무료 일괄 요청: $0.0000125 일괄 요청: 무료

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

Vertex AI의 코드 완성 가격 책정

Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.

모델	유형	리전	1,000자당 가격
코드 완성용 Codey	입력	글로벌	온라인 요청: $0.00025
코드 완성용 Codey	출력	글로벌	온라인 요청: $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

번역 (텍스트)

Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 유창하고 인간의 언어에 가깝지만, 언어 지원이 더 제한적입니다 (자세히 알아보기).

모델	메서드	사용	백만 자당 가격
LLM	텍스트 번역^*	월별 입력 문자 수	백만 자당 $10^*
	텍스트 번역^*	월별 출력 문자 수	백만 자당 $10^*

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
^*가격은 모델에서 처리한 문자 수를 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.

명시적 캐싱의 컨텍스트 캐시 스토리지 가격

모델	기능	유형	가격(토큰 100만 개당) <= 20만 개의 입력 토큰	가격 (/1백만 토큰) > 20만 입력 토큰
Gemini 3 Pro	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$4.5 (/M 토큰/시간)	$4.5 (/M 토큰/시간)
Gemini 2.5 Pro	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$4.5 (/M 토큰/시간)	$4.5 (/M 토큰/시간)
Gemini 2.5 Flash	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$1 (/M 토큰/시간)	$1 (/M 토큰/시간)
Gemini 2.5 Flash Lite	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$1 (/M 토큰/시간)	$1 (/M 토큰/시간)

Gemini 2.0 모델

토큰 기반 가격 책정

모델	유형	스토리지 (M 토큰 시간)	가격
Gemini 2.0 Flash
	입력 토큰 1백만 개	$1.00	$0.0375
	입력 오디오 토큰 1백만 개	$1.00	$0.25
	1백만 개의 출력 텍스트 토큰	해당 사항 없음	해당 사항 없음
Gemini 2.0 Flash Lite
	입력 토큰 1백만 개	$1.00	$0.01875
	입력 오디오 토큰 1백만 개	$1.00	$0.01875
	1백만 개의 출력 텍스트 토큰	해당 사항 없음	해당 사항 없음

형식 기반 가격 책정

아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.

4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.

오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.

모델	유형	스토리지 (모달리티 시간)	가격
Gemini 2.0 Flash
	입력 텍스트(문자 백만 개당 비용($))	$0.25	$0.009375
	입력 이미지 ($/이미지)	$0.00129	$0.000048375
	입력 동영상 ($/초)	$0.000258	$0.000009675
	입력 오디오 ($/초)	$0.000025	$0.00000625
	출력 텍스트 (백만 문자당 $)	해당 사항 없음	해당 사항 없음
Gemini 2.0 Flash Lite
	입력 텍스트(문자 백만 개당 비용($))	$0.25	$0.0046875
	입력 이미지 ($/이미지)	$0.00129	$0.0000241875
	입력 동영상 ($/초)	$0.000258	$0.000009675
	입력 오디오 ($/초)	$0.000258	$0.0000048375
	출력 텍스트 (백만 문자당 $)	해당 사항 없음	해당 사항 없음
Google 검색을 사용한 그라운딩	Gemini 2.0 Flash에는 일일 최대 1,500개의 그라운딩된 요청이 추가 비용 없이 포함되어 있습니다. 일일 1,500회를 초과하는 그라운딩된 요청 은 요청 1,000회당 35달러의 요금이 청구됩니다 (일일 최대 100만 회). 하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	2025년 5월 5일부터 요청 1,000개당 $45 (일일 최대 요청 100만 개) 하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 이용한 그라운딩은 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과를 반환하는 요청에 대해서만 요금이 청구됩니다. Gemini Standard 모델 사용료도 적용됩니다.

프로비저닝된 처리량

프로비저닝된 처리량은 생성형 AI 요구사항에 대한 처리량을 보장하며 생성형 AI 확장 단위(GSU)를 통해 거래됩니다. 각 GSU가 제공하는 처리량에 대해 여기에서 자세히 알아보고 여기에서 온라인 추정기를 사용해 보세요.

기간	GSU당 가격	1회
1주 커밋	$1,200	주
1개월 약정	$2,700	월
3개월 약정	$2,400	월
1년 약정	$2,000	월

비용 계산 예시

사용자는 gemini-2.0-flash를 사용하여 텍스트 토큰 1,000개와 오디오 토큰 500개의 입력으로 초당 10개의 쿼리 (QPS)를 지원하여 텍스트 토큰 300개의 출력을 수신할 수 있는지 확인해야 합니다.

gemini-2.0-flash의 처리량 및 소진율 표를 사용하면 입력 텍스트 토큰의 소진율은 1토큰, 입력 오디오 토큰의 소진율은 7토큰, 출력 텍스트 토큰의 소진율은 4토큰임을 알 수 있습니다.

사용자의 총 입력 토큰은 1,000* (입력 텍스트 토큰당 1개 토큰) + 500* (입력 오디오 토큰당 7개 토큰) = 소진 조정 입력 토큰 4,500개입니다. 사용자의 총 출력 토큰은 300* (출력 텍스트 토큰당 4개 토큰) = 소진 조정 출력 토큰 1,200개입니다. 이를 합하면 소진 조정 입력 토큰 4,500개 + 소진 조정 출력 토큰 1,200개 = 쿼리당 총 토큰 5,700개가 됩니다.

쿼리당 총 토큰에 QPS를 곱하면 쿼리당 총 토큰 5,700개 * 10 QPS = 초당 총 토큰 57,000개가 됩니다.

이를 GSU당 초당 총 처리량으로 나누면 초당 총 토큰 57,000개 ÷ GSU당 초당 처리량 3,360개 = GSU 16.96개가 됩니다. 이 모델의 최소 GSU 구매 증분은 1이므로 사용자는 17개의 GSU가 필요합니다.

사용자가 1주일 동안 이 처리량을 유지하려면 주당 $1,200 * 17 GSU = $20,400의 비용이 듭니다. 이 처리량을 1개월 동안 유지하려면 월 $2,700 * 17 GSU = $45,900의 비용이 듭니다. 이 처리량을 3개월 동안 유지하려면 월 $2,400 * 17 GSU = $40,800의 비용이 듭니다. 마지막으로, 이 처리량을 1년 동안 유지하려면 월 $2,000 * 17 GSU = $34,000의 비용이 듭니다.

모델 조정

모델 조정은 대규모 모델을 태스크에 맞게 맞춤설정할 수 있는 효과적인 방법입니다. 이는 모델의 품질과 효율성을 개선하기 위한 핵심 단계입니다. 모델 조정 이점은 다음과 같습니다.

특정 태스크의 품질 개선
모델의 안정성 향상
짧아진 프롬프트로 인한 추론 지연 시간 단축 및 비용 절감

조정은 학습 토큰 100만 개당 요금이 청구됩니다. 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다. 모델 추론의 경우 Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.

모델	유형	가격(백만 학습 토큰당)
Gemini 2.5 Pro	지도 미세 조정	$25
Gemini 2.5 Flash	지도 미세 조정 선호도 조정	$5
Gemini 2.5 Flash Lite	지도 미세 조정 선호도 조정	$1.5
Gemma 3 27B IT	지도 미세 조정	$6.83
Llama 3.1 8B	지도 미세 조정	$0.67
Llama 3.2 1B	지도 미세 조정	$0.28
Llama 3.2 3B	지도 미세 조정	$0.61
Llama 3.3 70B	지도 미세 조정	6.72달러
Llama 4 Scout 17B 16E	지도 미세 조정	$5.77
Qwen3 32B	지도 미세 조정	$6.57

* 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
* Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.

Vertex AI의 파트너 모델 가격 비교

파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.

AI21 Lab의 모델

모델	가격 책정
Jamba 1.5 Large (지원 중단됨)	입력: 토큰 100만 개당 $2 출력: 토큰 100만 개당 $8
Jamba 1.5 Mini (지원 중단됨)	입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.40

Anthropic의 Claude 모델

지역별 가격 책정 모델

전역

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Opus 4.5	입력: $5.00 출력: $25.00 일괄 입력: $2.50 일괄 출력: $12.50 5분 캐시 쓰기: $6.25 1시간 캐시 쓰기: $10.00 캐시 적중: $0.50 5분 일괄 캐시 쓰기: $3.125 1시간 일괄 캐시 쓰기: $5.00 일괄 캐시 적중: $0.25
Claude Sonnet 4.5	입력: $3.00 출력: $15.00 일괄 입력: $1.50 일괄 출력: $7.50 5분 캐시 쓰기: $3.75 1시간 캐시 쓰기: $6.00 캐시 적중: $0.30 일괄 캐시 쓰기: $1.88 일괄 캐시 적중: $0.15	입력: $6.00 출력: $22.50 일괄 입력: $3.00 일괄 출력: $11.25 5분 캐시 쓰기: $7.50 1시간 캐시 쓰기: $12.00 캐시 적중: $0.60 일괄 캐시 쓰기: $3.75 일괄 캐시 적중: $0.30
Claude Haiku 4.5	입력: $1.00 출력: $5.00 일괄 입력: $0.50 일괄 출력: $2.50 5분 캐시 쓰기: $1.25 1시간 캐시 쓰기: $2.00 캐시 적중: $0.10 일괄 캐시 쓰기: $0.625 일괄 캐시 적중: $0.05

us-east5

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Opus 4.5	입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275
Claude Sonnet 4.5	입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17	입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33
Claude Haiku 4.5	입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 쓰기: $1.375 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055

europe-west1

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Opus 4.5	입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275
Claude Sonnet 4.5	입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17	입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33
Claude Haiku 4.5	입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055

asia-southeast1

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Opus 4.5	입력: $5.50 출력: $27.50 일괄 입력: $2.75 일괄 출력: $13.75 5분 캐시 쓰기: $6.875 1시간 캐시 쓰기: $11.00 캐시 적중: $0.55 5분 일괄 캐시 쓰기: $3.438 1시간 일괄 캐시 쓰기: $5.50 일괄 캐시 적중: $0.275
Claude Sonnet 4.5	입력: $3.30 출력: $16.50 일괄 입력: $1.65 일괄 출력: $8.25 5분 캐시 쓰기: $4.13 1시간 캐시 쓰기: $6.60 캐시 적중: $0.33 일괄 캐시 쓰기: $2.06 일괄 캐시 적중: $0.17	입력: $6.60 출력: $24.75 일괄 입력: $3.30 일괄 출력: $12.38 5분 캐시 쓰기: $8.25 1시간 캐시 쓰기: $13.20 캐시 적중: $0.66 일괄 캐시 쓰기: $4.13 일괄 캐시 적중: $0.33

asia-east1

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Haiku 4.5	입력: $1.10 출력: $5.50 일괄 입력: $0.55 일괄 출력: $2.75 5분 캐시 쓰기: $1.375 1시간 캐시 쓰기: $2.20 캐시 쓰기: $1.375 캐시 적중: $0.11 일괄 캐시 쓰기: $0.688 일괄 캐시 적중: $0.055

* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

모든 리전에서 동일한 가격 책정 모델

모델	가격 (/1백만 토큰) < 20만 입력 토큰	가격 (/1백만 토큰) >= 20만 입력 토큰
Claude Opus 4.1	입력: $15 출력: $75 일괄 입력: $7.50 일괄 출력: $37.50 5분 캐시 쓰기: $18.75 1시간 캐시 쓰기: $30 캐시 적중: $1.50 일괄 캐시 쓰기: $9.375 일괄 캐시 적중: $0.75	해당 사항 없음
Claude Opus 4	입력: $15 출력: $75 일괄 입력: $7.50 일괄 출력: $37.50 5분 캐시 쓰기: $18.75 1시간 캐시 쓰기: $30 캐시 적중: $1.50 일괄 캐시 쓰기: $9.375 일괄 캐시 적중: $0.75	해당 사항 없음
Claude Sonnet 4	입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 5분 캐시 쓰기: $3.75 1시간 캐시 쓰기: $6.00 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15	입력: $6 출력: $22.50 일괄 입력: $3 일괄 출력: $11.25 5분 캐시 쓰기: $7.50 1시간 캐시 쓰기: $12.00 캐시 적중: $0.60 일괄 캐시 쓰기: $3.75 일괄 캐시 적중: $0.30
Claude 3 Haiku	입력: $0.25 출력: $1.25 5분 캐시 쓰기: $0.30 1시간 캐시 쓰기: $0.50 캐시 적중: $0.03	해당 사항 없음
Claude 3.5 Haiku (지원 중단)	입력: $0.80 출력: $4 일괄 입력: $0.40 일괄 출력: $2 5분 캐시 쓰기: $1 1시간 캐시 쓰기: $1.60 캐시 적중: $0.08 일괄 캐시 쓰기: $0.50 일괄 캐시 적중: $0.04	해당 사항 없음
Claude 3.7 Sonnet (지원 중단됨)	입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 캐시 쓰기: $3.75 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15	해당 사항 없음
Claude 3.5 Sonnet v2 (지원 중단됨)	입력: $3 출력: $15 일괄 입력: $1.50 일괄 출력: $7.50 캐시 쓰기: $3.75 캐시 적중: $0.30 일괄 캐시 쓰기: $1.875 일괄 캐시 적중: $0.15	해당 사항 없음
Claude 3.5 Sonnet (지원 중단됨)	입력: $3 출력: $15 캐시 쓰기: $3.75 캐시 적중: $0.30	해당 사항 없음
Claude 3 Opus (지원 중단)	입력: $15 출력: $75 캐시 쓰기: $18.75 캐시 적중: $1.50	해당 사항 없음

* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

도구 가격 책정

도구	가격
웹 검색 요청	검색 1,000회당$10 지원되는 모델: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, Claude Opus 4

* 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

Deepseek 모델

모델	가격 책정
DeepSeek-V3.1	입력: 토큰 100만 개당 $0.60 출력: 토큰 100만 개당 $1.70 일괄 입력: 토큰 100만 개당 $0.30 일괄 출력: 토큰 100만 개당 $0.85
DeepSeek-V3.2 *	입력: 토큰 100만 개당 $0.56 출력: 토큰 100만 개당 $1.68 일괄 입력: 토큰 100만 개당 $0.28 일괄 출력: 토큰 100만 개당 $0.84
DeepSeek-R1 (0528)	입력: 토큰 100만 개당 $1.35 출력: 토큰 100만 개당 $5.40 일괄 입력: 토큰 100만 개당 $0.675 일괄 출력: 토큰 100만 개당 $2.70
DeepSeek-OCR	입력: 토큰 100만 개당 $0.30 (또는 페이지당 $0.0003) 출력: 토큰 100만 개당 $1.20 (또는 페이지당 $0.00012)

2025년 12월 17일까지 무료로 사용할 수 있습니다.

MiniMax의 모델

모델	가격 책정
MiniMax-M2	입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $1.20

Moonshot의 모델

모델	가격 책정
Kimi-K2-Thinking	입력: 토큰 100만 개당 $0.60 출력: 토큰 100만 개당 $2.50

Qwen 모델

모델	가격 책정
Qwen3-Next-80B-Thinking	입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $1.20
Qwen3-Next-80B-Instruct	입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $1.20
Qwen3-Coder-480B-A35B-Instruct	입력: 토큰 100만 개당 $0.22 출력: 토큰 100만 개당 $1.80 일괄 입력: 토큰 100만 개당 $0.11 일괄 출력: 토큰 100만 개당 $0.90
Qwen3-235B-A22B-Instruct-2507	입력: 토큰 100만 개당 $0.22 출력: 토큰 100만 개당 $0.88 일괄 입력: 토큰 100만 개당 $0.11 일괄 출력: 토큰 100만 개당 $0.44

OpenAI 모델

모델	가격 책정
gpt-oss-120b	입력: 토큰 100만 개당 $0.09 출력: 토큰 100만 개당 $0.36 일괄 입력: 토큰 100만 개당 $0.045 일괄 출력: 토큰 100만 개당 $0.18
gpt-oss-20b	입력: 토큰 100만 개당 $0.07 출력: 토큰 100만 개당 $0.25 일괄 입력: 토큰 100만 개당 $0.035 일괄 출력: 토큰 100만 개당 $0.125

Meta의 Llama 모델

모델	가격 책정
Llama 3.1 405B	입력: 토큰 100만 개당 $5.00 출력: 토큰 100만 개당 $16.00
Llama 3.3 70B	입력: 토큰 100만 개당 $0.72 출력: 토큰 100만 개당 $0.72 일괄 입력: 토큰 100만 개당 $0.36 일괄 출력: 토큰 100만 개당 $0.36
Llama 4 Scout	입력: 100만 토큰당 $0.25 출력: 100만 토큰당 $0.70 일괄 입력: 100만 토큰당 $0.125 일괄 출력: 100만 토큰당 $0.35
Llama 4 Maverick	입력: 토큰 100만 개당 $0.35 출력: 토큰 100만 개당 $1.15 일괄 입력: 토큰 100만 개당 $0.175 일괄 출력: 토큰 100만 개당 $0.575

Mistral AI 모델

모델	가격 책정
Mistral OCR(25.05)	입력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005) 출력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005)
Mistral Medium 3	입력: 토큰 100만 개당 $0.40 출력: 토큰 100만 개당 $2.00
Mistral Small 3.1(25.03)	입력: 토큰 100만 개당 $0.10 출력: 토큰 100만 개당 $0.30
Mistral Large (24.11) (지원 중단)	입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00
Codestral 2	입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90
Codestral (25.01) (지원 중단)	입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.

영업팀에 문의