Vertex AI에서 AI 모델을 빌드하고 배포하는 비용

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

200 응답 코드를 반환하는 요청에 대해서만 요금이 청구됩니다. 4xx 및 5xx 코드와 같은 다른 응답 코드를 반환하는 요청에는 입력 또는 출력에 대한 요금이 청구되지 않습니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini 3

모델 유형 가격 (/1백만 토큰) <= 200,000개 입력 토큰 가격 (/1백만 토큰) > 200,000개 입력 토큰 가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰 가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰 가격(/1백만 토큰) <= 20만 개의 입력 토큰(Batch API 사용) 가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰
Gemini 3 Pro 프리뷰
입력 (텍스트, 이미지, 동영상, 오디오) $2 $4 $0.2 $0.4 $1 $2
텍스트 출력 (대답 및 추론) $12 $18 해당 사항 없음 해당 사항 없음 $6 $9
이미지 출력** $120 해당 사항 없음 해당 사항 없음 해당 사항 없음 $60 해당 사항 없음
Gemini 3 Flash 프리뷰
입력(텍스트, 이미지, 동영상) $0.5 $0.5 $0.05 $0.05 $0.25 $0.25
입력 (오디오) $1 $1 $0.1 $0.1 $0.5 $0.5
텍스트 출력 (대답 및 추론) $3 $3 해당 사항 없음 해당 사항 없음 $1.5 $1.5
Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩 모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다.

이러한 한도를 초과하는 검색 쿼리는 검색 쿼리 1,000개당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 검색 (또는 Enterprise용 웹 그라운딩)에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 개별 검색 쿼리마다 요금이 청구됩니다. 요금 청구는 2026년 1월 5일부터 시작됩니다.

Google 검색을 사용한 그라운딩 또는 엔터프라이즈용 웹 그라운딩에서 제공하는 입력 토큰에는 요금이 청구되지 않습니다.

하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
Google 지도를 사용한 그라운딩 모든 Gemini 3 모델에서 집계된 월 5,000개의 검색 쿼리가 무료로 제공됩니다.

이 한도를 초과하는 Maps 쿼리는 1,000건당$14의 요금이 청구됩니다. 고객이 Gemini에 제출한 요청은 Google 지도에 대한 하나 이상의 쿼리로 이어질 수 있습니다. 수행된 개별 쿼리마다 요금이 청구됩니다. 2026년 1월 5일부터 청구 시작

Google 지도에서 제공하는 입력 토큰은 청구되지 않습니다.
데이터를 사용한 그라운딩 프롬프트 1,000개당 $2.50

* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
** 1K (1024x1024) 및 2K (2048x2048) 출력 이미지는 1,120개의 이미지 출력 토큰을 소비하며, 이는 이미지 생성당 $0.134에 해당합니다. 4K (4096x4096) 이미지는 2,000개의 이미지 출력 토큰을 소비하며, 이는 이미지 1개당 $0.24에 해당합니다.

Gemini 2.5

모델 유형 가격 (/1백만 토큰) <= 200,000개 입력 토큰 가격 (/1백만 토큰) > 200,000개 입력 토큰 가격(백만 토큰당) <= 200,000개의 캐시된 입력 토큰 가격 (/1백만 토큰) > 200,000개의 캐시된 입력 토큰 가격(/1백만 토큰) <= 20만 개의 입력 토큰(Batch API 사용) 가격 (/1백만 토큰) > 배치 API를 사용한 20만 개의 입력 토큰
Gemini 2.5 Pro
입력 (텍스트, 이미지, 동영상, 오디오) $1.25 $2.5 $0.125 $0.250 $0.625 $1.25
텍스트 출력 (대답 및 추론) $10 $15 해당 사항 없음 해당 사항 없음 $5 $7.5
Gemini 2.5 Pro
컴퓨터 사용-프리뷰
입력 (텍스트, 이미지, 동영상, 오디오) $1.25 $2.5 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음
텍스트 출력 (대답 및 추론) $10.00 $15.00 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음


Gemini 2.5
Flash
입력(텍스트, 이미지, 동영상) $0.30 $0.30 $0.030 $0.030 $0.15 $0.15
오디오 입력 $1 $1 $0.100 $0.100 $0.5 $0.5
텍스트 출력 (대답 및 추론) $2.50 $2.50 해당 사항 없음 해당 사항 없음 $1.25 $1.25
이미지 출력*** $30 $30 해당 사항 없음 해당 사항 없음 $15 $15




Gemini 2.5 Flash Live API
입력 텍스트 토큰 1백만 개 $0.5 $0.5 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음
입력 오디오 토큰 1백만 개 $3 $3 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음
입력 동영상/이미지 토큰 1백만 개 $3 $3 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음
출력 텍스트 토큰 1백만 개 $2 $2 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음
1백만 개의 출력 오디오 토큰 $12 $12 해당 사항 없음 해당 사항 없음 해당 사항 없음 해당 사항 없음



Gemini 2.5 Flash Lite
입력(텍스트, 이미지, 동영상) $0.1 $0.1 $0.010 $0.010 $0.05 $0.05
오디오 입력 $0.3 $0.3 $0.030 $0.030 $0.15 $0.15
텍스트 출력 (대답 및 추론) $0.4 $0.4 해당 사항 없음 해당 사항 없음 $0.2 $0.2


Google 검색을 사용한 그라운딩
Gemini 2.0 Flash, 2.5 Flash, 2.5 Flash-Lite에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다. Gemini 2.5 Pro에는 하루에 10,000개의 그라운딩된 프롬프트가 추가 비용 없이 포함되어 있습니다.

이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다.

그라운딩된 프롬프트는 Google 검색에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다&ast;&ast;. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

엔터프라이즈용 웹 그라운딩
그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다**. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터를 사용한 그라운딩 요청 1,000개당 $2.5
Google 지도를 사용한 그라운딩 1,000개의 그라운딩된 프롬프트당$25.

그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다.

* 쿼리 입력 컨텍스트가 200, 000개 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 부과됩니다.
** Google 검색을 사용한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환한 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
*** 1024x1024 이미지의 경우 1290개의 토큰이 사용됩니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
**** Computer Use 청구는 Gemini 2.5 Pro SKU를 사용하며, Computer Use 비용을 분할하려면 청구 태그를 적용하세요. 자세한 내용은 여기를 참조하세요.

  • LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
  • 능동적 오디오 모드: 사용 설정하면 LiveAPI가 수신 대기하는 동안 입력 토큰이 청구됩니다. 출력 토큰은 API가 응답할 때만 청구됩니다.
  • 오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.

Gemini 2.0

Gemini 2.0은 토큰을 기준으로 요금이 청구됩니다. 요청을 보내기 전에 요청의 입력 토큰 수를 계산하려면 SDK 토크나이저 또는 countTokens API를 사용하면 됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.

가격 책정 표의 전환 버튼을 사용하여 토큰 기반 가격 책정과 모달리티 기반 가격 책정을 비교해 보세요.

토큰 기반 가격 책정

모델 유형 가격 Batch API 가격




Gemini 2.0 Flash
입력 토큰 1백만 개 $0.15 $0.075
입력 오디오 토큰 1백만 개 $1.00 $0.50
1백만 개의 출력 텍스트 토큰 $0.60 $0.30
1백만 개의 학습 토큰에 맞게 조정 $3.00




Gemini 2.0 Flash 이미지 생성
입력 토큰 100만 개 $0.15
입력 오디오 토큰 1백만 개 $1.00
입력 동영상 토큰 1백만 개 $3
출력 텍스트 토큰 1백만 개 $0.60
1백만 개의 출력 이미지 토큰 $30.00




Gemini 2.0 Flash Live API
입력 텍스트 토큰 1백만 개 $0.5
입력 오디오 토큰 1백만 개 $3
입력 동영상/이미지 토큰 1백만 개 $3
출력 텍스트 토큰 1백만 개 $2
1백만 개의 출력 오디오 토큰 $12




Gemini 2.0 Flash Lite
입력 토큰 1백만 개 $0.075 $0.0375
입력 오디오 토큰 1백만 개 $0.075 $0.0375
1백만 개의 출력 텍스트 토큰 $0.30 $0.15
1백만 개의 학습 토큰에 맞게 조정 $1.00


Google 검색을 사용한 그라운딩
Gemini 2.0 Flash2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다.

이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다.

그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

엔터프라이즈용 웹 그라운딩
그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터를 사용한 그라운딩 2025년 6월 16일부터 요청 1,000개당 $2.5


Google 지도 기반 그라운딩
Gemini 모델에는 추가 비용 없이 사용할 수 있는 여러 개의 그라운딩된 일일 프롬프트가 포함되어 있습니다.
  • Gemini FlashFlash-Lite: 하루에 그라운딩된 프롬프트 1,500개(합산)
  • Gemini Pro: 하루에 10,000개의 그라운딩된 프롬프트

  • 이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$25의 요금이 청구됩니다.

    그라운딩된 프롬프트는 Google 지도에 1개 이상의 쿼리를 보내는 Gemini에 대한 요청입니다.

    하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

    형식 기반 가격 책정

    아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.

    • 4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.
    • 1024x1024 이미지의 경우 1290개의 토큰을 소비합니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
    • 동영상 입력은 초당 1프레임의 샘플링 속도로 초당 258개의 토큰을 소비합니다. 오디오가 포함된 동영상은 동영상 토큰과 오디오 토큰 모두에 대해 요금이 청구됩니다.
    • 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.
    모델 유형 가격 Batch API 가격




    Gemini 2.0 Flash
    입력 텍스트(문자 백만 개당 비용($)) $0.0375 $0.01875
    입력 이미지 ($/이미지) $0.0001935 $0.00009675
    입력 동영상 ($/초) $0.0000387 $0.00001935
    입력 오디오 ($/초) $0.000025 $0.0000125
    출력 텍스트 (백만 문자당 $) $0.15 $0.075




    Gemini 2.0 Flash 이미지 생성
    입력 텍스트(문자 백만 개당 비용($)) $0.0375
    입력 이미지 ($/이미지) $0.0001935
    입력 동영상 ($/초) $0.0000387
    입력 오디오 ($/초) $0.000025
    출력 텍스트 (백만 문자당 $) $0.15
    출력 이미지 이미지 (이미지당 $) $0.04





    Gemini 2.0 Flash Lite
    입력 텍스트(문자 백만 개당 비용($)) $0.01875 $0.009375
    입력 이미지 ($/이미지) $0.00009675 $0.000048375
    입력 동영상 ($/초) $0.00001935 $0.000009675
    입력 오디오 ($/초) $0.000001875 $0.000000938
    출력 텍스트 (백만 문자당 $) $0.075 $0.0375


    Google 검색을 사용한 그라운딩
    Gemini 2.0 Flash2.5 Flash에는 추가 비용 없이 하루에 1,500개의 그라운딩된 프롬프트가 포함되어 있습니다.

    이러한 한도를 초과하는 그라운딩된 프롬프트는 그라운딩된 프롬프트 1,000개당$35의 요금이 청구됩니다.

    그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

    하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

    엔터프라이즈용 웹 그라운딩
    그라운딩된 프롬프트 1,000개당 45달러. 그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈*를 위한 웹 그라운딩에 하나 이상의 쿼리를 만듭니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

    하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.

    * 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
    * 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
    * PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
    * 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
    * Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.
    * Gemini 2.0 Flash Live API: 오디오 (입력/출력) 초당 25개 토큰, 동영상 (입력) 초당 258개 토큰 Gemini 2.0 Flash Live API가 프리뷰 버전인 동안에는 Google 검색을 사용한 그라운딩이 무료로 제공됩니다.

    • LiveAPI 세션의 컨텍스트 윈도우 청구 설명: 세션 컨텍스트 윈도우에 있는 모든 토큰에 대해 턴당 요금이 청구됩니다. 세션 컨텍스트 윈도우에는 새 토큰 (현재 턴) + 이전 턴에서 누적된 모든 토큰이 포함됩니다. 즉, 이전 턴의 토큰이 재처리되고 구성된 컨텍스트 윈도우 크기까지 각 새 턴에 반영됩니다. '턴'은 하나의 사용자 입력과 모델의 응답을 의미합니다.
    • 오디오-텍스트 텍스트 변환이 사용 설정된 경우 텍스트 변환을 위해 생성된 모든 텍스트 토큰은 텍스트 토큰 출력 요율로 청구됩니다.

    Vertex AI Model Optimizer 가격 책정 (실험용)*

    Vertex AI Model Optimizer는 Gemini 모델 요청을 위한 단일 메타 엔드포인트를 제공하여 엔터프라이즈 고객의 Gemini 사용을 간소화합니다. 이 서비스를 사용하는 고객은 Flash, Pro 또는 특정 버전을 사용할지 지정할 필요가 없습니다. 대신 구성 가능한 설정 (비용, 품질 또는 균형)을 제공하여 선호도를 나타내면 Model Optimizer가 각 쿼리를 가장 적합한 모델로 전송하여 작업에 적합한 수준의 인텔리전스를 적용합니다.

    Vertex AI Model Optimizer는 동적 가격 책정을 적용합니다. 즉, 토큰당 평균 가격은 작업을 완료하는 데 적용되는 모델 인텔리전스 수준에 따라 달라집니다. 따라서 아래 표에 구성 설정을 기반으로 한 예상 시나리오를 보여주는 가격 책정 예시를 제공합니다. Model Optimizer SKU는 결제에 적용하기 위한 구매 단위로 기능하는 $1 SKU이며, 모델을 사용한 후에도 사용량 기준으로 요금이 청구됩니다.

    5:1 I/O 비율 예시 1
    챗봇
    참고: 이 범위는 보장되지 않으며 개별 고객의 결과는 다를 수 있습니다.
    고객 선호도 MO에 전송된 고객 입력 토큰 고객 출력 토큰이 MO로 전송됨 토큰 100만 개당 평균 입력 가격 (높은 범위) 토큰 100만 개당 평균 출력 가격 (높은 범위) 토큰 100만 개당 평균 입력 가격 (낮은 범위) 토큰 100만 개당 평균 출력 가격 (낮은 범위)
    비용 10,000,000 2,000,000 $0.63 $2.50 $0.16 $0.63
    균형 10,000,000 2,000,000 $1.26 $5.00 $0.63 $2.50
    품질 10,000,000 2,000,000 $1.89 $7.50 $1.26 $5.00
    1:20 I/O 비율 예 2 콘텐츠 생성
    고객 선호도 MO에 전송된 고객 입력 토큰 고객 출력 토큰이 MO로 전송됨 토큰 100만 개당 평균 입력 가격 (높은 범위) 토큰 100만 개당 평균 출력 가격 (높은 범위) 토큰 100만 개당 평균 입력 가격 (낮은 범위) 토큰 100만 개당 평균 출력 가격 (낮은 범위)
    비용 1,000,000 20,000,000 $0.63 $2.50 $0.16 $0.63
    균형 1,000,000 20,000,000 $1.26 $5.00 $0.63 $2.50
    품질 1,000,000 20,000,000 $1.89 $7.50 $1.26 $5.00

    * 모델 옵티마이저는 유료 실험 버전으로, Vertex의 Gemini 실험 버전에 요청을 라우팅할 수 있습니다.

    기타 Gemini 모델

    Gemini 2.0 또는 Gemini 2.5를 제외한 모든 Gemini 모델은 문자, 이미지, 동영상/오디오 초와 같은 모달리티를 기준으로 요금이 청구됩니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 토큰당 약 4개의 문자가 포함됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다. 요청이 400 또는 500 오류로 실패하면 사용된 토큰에 대한 요금이 청구되지 않습니다.

    모델 기능 유형 가격
    ( 입력 토큰 128,000개 이하)
    가격
    (입력 토큰 128,000개 초과)
    Gemini 1.5 Flash 멀티모달 이미지 입력
    동영상 입력
    텍스트 입력
    오디오 입력
    $0.00002 / 이미지
    $0.00002 / 초
    $0.00001875 / 1,000자
    $0.000002 / 초
    $0.00004 / 이미지
    $0.00004 / 초
    $0.0000375 / 1,000자
    $0.000004 / 초
    텍스트 출력 $0.000075 / 1000자 $0.00015 / 1,000자
    조정* 학습 토큰 토큰 백만 개당 8달러
    Gemini 1.5 Pro 멀티모달 이미지 입력
    동영상 입력
    텍스트 입력
    오디오 입력
    $0.00032875 / 이미지
    $0.00032875 / 초
    $0.0003125 / 1,000자
    $0.00003125 / 초
    $0.0006575 / 이미지
    $0.0006575 / 초
    $0.000625 / 1,000자
    $0.0000625 / 초
    텍스트 출력 $0.00125 / 1000자 $0.0025 / 1,000자
    조정* 학습 토큰 토큰 백만 개당 80달러
    Gemini 1.0 Pro 멀티모달 이미지 입력
    동영상 입력
    텍스트 입력
    $0.0025/이미지
    $0.002/초
    $0.000125/1,000자
    텍스트 출력 $0.000375/1000자
    Google 검색을 사용하는 그라운딩 텍스트 그라운딩된 프롬프트 1,000개당 35달러.

    그라운딩된 프롬프트는 Google 검색*에 하나 이상의 쿼리를 만드는 Gemini에 제출된 요청입니다. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

    하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
    엔터프라이즈용 웹 그라운딩 텍스트 그라운딩된 프롬프트 1,000개당 45달러.

    그라운딩된 프롬프트는 Gemini에 제출된 요청으로, 엔터프라이즈용 웹 그라운딩에 하나 이상의 쿼리를 만듭니다*. 여러 검색 쿼리가 Google 검색으로 전송되더라도 그라운딩된 프롬프트에 대한 요금은 한 번만 청구됩니다.

    하루에 100만 개 이상의 그라운딩된 프롬프트가 필요한 경우 계정팀에 문의하세요.
    데이터를 사용한 그라운딩 텍스트 2025년 6월 16일부터 요청 1,000개당 $2.5가 청구됩니다.

    * 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
    * 쿼리 컨텍스트가 128, 000개 토큰보다 길면 모든 토큰에 긴 컨텍스트 요금이 청구됩니다.
    * Gemini 모델은 일괄 모드에서 50% 할인된 가격으로 제공됩니다.
    * Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
    * PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
    * 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
    * Google 검색을 통한 그라운딩 및 엔터프라이즈용 웹 그라운딩은 프롬프트가 웹 결과 (즉, 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.

    Imagen

    Vertex AI 기반 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.

    모델 기능 Description(설명) 입력 출력 가격
    Imagen 4 Ultra 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.06
    Imagen 4 업스케일링 생성된 이미지의 해상도를 2K, 3K, 4K로 높입니다. 이미지 이미지 이미지당 $0.06
    Imagen 4 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.04
    Imagen 4 Fast 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.02
    Imagen 3 이미지 생성 이미지 생성
    이미지 수정
    이미지 맞춤설정
    텍스트 프롬프트 이미지 이미지당 $0.04
    Imagen 3 Fast 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.02
    Imagen 2, Imagen 1 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.020
    Imagen 2, Imagen 1 이미지 수정 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 이미지/텍스트 프롬프트 이미지 이미지당 $0.020
    Imagen 1 업스케일링 생성된 이미지의 해상도를 2k 및 4k로 높입니다. 이미지 이미지 이미지당 $0.003
    Imagen 1 세부 조정 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 미세 조정된 모델(사용자 제공 주제로 학습한 후) 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
    Imagen 시각적 캡셔닝 이미지에 대한 짧거나 긴 텍스트 설명 생성 이미지 텍스트 캡션 $0.0015/이미지
    Imagen 시각적 질의 응답 이미지를 참조하는 질문에 따라 답변 제공 이미지/텍스트 프롬프트 텍스트 대답 $0.0015/이미지
    Imagen 제품 재컨텍스트화 새로운 장면에서 제품을 재해석하세요 동일한 제품의 이미지 1~3개와 원하는 장면을 설명하는 텍스트 프롬프트 이미지 이미지당 $0.12
    Vertex 가상 테스트 다양한 옷을 입은 사람들의 이미지를 생성하세요. 사람 이미지 1개와 의류 이미지 1개 이미지 이미지당 $0.06

    가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

    Veo

    Veo는 다양한 주제와 스타일로 놀라울 정도로 고품질의 동영상을 제작하며, 실제 물리 법칙과 인간의 움직임 및 표현의 뉘앙스에 대한 이해도를 높입니다.

    모델 기능 설명 입력 출력 출력 해상도 가격
    Veo 3.1 동영상 + 오디오 생성 텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성 텍스트/이미지 프롬프트 동영상 + 오디오 720p, 1080p $0.40/초
    Veo 3.1 동영상 생성 텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성 텍스트/이미지 프롬프트 동영상 720p, 1080p $0.20/초
    Veo 3.1 Fast 동영상 + 오디오 생성 텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성 텍스트/이미지 프롬프트 동영상 + 오디오 720p, 1080p $0.15/초
    Veo 3.1 Fast 동영상 생성 텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성 텍스트/이미지 프롬프트 동영상 720p, 1080p $0.10/초
    Veo 3 동영상 + 오디오 생성 텍스트 프롬프트 또는 참조 이미지에서 동기화된 음성/사운드 효과로 고품질 동영상 생성 텍스트/이미지 프롬프트 동영상 + 오디오 720p, 1080p $0.40/초
    Veo 3 동영상 생성 텍스트 프롬프트 또는 참고 이미지에서 고품질 동영상 생성 텍스트/이미지 프롬프트 동영상 720p, 1080p $0.20/초
    Veo 3 Fast 동영상 + 오디오 생성 텍스트 프롬프트 또는 참고 이미지에서 동기화된 음성/음향 효과를 사용해 동영상을 더 빠르게 생성 텍스트/이미지 프롬프트 동영상 + 오디오 720p, 1080p $0.15/초
    Veo 3 Fast 동영상 생성 텍스트 프롬프트 또는 참고 이미지에서 더 빠르게 동영상 생성 텍스트/이미지 프롬프트 동영상 720p, 1080p $0.10/초
    Veo 2 동영상 생성 텍스트 프롬프트 또는 참고 이미지에서 동영상 생성 텍스트/이미지 프롬프트 동영상 720p $0.50/초
    Veo 2 고급 제어 시작 및 종료 프레임 보간을 통해 동영상을 생성하고, 생성된 동영상을 확장하고, 카메라 컨트롤을 적용합니다. 텍스트/이미지/동영상 프롬프트 동영상 720p $0.50/초

    Lyria

    Lyria 2는 정교한 작곡과 세밀한 창의적 탐색에 이상적인 고품질 악기 음악을 생성하며, 미묘한 뉘앙스가 중요한 출력에 적합합니다.

    모델 기능 설명 입력 출력 가격
    Lyria 2 음악 생성 텍스트 프롬프트에서 음악 생성 텍스트 프롬프트 음악 30초당 $0.06

    AI 애플리케이션의 임베딩 비용 이해

    모델 유형 리전 입력 토큰 1,000개당 가격
    Gemini 임베딩 입력 전역
    • 온라인 요청: $0.00015
    • 일괄 요청: $0.00012
    출력 글로벌
    • 온라인 요청: 무료
    • 일괄 요청: 무료
    모델 유형 리전 1,000자당 가격
    텍스트용 임베딩
    (Gemini 임베딩 제외)
    입력 전역
    • 온라인 요청: $0.000025
    • 일괄 요청: $0.00002
    출력 글로벌
    • 온라인 요청: 무료
    • 일괄 요청: 무료
    모델 기능 Description(설명) 입력 출력 가격
    multimodalembedding 멀티모달용 임베딩: 텍스트 텍스트를 입력으로 사용하여 임베딩 생성 텍스트 임베딩 $0.0002 / 1,000자 입력
    멀티모달용 임베딩: 이미지 이미지를 입력으로 사용하여 임베딩 생성 이미지 임베딩 $0.0001 / 이미지 입력
    멀티모달용 임베딩: 동영상 플러스 Video Plus 동영상 임베딩(동영상 분당 최대 15개의 임베딩) 동영상 초당 $0.0020
    멀티모달용 임베딩: 동영상 표준 Video Standard 동영상 임베딩(동영상 분당 최대 8개의 임베딩) 동영상 초당 $0.0010
    멀티모달용 임베딩: 동영상 필수사항 Video Essential 동영상 임베딩(동영상 분당 최대 4개의 임베딩) 동영상 초당 $0.0005
    오픈소스 모델 유형 입력 토큰 1,000개당 가격
    multilingual-e5-small 입력:
    출력:

    일괄 입력:
    일괄 출력:
    온라인 요청: $0.000015
    온라인 요청: 무료

    일괄 요청: $0.0000075
    일괄 요청: 무료
    multilingual-e5-large 입력:
    출력:

    일괄 입력:
    일괄 출력:
    온라인 요청: $0.000025
    온라인 요청: 무료

    일괄 요청: $0.0000125
    일괄 요청: 무료

    가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

    Vertex AI의 코드 완성 가격 책정

    Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.

    모델 유형 리전 1,000자당 가격
    코드 완성용 Codey 입력 글로벌
    • 온라인 요청: $0.00025
    출력 글로벌
    • 온라인 요청: $0.0005

    가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

    번역 (텍스트)

    Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 유창하고 인간의 언어에 가깝지만, 언어 지원이 더 제한적입니다 (자세히 알아보기).

    모델 메서드 사용 백만 자당 가격
    LLM 텍스트 번역* 월별 입력 문자 수

    백만 자당 $10*

    월별 출력 문자 수

    백만 자당 $10*

    가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
    *가격은 모델에서 처리한 문자 수를 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.

    명시적 캐싱의 컨텍스트 캐시 스토리지 가격

    모델 기능 유형 가격(토큰 100만 개당)
    <= 20만 개의 입력 토큰
    가격 (/1백만 토큰)
    > 20만 입력 토큰
    Gemini 3 Pro 컨텍스트 캐시 스토리지 입력 (텍스트, 이미지, 동영상, 오디오) $4.5 (/M 토큰/시간) $4.5 (/M 토큰/시간)
    Gemini 2.5 Pro 컨텍스트 캐시 스토리지 입력 (텍스트, 이미지, 동영상, 오디오) $4.5 (/M 토큰/시간) $4.5 (/M 토큰/시간)
    Gemini 2.5 Flash 컨텍스트 캐시 스토리지 입력 (텍스트, 이미지, 동영상, 오디오) $1 (/M 토큰/시간) $1 (/M 토큰/시간)
    Gemini 2.5 Flash Lite 컨텍스트 캐시 스토리지 입력 (텍스트, 이미지, 동영상, 오디오) $1 (/M 토큰/시간) $1 (/M 토큰/시간)

    Gemini 2.0 모델

    토큰 기반 가격 책정


    모델

    유형
    스토리지
    (M 토크 시간)
    가격




    Gemini 2.0 Flash
    입력 토큰 1백만 개 $1.00 $0.0375
    입력 오디오 토큰 1백만 개 $1.00 $0.25
    1백만 개의 출력 텍스트 토큰 해당 사항 없음 해당 사항 없음


    Gemini 2.0 Flash Lite
    입력 토큰 1백만 개 $1.00 $0.01875
    입력 오디오 토큰 1백만 개 $1.00 $0.01875
    1백만 개의 출력 텍스트 토큰 해당 사항 없음 해당 사항 없음

    형식 기반 가격 책정

    아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용으로만 제공됩니다. 실제 청구는 토큰을 기준으로만 이루어집니다.

    • 4개의 문자는 공백을 포함하여 약 1개의 텍스트 토큰을 생성합니다.
    • 1024x1024 이미지의 경우 1290개의 토큰을 소비합니다. 이미지 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
    • 동영상 입력은 초당 1프레임의 샘플링 속도로 초당 258개의 토큰을 소비합니다. 오디오가 포함된 동영상은 동영상 토큰과 오디오 토큰 모두에 대해 요금이 청구됩니다.
    • 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.

    모델

    유형
    스토리지
    (모달리티 시간)

    가격




    Gemini 2.0 Flash
    입력 텍스트(문자 백만 개당 비용($)) $0.25 $0.009375
    입력 이미지 ($/이미지) $0.00129 $0.000048375
    입력 동영상 ($/초) $0.000258 $0.000009675
    입력 오디오 ($/초) $0.000025 $0.00000625
    출력 텍스트 (백만 문자당 $) 해당 사항 없음 해당 사항 없음




    Gemini 2.0 Flash Lite
    입력 텍스트(문자 백만 개당 비용($)) $0.25 $0.0046875
    입력 이미지 ($/이미지) $0.00129 $0.0000241875
    입력 동영상 ($/초) $0.000258 $0.000009675
    입력 오디오 ($/초) $0.000258 $0.0000048375
    출력 텍스트 (백만 문자당 $) 해당 사항 없음 해당 사항 없음


    Google 검색을 사용한 그라운딩
    Gemini 2.0 Flash에는 일일 최대 1,500개의 그라운딩된 요청이 추가 비용 없이 포함되어 있습니다. 일일 1,500회를 초과하는 그라운딩된 요청
    은 요청 1,000회당 35달러의 요금이 청구됩니다 (일일 최대 100만 회).

    하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요.

    엔터프라이즈용 웹 그라운딩
    2025년 5월 5일부터 요청 1,000개당 $45 (일일 최대 요청 100만 개)

    하루에 100만 건 이상의 요청이 필요한 경우 계정팀에 문의하세요.

    * 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
    * PDF는 이미지 입력으로 청구되며, PDF 페이지 하나는 이미지 하나에 해당합니다.
    * 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
    * Google 검색을 이용한 그라운딩은 웹에서 그라운딩 지원 URL을 하나 이상 포함하는 결과를 반환하는 요청에 대해서만 요금이 청구됩니다. Gemini Standard 모델 사용료도 적용됩니다.

    프로비저닝된 처리량

    프로비저닝된 처리량은 생성형 AI 요구사항에 대한 처리량을 보장하며 생성형 AI 확장 단위(GSU)를 통해 거래됩니다. 각 GSU가 제공하는 처리량에 대해 여기에서 자세히 알아보고 여기에서 온라인 추정기를 사용해 보세요.

    기간 GSU당 가격
    1주 커밋 $1,200
    1개월 약정 $2,700
    3개월 약정 $2,400
    1년 약정 $2,000

    비용 계산 예시

    사용자는 gemini-2.0-flash를 사용하여 텍스트 토큰 1,000개와 오디오 토큰 500개의 입력으로 초당 10개의 쿼리 (QPS)를 지원하여 텍스트 토큰 300개의 출력을 수신할 수 있는지 확인해야 합니다.

    gemini-2.0-flash의 처리량 및 소진율 를 사용하면 입력 텍스트 토큰의 소진율은 1토큰, 입력 오디오 토큰의 소진율은 7토큰, 출력 텍스트 토큰의 소진율은 4토큰임을 알 수 있습니다.

    사용자의 총 입력 토큰은 1,000* (입력 텍스트 토큰당 1개 토큰) + 500* (입력 오디오 토큰당 7개 토큰) = 소진 조정 입력 토큰 4,500개입니다. 사용자의 총 출력 토큰은 300* (출력 텍스트 토큰당 4개 토큰) = 소진 조정 출력 토큰 1,200개입니다. 이를 합하면 소진 조정 입력 토큰 4,500개 + 소진 조정 출력 토큰 1,200개 = 쿼리당 총 토큰 5,700개가 됩니다.

    쿼리당 총 토큰에 QPS를 곱하면 쿼리당 총 토큰 5,700개 * 10 QPS = 초당 총 토큰 57,000개가 됩니다.

    이를 GSU당 초당 총 처리량으로 나누면 초당 총 토큰 57,000개 ÷ GSU당 초당 처리량 3,360개 = GSU 16.96개가 됩니다. 이 모델의 최소 GSU 구매 증분은 1이므로 사용자에게는 17개의 GSU가 필요합니다.

    사용자가 1주일 동안 이 처리량을 유지하려면 주당 $1,200 * 17 GSU = $20,400의 비용이 듭니다. 이 처리량을 1개월 동안 유지하려면 월 $2,700 * 17 GSU = $45,900의 비용이 듭니다. 이 처리량을 3개월 동안 유지하려면 월 $2,400 * 17 GSU = $40,800의 비용이 듭니다. 마지막으로, 이 처리량을 1년 동안 유지하려면 월 $2,000 * 17 GSU = $34,000의 비용이 듭니다.

    모델 조정

    모델 조정은 대규모 모델을 태스크에 맞게 맞춤설정할 수 있는 효과적인 방법입니다. 이는 모델의 품질과 효율성을 개선하기 위한 핵심 단계입니다. 모델 조정 이점은 다음과 같습니다.

    • 특정 태스크의 품질 개선
    • 모델의 안정성 향상
    • 짧아진 프롬프트로 인한 추론 지연 시간 단축 및 비용 절감

    조정은 학습 토큰 100만 개당 요금이 청구됩니다. 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다. 모델 추론의 경우 Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.

    모델 유형 가격(백만 학습 토큰당)
    Gemini 2.5 Pro 지도 미세 조정 $25
    Gemini 2.5 Flash 지도 미세 조정
    선호도 조정
    $5
    Gemini 2.5 Flash Lite 지도 미세 조정
    선호도 조정
    $1.5
    Gemma 3 27B IT 지도 미세 조정 $6.83
    Llama 3.1 8B 지도 미세 조정 $0.67
    Llama 3.2 1B 지도 미세 조정 $0.28
    Llama 3.2 3B 지도 미세 조정 $0.61
    Llama 3.3 70B 지도 미세 조정 6.72달러
    Llama 4 Scout 17B 16E 지도 미세 조정 $5.77
    Qwen3 32B 지도 미세 조정 $6.57

    * 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
    * Gemini 조정 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.

    Vertex AI의 파트너 모델 가격 비교

    파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.

    AI21 Lab의 모델

    모델 가격 책정
    Jamba 1.5 Large (지원 중단됨) 입력: 토큰 100만 개당 $2
    출력: 토큰 100만 개당 $8
    Jamba 1.5 Mini (지원 중단됨) 입력: 토큰 100만 개당 $0.20
    출력: 토큰 100만 개당 $0.40

    Anthropic의 Claude 모델

    지역별 가격 책정 모델

    전역

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Opus 4.5 입력: $5.00
    출력: $25.00

    일괄 입력: $2.50
    일괄 출력: $12.50

    5분 캐시 쓰기: $6.25
    1시간 캐시 쓰기: $10.00

    캐시 적중: $0.50

    5분 일괄 캐시 쓰기: $3.125
    1시간 일괄 캐시 쓰기: $5.00
    일괄 캐시 적중: $0.25
    Claude Sonnet 4.5 입력: $3.00
    출력: $15.00

    일괄 입력: $1.50
    일괄 출력: $7.50

    5분 캐시 쓰기: $3.75
    1시간 캐시 쓰기: $6.00

    캐시 적중: $0.30

    일괄 캐시 쓰기: $1.88
    일괄 캐시 적중: $0.15
    입력: $6.00
    출력: $22.50

    일괄 입력: $3.00
    일괄 출력: $11.25

    5분 캐시 쓰기: $7.50
    1시간 캐시 쓰기: $12.00

    캐시 적중: $0.60

    일괄 캐시 쓰기: $3.75
    일괄 캐시 적중: $0.30
    Claude Haiku 4.5 입력: $1.00
    출력: $5.00

    일괄 입력: $0.50
    일괄 출력: $2.50

    5분 캐시 쓰기: $1.25
    1시간 캐시 쓰기: $2.00

    캐시 적중: $0.10

    일괄 캐시 쓰기: $0.625
    일괄 캐시 적중: $0.05

    us-east5

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Opus 4.5 입력: $5.50
    출력: $27.50

    일괄 입력: $2.75
    일괄 출력: $13.75

    5분 캐시 쓰기: $6.875
    1시간 캐시 쓰기: $11.00

    캐시 적중: $0.55

    5분 일괄 캐시 쓰기: $3.438
    1시간 일괄 캐시 쓰기: $5.50
    일괄 캐시 적중: $0.275
    Claude Sonnet 4.5 입력: $3.30
    출력: $16.50

    일괄 입력: $1.65
    일괄 출력: $8.25

    5분 캐시 쓰기: $4.13
    1시간 캐시 쓰기: $6.60

    캐시 적중: $0.33

    일괄 캐시 쓰기: $2.06
    일괄 캐시 적중: $0.17
    입력: $6.60
    출력: $24.75

    일괄 입력: $3.30
    일괄 출력: $12.38

    5분 캐시 쓰기: $8.25
    1시간 캐시 쓰기: $13.20

    캐시 적중: $0.66

    일괄 캐시 쓰기: $4.13
    일괄 캐시 적중: $0.33
    Claude Haiku 4.5 입력: $1.10
    출력: $5.50

    일괄 입력: $0.55
    일괄 출력: $2.75

    5분 캐시 쓰기: $1.375
    1시간 캐시 쓰기: $2.20

    캐시 쓰기: $1.375
    캐시 적중: $0.11

    일괄 캐시 쓰기: $0.688
    일괄 캐시 적중: $0.055

    europe-west1

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Opus 4.5 입력: $5.50
    출력: $27.50

    일괄 입력: $2.75
    일괄 출력: $13.75

    5분 캐시 쓰기: $6.875
    1시간 캐시 쓰기: $11.00

    캐시 적중: $0.55

    5분 일괄 캐시 쓰기: $3.438
    1시간 일괄 캐시 쓰기: $5.50
    일괄 캐시 적중: $0.275
    Claude Sonnet 4.5 입력: $3.30
    출력: $16.50

    일괄 입력: $1.65
    일괄 출력: $8.25

    5분 캐시 쓰기: $4.13
    1시간 캐시 쓰기: $6.60

    캐시 적중: $0.33

    일괄 캐시 쓰기: $2.06
    일괄 캐시 적중: $0.17
    입력: $6.60
    출력: $24.75

    일괄 입력: $3.30
    일괄 출력: $12.38

    5분 캐시 쓰기: $8.25
    1시간 캐시 쓰기: $13.20

    캐시 적중: $0.66

    일괄 캐시 쓰기: $4.13
    일괄 캐시 적중: $0.33
    Claude Haiku 4.5 입력: $1.10
    출력: $5.50

    일괄 입력: $0.55
    일괄 출력: $2.75

    5분 캐시 쓰기: $1.375
    1시간 캐시 쓰기: $2.20

    캐시 적중: $0.11

    일괄 캐시 쓰기: $0.688
    일괄 캐시 적중: $0.055

    asia-southeast1

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Opus 4.5 입력: $5.50
    출력: $27.50

    일괄 입력: $2.75
    일괄 출력: $13.75

    5분 캐시 쓰기: $6.875
    1시간 캐시 쓰기: $11.00

    캐시 적중: $0.55

    5분 일괄 캐시 쓰기: $3.438
    1시간 일괄 캐시 쓰기: $5.50
    일괄 캐시 적중: $0.275
    Claude Sonnet 4.5 입력: $3.30
    출력: $16.50

    일괄 입력: $1.65
    일괄 출력: $8.25

    5분 캐시 쓰기: $4.13
    1시간 캐시 쓰기: $6.60

    캐시 적중: $0.33

    일괄 캐시 쓰기: $2.06
    일괄 캐시 적중: $0.17
    입력: $6.60
    출력: $24.75

    일괄 입력: $3.30
    일괄 출력: $12.38

    5분 캐시 쓰기: $8.25
    1시간 캐시 쓰기: $13.20

    캐시 적중: $0.66

    일괄 캐시 쓰기: $4.13
    일괄 캐시 적중: $0.33

    asia-east1

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Haiku 4.5 입력: $1.10
    출력: $5.50

    일괄 입력: $0.55
    일괄 출력: $2.75

    5분 캐시 쓰기: $1.375
    1시간 캐시 쓰기: $2.20

    캐시 쓰기: $1.375
    캐시 적중: $0.11

    일괄 캐시 쓰기: $0.688
    일괄 캐시 적중: $0.055

    * 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

    모든 리전에서 동일한 가격 책정 모델

    모델 가격 (/1백만 토큰) < 20만 입력 토큰 가격 (/1백만 토큰) >= 20만 입력 토큰
    Claude Opus 4.1 입력: $15
    출력: $75

    일괄 입력: $7.50
    일괄 출력: $37.50

    5분 캐시 쓰기: $18.75
    1시간 캐시 쓰기: $30

    캐시 적중: $1.50

    일괄 캐시 쓰기: $9.375
    일괄 캐시 적중: $0.75
    해당 사항 없음
    Claude Opus 4 입력: $15
    출력: $75

    일괄 입력: $7.50
    일괄 출력: $37.50

    5분 캐시 쓰기: $18.75
    1시간 캐시 쓰기: $30

    캐시 적중: $1.50

    일괄 캐시 쓰기: $9.375
    일괄 캐시 적중: $0.75
    해당 사항 없음
    Claude Sonnet 4 입력: $3
    출력: $15

    일괄 입력: $1.50
    일괄 출력: $7.50

    5분 캐시 쓰기: $3.75
    1시간 캐시 쓰기: $6.00

    캐시 적중: $0.30

    일괄 캐시 쓰기: $1.875
    일괄 캐시 적중: $0.15
    입력: $6
    출력: $22.50

    일괄 입력: $3
    일괄 출력: $11.25

    5분 캐시 쓰기: $7.50
    1시간 캐시 쓰기: $12.00

    캐시 적중: $0.60

    일괄 캐시 쓰기: $3.75
    일괄 캐시 적중: $0.30
    Claude 3.5 Haiku 입력: $0.80
    출력: $4

    일괄 입력: $0.40
    일괄 출력: $2

    5분 캐시 쓰기: $1
    1시간 캐시 쓰기: $1.60

    캐시 적중: $0.08

    일괄 캐시 쓰기: $0.50
    일괄 캐시 적중: $0.04
    해당 사항 없음
    Claude 3 Haiku 입력: $0.25
    출력: $1.25

    5분 캐시 쓰기: $0.30
    1시간 캐시 쓰기: $0.50

    캐시 적중: $0.03
    해당 사항 없음
    Claude 3.7 Sonnet (지원 중단됨) 입력: $3
    출력: $15

    일괄 입력: $1.50
    일괄 출력: $7.50

    캐시 쓰기: $3.75
    캐시 적중: $0.30

    일괄 캐시 쓰기: $1.875
    일괄 캐시 적중: $0.15
    해당 사항 없음
    Claude 3.5 Sonnet v2 (지원 중단됨) 입력: $3
    출력: $15

    일괄 입력: $1.50
    일괄 출력: $7.50

    캐시 쓰기: $3.75
    캐시 적중: $0.30

    일괄 캐시 쓰기: $1.875
    일괄 캐시 적중: $0.15
    해당 사항 없음
    Claude 3.5 Sonnet (지원 중단됨) 입력: $3
    출력: $15

    캐시 쓰기: $3.75
    캐시 적중: $0.30
    해당 사항 없음
    Claude 3 Opus (지원 중단) 입력: $15
    출력: $75

    캐시 쓰기: $18.75
    캐시 적중: $1.50
    해당 사항 없음

    * 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

    도구 가격 책정

    도구 가격
    웹 검색 요청 검색 1,000회당$10
    지원되는 모델: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, Claude Opus 4

    * 쿼리 입력 컨텍스트가 200, 000개 토큰 이상인 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.

    Deepseek의 모델

    모델 가격 책정
    DeepSeek-V3.1 입력: 토큰 100만 개당 $0.60
    출력: 토큰 100만 개당 $1.70

    일괄 입력: 토큰 100만 개당 $0.30
    일괄 출력: 토큰 100만 개당 $0.85
    DeepSeek-V3.2 * 입력: 토큰 100만 개당 $0.56
    출력: 토큰 100만 개당 $1.68

    일괄 입력: 토큰 100만 개당 $0.28
    일괄 출력: 토큰 100만 개당 $0.84
    DeepSeek-R1 (0528) 입력: 토큰 100만 개당 $1.35
    출력: 토큰 100만 개당 $5.40

    일괄 입력: 토큰 100만 개당 $0.675
    일괄 출력: 토큰 100만 개당 $2.70
    DeepSeek-OCR 입력: 토큰 100만 개당 $0.30 (또는 페이지당 $0.0003)
    출력: 토큰 100만 개당 $1.20 (또는 페이지당 $0.00012)
    • 2025년 12월 17일까지 무료로 사용할 수 있습니다.

    MiniMax의 모델

    모델 가격 책정
    MiniMax-M2 입력: 토큰 100만 개당 $0.30
    출력: 토큰 100만 개당 $1.20

    Moonshot의 모델

    모델 가격 책정
    Kimi-K2-Thinking 입력: 토큰 100만 개당 $0.60
    출력: 토큰 100만 개당 $2.50

    Qwen 모델

    모델 가격 책정
    Qwen3-Next-80B-Thinking 입력: 토큰 100만 개당 $0.15
    출력: 토큰 100만 개당 $1.20
    Qwen3-Next-80B-Instruct 입력: 토큰 100만 개당 $0.15
    출력: 토큰 100만 개당 $1.20
    Qwen3-Coder-480B-A35B-Instruct 입력: 토큰 100만 개당 $0.22
    출력: 토큰 100만 개당 $1.80

    일괄 입력: 토큰 100만 개당 $0.11
    일괄 출력: 토큰 100만 개당 $0.90
    Qwen3-235B-A22B-Instruct-2507 입력: 토큰 100만 개당 $0.22
    출력: 토큰 100만 개당 $0.88

    일괄 입력: 토큰 100만 개당 $0.11
    일괄 출력: 토큰 100만 개당 $0.44

    OpenAI 모델

    모델 가격 책정
    gpt-oss-120b 입력: 토큰 100만 개당 $0.09
    출력: 토큰 100만 개당 $0.36

    일괄 입력: 토큰 100만 개당 $0.045
    일괄 출력: 토큰 100만 개당 $0.18
    gpt-oss-20b 입력: 토큰 100만 개당 $0.07
    출력: 토큰 100만 개당 $0.25

    일괄 입력: 토큰 100만 개당 $0.035
    일괄 출력: 토큰 100만 개당 $0.125

    Meta의 Llama 모델

    모델 가격 책정
    Llama 3.1 405B 입력: 토큰 100만 개당 $5.00
    출력: 토큰 100만 개당 $16.00
    Llama 3.3 70B 입력: 토큰 100만 개당 $0.72
    출력: 토큰 100만 개당 $0.72

    일괄 입력: 토큰 100만 개당 $0.36
    일괄 출력: 토큰 100만 개당 $0.36
    Llama 4 Scout 입력: 100만 토큰당 $0.25
    출력: 100만 토큰당 $0.70

    일괄 입력: 100만 토큰당 $0.125
    일괄 출력: 100만 토큰당 $0.35
    Llama 4 Maverick 입력: 토큰 100만 개당 $0.35
    출력: 토큰 100만 개당 $1.15

    일괄 입력: 토큰 100만 개당 $0.175
    일괄 출력: 토큰 100만 개당 $0.575

    Mistral AI 모델

    모델 가격 책정
    Mistral OCR(25.05) 입력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005)
    출력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005)
    Mistral Medium 3 입력: 토큰 100만 개당 $0.40
    출력: 토큰 100만 개당 $2.00
    Mistral Small 3.1(25.03) 입력: 토큰 100만 개당 $0.10
    출력: 토큰 100만 개당 $0.30
    Mistral Large (24.11) (지원 중단) 입력: 토큰 100만 개당 $2.00
    출력: 토큰 100만 개당 $6.00
    Codestral 2 입력: 토큰 100만 개당 $0.30
    출력: 토큰 100만 개당 $0.90
    Codestral (25.01) (지원 중단) 입력: 토큰 100만 개당 $0.30
    출력: 토큰 100만 개당 $0.90

    커스텀 견적 요청

    Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.
    영업팀에 문의