Vertex AI 가격 책정

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML 플랫폼 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini

Vertex AI의 멀티모달 모델을 사용하면 텍스트 또는 미디어 (이미지, 동영상)를 입력할 수 있습니다. 텍스트 입력은 입력(프롬프트) 1,000자(영문 기준) 및 1,000자 출력(응답)마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되고 공백은 개수에서 제외되므로 토큰당 약 4자가 됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대해서만 요금이 청구됩니다. 각 결제 주기가 끝날 때 1센트 ($0.01)의 분수는 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 단위로 요금이 청구됩니다.

모델 기능 유형 가격
( 입력 토큰 128,000개 미만)
가격
(입력 토큰 128,000개 초과)
Gemini 1.5 Flash 멀티모달 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
$0.00002 / 이미지
$0.00002 / 초
$0.00001875 / 1,000자(영문 기준)
$0.000002 / 초
$0.00004 / 이미지
$0.00004 / 초
$0.0000375 / 1,000자(영문 기준)
$0.000004 / 초
텍스트 출력 $0.000075 / 1,000자(영문 기준) $0.00015 / 1,000자(영문 기준)
조정* 학습 토큰 $8 / M 토큰
Gemini 1.5 Pro도 멀티모달 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
$0.00032875 / 이미지
$0.00032875 / 초
$0.0003125 / 1,000자(영문 기준)
$0.00003125 / 초
$0.0006575 / 이미지
$0.0006575 / 초
$0.000625 / 1,000자(영문 기준)
$0.0000625 / 초
텍스트 출력 $0.00125 / 1,000자(영문 기준) $0.0025 / 1,000자(영문 기준)
조정* 학습 토큰 $80 / M 토큰
Gemini 1.0 Pro 멀티모달 이미지 입력
동영상 입력
텍스트 입력
$0.0025/이미지
$0.002/초
$0.000125/1,000자
텍스트 출력 $0.000375/1000자
Google 검색으로 그라운딩 텍스트 그라운딩 요청 요청 1,000회당 $35 (일일 최대 100만 개 요청)
일일 100만 개 이상의 요청이 필요한 경우
계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128K보다 길면 모든 토큰에 긴 컨텍스트 요율로 요금이 청구됩니다.
* Gemini 모델은 배치 모드로 50% 할인된 가격으로 제공됩니다.
* Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
* PDF는 이미지 1개에 해당하는 PDF 페이지 1개로 청구되며 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격이 기본 모델과 동일합니다.
* Google 검색을 사용한 그라운딩: 비용을 최적화하기 위해 동적 검색을 사용하는 경우 응답에 웹의 그라운딩 지원 URL이 하나 이상 포함된 요청에만 Google 검색 그라운딩에 대한 요금이 청구됩니다. Gemini 비용은 항상 적용됩니다.

Imagen

Vertex AI의 Imagen을 사용하면 새로운 이미지를 생성하고 사용자가 제공하는 텍스트 프롬프트를 기반으로 이미지를 편집하거나, 다른 여러 기능과 함께 정의한 마스크 영역을 사용하여 이미지의 일부만 편집할 수 있습니다.

모델 기능 Description(설명) 입력 출력 가격
Imagen 3 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.04
Imagen 3 빠름 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.02
Imagen 2, Imagen 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.020
이미지 수정 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 이미지/텍스트 프롬프트 이미지 이미지당 $0.020
업스케일링 생성된 이미지의 해상도를 2K 및 4K로 증가 이미지 이미지 이미지당 $0.003
미세 조정 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 미세 조정된 모델(사용자 제공 주제로 학습한 후) 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
시각적 캡셔닝 이미지의 짧은 텍스트 또는 긴 텍스트 설명 생성 이미지 텍스트 캡션 $0.0015/이미지
시각적 질의 응답 이미지를 참조하는 질문을 기반으로 답변 제공 이미지/텍스트 프롬프트 텍스트 답변 $0.0015/이미지

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

임베딩

모델 기능 Description(설명) 입력 출력 가격
멀티모달 임베딩 멀티모달용 임베딩: 텍스트 텍스트를 입력으로 사용하여 임베딩 생성 텍스트 임베딩 $0.0002 / 1,000자(영문 기준) 입력
멀티모달용 임베딩: 이미지 이미지를 입력으로 사용하여 임베딩 생성 이미지 임베딩 $0.0001 / 이미지 입력
멀티모달 임베딩: Video Plus Video Plus 동영상 임베딩(동영상 분당 최대 15개의 임베딩) 동영상 초당 $0.0020
멀티모달을 위한 임베딩: 동영상 표준 Video Standard 동영상 임베딩(동영상 분당 최대 8개의 임베딩) 동영상 초당 $0.0010
멀티모달을 위한 임베딩: 필수 동영상 Video Essential 동영상 임베딩(동영상 분당 최대 4개의 임베딩) 동영상 초당 $0.0005
모델 유형 리전 1,000자당 가격
텍스트용 임베딩 입력 전역
  • 온라인 요청: $0.000025
  • 일괄 요청: $0.00002
출력 글로벌
  • 온라인 요청: 무료
  • 일괄 요청: 무료

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

코드 완성

Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계 중에는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대해서만 요금이 청구됩니다. 각 결제 주기가 끝날 때 1센트 (0.01달러)의 소수는 1센트로 반올림됩니다.

모델 유형 리전 1,000자당 가격
코드 완성용 Codey 입력 글로벌
  • 온라인 요청: $0.00025
출력 글로벌
  • 온라인 요청: $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

번역 (텍스트)

Vertex AI API와 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 유창하고 사람이 말하는 것처럼 느껴지는 경향이 있지만, 언어 지원이 더 제한적입니다(자세히 알아보기).

모델 메서드 사용 백만 자당 가격
LLM 텍스트 번역 (미리보기)* 월별 입력 문자 수

백만 자당 $10*

월별 출력 문자 수

백만 자당 $10*

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
*가격은 모델이 처리하는 문자 기준으로 책정됩니다. 문자 수에 대한 자세한 내용은 청구 대상 문자를 참고하세요.

컨텍스트 캐싱

컨텍스트 캐싱을 사용하면 입력 텍스트 또는 미디어의 컨텍스트 부분을 Gemini 모델에 캐시하여 Gemini 입력 토큰 처리 비용을 75% 줄이고 콘텐츠 생성 지연 시간을 줄일 수 있습니다. 캐시에 데이터가 저장되는 시간은 사용자가 제어할 수 있는 시간에 따라 '컨텍스트 캐시 스토리지' 요금이 결정됩니다. 캐시된 컨텍스트를 만들면 사용자에게 표준 입력 토큰 비용이 청구됩니다. 입력 데이터에 대한 캐시 적중은 일반적인 입력 비용 대신 할인된 요율('캐시된 입력')으로 청구됩니다. 스토리지 및 입력의 데이터 크기는 Gemini 입력 가격과 동일한 방식으로 계산됩니다.

모델 기능 유형 가격 ( =< 128,000개의 입력 토큰) 가격(128,000개 입력 토큰 초과)
Gemini 1.5 Flash 캐시된 입력 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.000005 / 이미지
0.000005 / 초
0.0000046875 / 1,000자(영문 기준)
0.0000005 / 초
0.00001 / 이미지
0.00001 / 초
0.000009375 / 1,000자(영문 기준)
0.000001 / 초
컨텍스트 캐시 스토리지 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.000263 / 이미지 / 시간
0.000263/ 초 / 시간
0.00025 / 1,000자 / 시간
0.000025 / 초 / 시간
Gemini 1.5 Pro도 캐시된 입력 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.0000821875 / 이미지
0.0000821875 / 초
0.000078125 / 1,000자(영문 기준)
0.0000078125 / 초
0.000164375 / 이미지
0.000164375 / 초
0.00015625 / 1,000자(영문 기준)
0.000015625 / 초
컨텍스트 캐시 스토리지 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.0011835 / 이미지 / 시간
0.0011835/ 초 / 시간
0.001125 / 1,000자(영문 기준)/시간
0.0001125 / 초 / 시간

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

캐시된 비용 계산의 예

사용자가 2시간의 TTL로 250,000자(영문 기준)의 캐시된 컨텍스트를 생성한 후 이 2시간 동안 Gemini 1.5 Pro 모델에 20개의 개별 요청을 보내고 각 요청에 캐시된 컨텍스트에 200자(영문 기준) 쿼리가 추가되고 400자(영문 기준) 출력에 추가된 경우 총 요금은 다음과 같이 계산됩니다.

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

비용 계산 예시

사용자가 PaLM Text Bison 모델에 5개의 개별 요청을 전송하고 각 요청의 입력 값이 200자(영문 기준)이고 출력 값이 400자(영문 기준)인 경우 총 요금은 다음과 같이 계산됩니다.

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

파트너 모델

파트너 모델은 Google 파트너가 개발한 생성형 AI 모델을 선별한 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에는 Google 파트너 모델의 가격 책정 세부정보가 나와 있습니다.

AI21 Lab의 모델

모델 가격 책정
Jamba 1.5 Large 입력: 토큰 백만 개당 $2
출력: 토큰 백만 개당 $8
Jamba 1.5 Mini 입력: 토큰 백만 개당 $0.20
출력: 토큰 백만 개당 $0.40

Anthropic의 Claude 모델

모델 가격 책정
클로드 3.5 하이쿠 입력: 토큰 백만 개당 $1.00
출력: 토큰 백만 개당 $5.00
Claude 3.5 Sonnet v2 입력: 토큰 백만 개당 $3
출력: 토큰 백만 개당 $15
Claude 3.5 Sonnet 입력: 토큰 백만 개당 $3
출력: 토큰 백만 개당 $15
Claude 3 Haiku 입력: 토큰 백만 개당 $0.25
출력: 토큰 백만 개당 $1.25
Claude 3 Sonnet 입력: 토큰 백만 개당 $3
출력: 토큰 백만 개당 $15
Claude 3 Opus 입력: 토큰 100만 개당 $15
출력: 토큰 백만 개당 $75

Meta의 Llama 모델

모델 가격 책정
Llama 3.1 405B 입력: 토큰 백만 개당 $5
출력: 토큰 백만 개당 $16

Mistral AI의 모델

모델 가격 책정
Mistral Large (2407) 입력: 토큰 백만 개당 $2
출력: 토큰 백만 개당 $6
미스트랄 네모 입력: 토큰 백만 개당 $0.15
출력: 토큰 백만 개당 $0.15
Codestral 입력: 토큰 백만 개당 $0.20
출력: 토큰 백만 개당 $0.60

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.
영업팀에 문의