Vertex AI 가격 책정

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML 플랫폼 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini

Vertex AI의 멀티모달 모델을 사용하면 텍스트 또는 미디어 (이미지, 동영상)를 입력할 수 있습니다. 텍스트 입력은 입력(프롬프트) 1,000자(영문 기준) 및 1,000자 출력(응답)마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되고 공백은 개수에서 제외되므로 토큰당 약 4자가 됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대해서만 요금이 청구됩니다. 각 결제 주기가 끝날 때 1센트 ($0.01)의 분수는 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 단위로 요금이 청구됩니다.

모델 특성 유형 가격
( 컨텍스트 기간 128,000개 미만)
가격
(컨텍스트 기간 128,000개 초과)
Gemini 1.5 Flash 멀티모달 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
$0.0001315 / 이미지
$0.0001315 / 초
$0.000125 / 1,000자(영문 기준)
$0.0000125 / 초
$0.000263 / 이미지
$0.000263 / 초
$0.00025 / 1,000자(영문 기준)
$0.000025 / 초
텍스트 출력 $0.000375/1000자 $0.00075 / 1,000자(영문 기준)
Gemini 1.5 Pro도 멀티모달 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
$0.001315 / 이미지
$0.001315 / 초
$0.00125 / 1,000자(영문 기준)
$0.000125 / 초
$0.00263 / 이미지
$0.00263 / 초
$0.0025 / 1,000자(영문 기준)
$0.00025 / 초
텍스트 출력 $0.00375 / 1,000자(영문 기준) $0.0075 / 1,000자(영문 기준)
Gemini 1.0 Pro 멀티모달 이미지 입력
동영상 입력
텍스트 입력
$0.0025/이미지
$0.002/초
$0.000125/1,000자
텍스트 출력 $0.000375/1000자
Google 검색으로 그라운딩 텍스트 그라운딩 요청 요청 1,000회당 $35 (일일 최대 100만 개 요청)
일일 100만 개 이상의 요청이 필요한 경우
계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128K보다 길면 모든 토큰에 긴 컨텍스트 요율로 요금이 청구됩니다.
* Gemini 모델은 배치 모드로 50% 할인된 가격으로 제공됩니다.
* Gemini 1.0 Pro는 최대 32,000개의 컨텍스트 윈도우만 지원합니다.
* PDF는 이미지 1개에 해당하는 PDF 페이지 1개로 청구되며 이미지 1개에 해당합니다.

Imagen

Vertex AI의 이미지 생성 기능을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.

모델 기능 Description(설명) 입력 출력 가격
Imagen 이미지 생성 이미지 생성 텍스트 프롬프트 이미지 이미지당 $0.020
이미지 수정 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 이미지/텍스트 프롬프트 이미지 이미지당 $0.020
업스케일링 생성된 이미지의 해상도를 2K 및 4K로 늘리기 이미지 이미지 이미지당 $0.003
미세 조정 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 미세 조정된 모델(사용자 제공 주제로 학습한 후) 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
시각적 캡셔닝 이미지의 짧은 텍스트 또는 긴 텍스트 설명 생성 이미지 텍스트 캡션 $0.0015/이미지
시각적 질의 응답 이미지를 참조하는 질문을 기반으로 답변 제공 이미지/텍스트 프롬프트 텍스트 답변 $0.0015/이미지

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

임베딩

모델 기능 Description(설명) 입력 출력 가격
멀티모달 임베딩 멀티모달용 임베딩: 텍스트 텍스트를 입력으로 사용하여 임베딩 생성 텍스트 임베딩 $0.0002 / 1,000자(영문 기준) 입력
멀티모달용 임베딩: 이미지 이미지를 입력으로 사용하여 임베딩 생성 이미지 임베딩 $0.0001 / 이미지 입력
멀티모달을 위한 임베딩: Video Plus Video Plus 동영상 임베딩(동영상 분당 최대 15개의 임베딩) 동영상 초당 $0.0020
멀티모달을 위한 임베딩: 동영상 표준 Video Standard 동영상 임베딩(동영상 분당 최대 8개의 임베딩) 동영상 초당 $0.0010
멀티모달을 위한 임베딩: 필수 동영상 Video Essential 동영상 임베딩(동영상 분당 최대 4개의 임베딩) 동영상 초당 $0.0005
모델 유형 리전 1,000자당 가격
텍스트용 임베딩 입력 전역
  • 온라인 요청: $0.000025
  • 일괄 요청: $0.00002
출력 전역
  • 온라인 요청: 무료
  • 일괄 요청: 무료

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

코드 완성

Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계 중에는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대해서만 요금이 청구됩니다. 각 결제 주기가 끝날 때 1센트 (0.01달러)의 소수는 1센트로 반올림됩니다.

모델 유형 리전 1,000자당 가격
코드 완성용 Codey 입력 글로벌
  • 온라인 요청: $0.00025
출력 전역
  • 온라인 요청: $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

컨텍스트 캐싱

컨텍스트 캐싱을 사용하면 입력 텍스트 또는 미디어의 컨텍스트 부분을 Gemini 모델에 캐싱하여 Gemini 입력 토큰 처리 비용을 75% 줄이고 콘텐츠 생성 지연 시간을 줄일 수 있습니다. 캐시에 데이터가 저장되는 시간은 사용자가 제어할 수 있는 시간에 따라 '컨텍스트 캐시 스토리지' 요금이 결정됩니다. 입력 데이터의 캐시 적중에는 일반적인 입력 비용 대신 할인된 요율('캐시된 입력')이 청구됩니다. 스토리지 및 입력의 데이터 크기는 Gemini 입력 가격과 동일한 방식으로 계산됩니다.

모델 기능 유형 가격 ( 128,000개 미만의 컨텍스트 윈도우) 가격( 128,000개 이상의 컨텍스트 윈도우)
Gemini 1.5 Flash 캐시된 입력 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.000032875 / 이미지
0.000032875 / 초
0.00003125 / 1,000자(영문 기준)
0.000003125 / 초
0.00006575 / 이미지
0.00006575 / 초
0.0000625 / 1,000자(영문 기준)
0.00000625 / 초
컨텍스트 캐시 스토리지 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.000263 / 이미지 / 시간
0.000263/ 초 / 시간
0.00025 / 1,000자 / 시간
0.000025 / 초 / 시간
Gemini 1.5 Pro도 캐시된 입력 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.00032875 / 이미지
0.00032875 / 초
0.0003125 / 1,000자(영문 기준)
0.00003125 / 초
0.0006575 / 이미지
0.0006575 / 초
0.000625 / 1,000자(영문 기준)
0.0000625 / 초
컨텍스트 캐시 스토리지 이미지 입력
비디오 입력
텍스트 입력
오디오 입력
0.0011835 / 이미지 / 시간
0.0011835/ 초 / 시간
0.001125 / 1,000자(영문 기준)/시간
0.0001125 / 초 / 시간

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

비용 계산 예시

사용자가 PaLM Text Bison 모델에 5개의 개별 요청을 전송하고 각 요청의 입력 값이 200자(영문 기준)이고 출력 값이 400자(영문 기준)인 경우 총 요금은 다음과 같이 계산됩니다.

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

파트너 모델

파트너 모델은 Google 파트너가 개발한 생성형 AI 모델을 선별한 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 표에는 Google 파트너 모델의 가격 책정 세부정보가 나와 있습니다.

Anthropic의 Claude 모델

모델 가격 책정
Claude 3.5 Sonnet 입력: 토큰 백만 개당 $3
출력: 토큰 백만 개당 $15
Claude 3 Opus 입력: 토큰 100만 개당 $15
출력: 토큰 백만 개당 $75
Claude 3 Haiku 입력: 토큰 백만 개당 $0.25
출력: 토큰 백만 개당 $1.25
Claude 3 Sonnet 입력: 토큰 백만 개당 $3
출력: 토큰 백만 개당 $15

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.
영업팀에 문의