Vertex AI 가격 책정
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스를 포함한 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.
Google 모델
Gemini
Vertex AI의 멀티모달 모델을 사용하면 텍스트 또는 미디어 (이미지, 동영상)를 입력할 수 있습니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 공백은 개수에서 제외되므로 토큰당 약 4개의 문자가 됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다.
모델 | 기능 | 유형 | 가격 ( =< 128K 입력 토큰) |
가격 (128,000개 이상의 입력 토큰) |
---|---|---|---|---|
Gemini 1.5 Flash | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자 $0.000002 / 초 |
$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자 $0.000004 / 초 |
텍스트 출력 | $0.000075 / 1,000자 | 1,000자당 $0.00015 | ||
조정* | 학습 토큰 | 토큰 100만 개당 $8 | ||
Gemini 1.5 Pro도 | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00032875 / 이미지 $0.00032875 / 초 $0.0003125 / 1,000자 $0.00003125 / 초 |
$0.0006575 / 이미지 $0.0006575 / 초 $0.000625 / 1,000자 $0.0000625 / 초 |
텍스트 출력 | $0.00125 / 1,000자 | 1,000자당 $0.0025 | ||
조정* | 학습 토큰 | 토큰 100만 개당 $80 | ||
Gemini 1.0 Pro | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 |
$0.0025/이미지 $0.002/초 $0.000125/1,000자 |
|
텍스트 출력 | $0.000375/1000자 | |||
Google 검색으로 그라운딩 | 텍스트 | 그라운딩 요청 | 1,000개 요청당 $35 (일 최대 100만 개 요청). 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128, 000개를 초과하는 경우 모든 토큰에 긴 컨텍스트 요금이 적용됩니다.
* Gemini 모델은 배치 모드에서 50% 할인된 가격으로 사용할 수 있습니다.
* Gemini 1.0 Pro는 최대 32K 컨텍스트 창만 지원합니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개와 동일합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색으로 Grounding: 비용을 최적화하기 위해 동적 검색을 사용하는 경우 응답에 웹의 그라운딩 지원 URL이 하나 이상 포함된 요청에 대해서만 Google 검색으로 Grounding 비용이 청구됩니다. Gemini에 대한 비용은 항상 청구됩니다.
Imagen
Vertex AI의 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.
모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
---|---|---|---|---|---|
Imagen 3 | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.04 |
Imagen 3 빠름 | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.02 |
Imagen 2, Imagen | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.020 |
이미지 수정 | 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 | 이미지/텍스트 프롬프트 | 이미지 | 이미지당 $0.020 | |
업스케일링 | 생성된 이미지의 해상도를 2K 및 4K로 높입니다. | 이미지 | 이미지 | 이미지당 $0.003 | |
미세 조정 | 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 | 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 | 미세 조정된 모델(사용자 제공 주제로 학습한 후) | 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정) | |
시각적 캡셔닝 | 이미지에 대한 짧은 텍스트 설명 또는 긴 텍스트 설명 생성 | 이미지 | 텍스트 캡션 | $0.0015/이미지 | |
시각적 질의 응답 | 이미지를 참조하는 질문에 대한 답변 제공 | 이미지/텍스트 프롬프트 | 텍스트 답변 | $0.0015/이미지 |
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
임베딩
모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
---|---|---|---|---|---|
멀티모달 임베딩 | 멀티모달용 임베딩: 텍스트 | 텍스트를 입력으로 사용하여 임베딩 생성 | 텍스트 | 임베딩 | 1,000자 입력당 $0.0002 |
멀티모달용 임베딩: 이미지 | 이미지를 입력으로 사용하여 임베딩 생성 | 이미지 | 임베딩 | $0.0001 / 이미지 입력 | |
멀티모달용 임베딩: 동영상 플러스 | Video Plus | 동영상 | 임베딩(동영상 분당 최대 15개의 임베딩) | 동영상 초당 $0.0020 | |
멀티모달용 임베딩: 동영상 표준 | Video Standard | 동영상 | 임베딩(동영상 분당 최대 8개의 임베딩) | 동영상 1초당 $0.0010 | |
멀티모달용 임베딩: 동영상 에센셜 | Video Essential | 동영상 | 임베딩(동영상 분당 최대 4개의 임베딩) | 동영상 1초당 $0.0005 |
모델 | 유형 | 리전 | 1,000자당 가격 |
---|---|---|---|
텍스트용 임베딩 | 입력 | 전역 |
|
출력 | 글로벌 |
|
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
코드 완성
Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.
모델 | 유형 | 리전 | 1,000자당 가격 |
---|---|---|---|
코드 완성용 Codey | 입력 | 글로벌 |
|
출력 | 글로벌 |
|
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
번역 (텍스트)
Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 자연스럽고 인간의 번역처럼 들리지만 지원 언어의 범위가 더 제한적입니다 (자세히 알아보기).
모델 | 메서드 | 사용 | 100만 자당 가격 |
---|---|---|---|
LLM | 텍스트 번역 (미리보기)* | 월별 입력 문자 수 |
백만 자당 $10** |
월별 출력 문자 수 |
백만 자당 $10** |
가격은 미국 달러(USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
*가격은 모델에서 처리한 문자 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.
컨텍스트 캐싱
컨텍스트 캐싱을 사용하면 입력 텍스트 또는 미디어의 컨텍스트 부분을 Gemini 모델에 캐싱하여 Gemini 입력 토큰 처리 비용을 75% 절감하고 콘텐츠 생성 지연 시간을 단축할 수 있습니다. 사용자가 제어할 수 있는 캐시에 데이터가 저장되는 시간에 따라 'Context Cache Storage' 요금이 결정됩니다. 캐시된 컨텍스트를 만들 때 사용자에게 표준 입력 토큰 비용이 청구됩니다. 입력 데이터의 캐시 적중은 일반 입력 비용 대신 '캐시된 입력'이라는 할인된 요금으로 청구됩니다. 스토리지와 입력 모두의 데이터 크기는 Gemini 입력 가격 책정과 동일한 방식으로 계산됩니다.
모델 | 기능 | 유형 | 가격 ( 128,000개 미만의 입력 토큰) | 가격(입력 토큰 128,000개 이상) |
---|---|---|---|---|
Gemini 1.5 Flash | 캐시된 입력 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
이미지당 0.000005 초당 0.000005 1,000자당 0.0000046875 초당 0.0000005 |
0.00001 / 이미지 0.00001 / 초 0.000009375 / 1,000자 0.000001 / 초 |
컨텍스트 캐시 스토리지 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
0.000263 / 이미지 / 시간 0.000263/ 초 / 시간 0.00025 / 1,000자 / 시간 0.000025 / 초 / 시간 |
||
Gemini 1.5 Pro도 | 캐시된 입력 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
0.0000821875 / 이미지 0.0000821875 / 초 0.000078125 / 1,000자 0.0000078125 / 초 |
0.000164375 / 이미지 0.000164375 / 초 0.00015625 / 1,000자 0.000015625 / 초 |
컨텍스트 캐시 스토리지 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
0.0011835 / 이미지 / 시간 0.0011835/ 초 / 시간 0.001125 / 1,000자 / 시간 0.0001125 / 초 / 시간 |
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
캐시된 비용 계산 예시
사용자가 TTL이 2시간인 250,000자 캐시 컨텍스트를 만들고 그 후 2시간 동안 20개의 개별 요청을 Gemini 1.5 Pro 모델에 전송하며 각 요청에 200자(영문 기준) 쿼리를 추가하고 캐시 컨텍스트에 400자(영문 기준) 출력을 추가하는 경우 총 요금은 다음과 같이 계산됩니다.
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
비용 계산 예시
사용자가 PaLM Text Bison 모델에 5개의 개별 요청을 전송하고 각 요청의 입력 값이 200자(영문 기준)이고 출력 값이 400자(영문 기준)인 경우 총 요금은 다음과 같이 계산됩니다.
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
파트너 모델
파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.
AI21 Lab의 모델
모델 | 가격 책정 |
---|---|
Jamba 1.5 Large | 입력: 토큰 100만 개당 $2 출력: 토큰 100만 개당 $8 |
Jamba 1.5 Mini | 입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.40 |
Anthropic의 Claude 모델
모델 | 가격 책정 |
---|---|
Claude 3.5 Haiku | 입력: 토큰 100만 개당 $1.00 출력: 토큰 100만 개당 $5.00 |
Claude 3.5 Sonnet v2 | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 |
Claude 3.5 Sonnet | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 |
Claude 3 Haiku | 입력: 토큰 1백만 개당 $0.25 출력: 토큰 1백만 개당 $1.25 |
Claude 3 Sonnet | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 |
Claude 3 Opus | 입력: 토큰 100만 개당 $15 출력: 토큰 100만 개당 $75 |
Meta의 Llama 모델
모델 | 가격 책정 |
---|---|
Llama 3.1 405B | 입력: 토큰 100만 개당 $5.00 출력: 토큰 100만 개당 $16.00 |
Mistral AI의 모델
모델 | 가격 책정 |
---|---|
Mistral Large (24.11) | 입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00 |
Mistral Large (24.07) | 입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00 |
Mistral Nemo | 입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $0.15 |
Codestral (24.05) | 입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.60 |