Harga Vertex AI

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Vertex AI.

Model Google

Gemini

Dengan model Multimodal di Vertex AI, Anda dapat memasukkan teks atau media (gambar, video). Input Teks dikenai biaya per 1.000 karakter input (prompt) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari penghitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input Media dihitung per gambar atau per detik (video).

Model Fitur Jenis Harga
( =< 128 ribu token input)
Harga
( > 128 ribu token input)
Flash Gemini 1.5 Multimodal Input Gambar
Input Video
Input Teks
Input Audio
$0,00002 / gambar
$0,00002 / detik
$0,00001875 / 1 ribu karakter
$0,000002 / detik
$0,00004 / gambar
$0,00004 / detik
$0,0000375 / 1.000 karakter
$0,000004 / detik
Output Teks $0,000075 / 1.000 karakter $0,00015 / 1.000 karakter
Penyesuaian* Token Pelatihan $8 / Juta token
Gemini 1.5 Pro Multimodal Input Gambar
Input Video
Input Teks
Input Audio
$0,00032875 / gambar
$0,00032875 / detik
$0,0003125 / 1 ribu karakter
$0,00003125 / detik
$0,0006575 / gambar
$0,0006575 / detik
$0,000625 / 1 ribu karakter
$0,0000625 / detik
Output Teks $0,00125 / 1.000 karakter $0,0025 / 1.000 karakter
Penyesuaian* Token Pelatihan $80 / M token
Gemini 1.0 Pro Multimodal Input Gambar
Input Video
Input Teks
$0,0025 / gambar
$0,002 / detik
$0,000125 / 1.000 karakter
Output Teks $0,000375 / 1.000 karakter
Perujukan dengan Google Penelusuran Teks Permintaan pembumian $35 / 1 ribu permintaan (hingga 1 juta permintaan per hari).
Hubungi tim akun Anda jika Anda memerlukan lebih dari
1 juta permintaan per hari.

* Harga dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya sesuai tarif konteks panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu token.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang telah disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Grounding dengan Google Penelusuran: Jika Anda menggunakan pengambilan data dinamis untuk mengoptimalkan biaya, hanya permintaan yang berisi setidaknya satu URL dukungan pembumian dari web dalam responsnya yang akan dikenai biaya untuk Grounding dengan Google Penelusuran. Biaya untuk Gemini selalu berlaku.

Imagen

Dengan Imagen di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian dari gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.

Model Fitur Deskripsi Input Output Harga
Image 3 Pembuatan gambar Buat gambar Perintah teks Gambar $0,04 per image
Imagen 3 Cepat Pembuatan gambar Buat gambar Perintah teks Gambar $0,02 per gambar
Imagen 2, Imagen Pembuatan gambar Buat gambar Perintah teks Gambar $0,020 per gambar
Pengeditan gambar Mengedit gambar menggunakan pendekatan mask atau tanpa mask Perintah Gambar/Teks Gambar $0,020 per gambar
Peningkatan resolusi Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k Gambar Gambar $0,003 per gambar
Fine tuning Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam prompt Imagen (beberapa pelatihan pengambilan gambar) Subjek dengan ID teks dan 4-8 gambar per subjek Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) $ per jam kerja node (harga pelatihan kustom Vertex AI)
Teks Keterangan Visual Membuat teks singkat atau panjang untuk gambar Gambar Teks keterangan $0,0015/gambar
Tanya Jawab Visual Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar Perintah Gambar/Teks Jawaban teks $0,0015/gambar

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Embedding

Model Fitur Deskripsi Input Output Harga
embedding multimodal Embedding untuk Multimodal: Teks Membuat embedding menggunakan teks sebagai input Teks Embedding $0,0002 / 1.000 input karakter
Embedding untuk Multimodal: Gambar Membuat embedding menggunakan gambar sebagai input Gambar Embedding $0,0001 / input gambar
Embedding untuk Multimodal: Video Plus Video Plus Video Embedding (hingga 15 penyematan per menit video) $0,0020 per detik video
Embedding untuk Multimodal: Standar Video Standar Video Video Embedding (hingga 8 penyematan per menit video) $0,0010 per detik video
Embedding untuk Multimodal: Video Essential Video Esensial Video Embedding (hingga 4 embedding per menit video) $0,0005 per detik video
Model Jenis Region Harga per 1.000 karakter
Embeddings for Text Input Global
  • Permintaan online: $0,000025
  • Permintaan batch: $0,00002
Output Global
  • Permintaan online: Tidak dikenakan biaya
  • Permintaan batch: Tidak dikenakan biaya

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Penyelesaian kode yang didukung AI

AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.

Model Jenis Region Harga per 1.000 karakter
Codey untuk Penyelesaian kode Input Global
  • Permintaan online: $0,00025
Output Global
  • Permintaan online: $0,0005

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Terjemahan (Teks)

Menggunakan Vertex AI API dan LLM terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar lebih alami dibandingkan model terjemahan klasik, tetapi memiliki dukungan bahasa yang lebih terbatas (Pelajari Lebih Lanjut).

Model Metode Penggunaan Harga per satu juta karakter
LLM Terjemahan teks (Pratinjau)* Jumlah karakter input per bulan

$10 per juta karakter*

Jumlah karakter output per bulan

$10 per juta karakter*

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
*Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya

Cache Konteks

Dengan caching konteks, Anda dapat mengurangi biaya pemrosesan token input Gemini sebesar 75% dan latensi pembuatan konten dengan meng-cache bagian konteks dari teks atau media input Anda ke model Gemini. Jumlah waktu penyimpanan data dalam cache, yang dapat dikontrol oleh pengguna, menentukan biaya "Context Cache Storage". Saat membuat konteks yang di-cache, pengguna akan dikenai biaya token input standar. Pencocokan cache pada data input dikenai tarif yang lebih rendah, "Input yang Di-cache", bukan biaya input normal. Ukuran data untuk penyimpanan dan input dihitung dengan cara yang sama seperti harga input Gemini.

Model Fitur Jenis Harga ( =< 128 ribu token input ) Harga ( > 128 ribu token input )
Flash Gemini 1.5 Input yang Dikache Input Gambar
Input Video
Input Teks
Input Audio
0,000005 / gambar
0,000005 / detik
0,0000046875 / 1.000 karakter
0,0000005 / detik
0,00001 / gambar
0,00001 / detik
0,000009375 / 1.000 karakter
0,000001 / detik
Penyimpanan Cache Konteks Input Gambar
Input Video
Input Teks
Input Audio
0,000263 / gambar / jam
0,000263/ detik / jam
0,00025 / 1.000 karakter / jam
0,000025 / detik / jam
Gemini 1.5 Pro Input yang Dikache Input Gambar
Input Video
Input Teks
Input Audio
0,0000821875 / gambar
0,0000821875 / detik
0,000078125 / 1.000 karakter
0,0000078125 / detik
0,000164375 / gambar
0,000164375 / detik
0,00015625 / 1 k karakter
0,000015625 / detik
Penyimpanan Cache Konteks Input Gambar
Input Video
Input Teks
Input Audio
0,0011835 / gambar / jam
0,0011835/ detik / jam
0,001125 / 1 ribu karakter / jam
0,0001125 / detik / jam

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Contoh penghitungan biaya cache

Jika pengguna membuat konteks yang di-cache sepanjang 250.000 karakter dengan TTL 2 jam,lalu mengirimkan 20 permintaan terpisah ke model Gemini 1.5 Pro selama 2 jam tersebut, dan setiap permintaan memiliki kueri sepanjang 200 karakter yang ditambahkan ke konteks yang di-cache dan output sepanjang 400 karakter, total biaya dihitung sebagai berikut:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Contoh penghitungan biaya

Jika pengguna mengirim lima permintaan terpisah ke model PaLM Text Bison, dan setiap permintaan memiliki input 200 karakter dan output 400 karakter, total biaya akan dihitung sebagai berikut:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Model partner

Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.

Model AI21 Lab

Model Harga
Jamba 1,5 Besar Input: $2 / juta token
Output: $8 / juta token
Jamba 1.5 Mini Input: $0,20 / juta token
Output: $0,40 / juta token

Model Claude dari Anthropic

Model Harga
Claude 3.5 Haiku Input: $1,00 / juta token
Output: $5,00 / juta token
Claude 3.5 Sonnet v2 Input: $3 / juta token
Output: $15 / juta token
Claude 3.5 Sonnet Input: $3 / juta token
Output: $15 / juta token
Claude 3 Haiku Input: $0,25 / juta token
Output: $1,25 / juta token
Claude 3 Sonnet Input: $3 / juta token
Output: $15 / juta token
Claude 3 Opus Input: $15 / juta token
Output: $75 / juta token

Model Llama dari Meta

Model Harga
Llama 3.1 405B Input: $5,00 / juta token
Output: $16,00 / juta token

Model Mistral AI

Model Harga
Mistral Besar (24.11) Input: $2,00 / juta token
Output: $6,00 / juta token
Mistral Large (24.07) Input: $2,00 / juta token
Output: $6,00 / juta token
Mistral Nemo Input: $0,15 / juta token
Output: $0,15 / juta token
Codestral (24.05) Input: $0,20 / juta token
Output: $0,60 / juta token

Meminta penawaran harga khusus

Dengan model harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.
Hubungi bagian penjualan