Harga Vertex AI
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya termasuk layanan ML Platform dan MLOps, lihat halaman harga Vertex AI.
Model Google
Gemini
Dengan model Multimodal di Vertex AI, Anda dapat memasukkan teks atau media (gambar, video). Input Text dikenai biaya oleh setiap 1.000 karakter input (prompt) dan setiap 1.000 karakter output (respons). Karakter dihitung oleh titik kode UTF-8 dan ruang kosong dikecualikan dari jumlah, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang mengarah ke respons yang difilter hanya dikenai biaya untuk input tersebut. Di akhir setiap siklus penagihan, pecahan satu sen ($0,01) dibulatkan menjadi satu sen. Input Media dikenai biaya per gambar atau per detik (video).
Model | Fitur | Jenis | Harga ( =< 128 ribu token input) |
Harga ( > 128 ribu token input) |
---|---|---|---|---|
Flash Gemini 1.5 | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00002 / gambar $0,00002 / detik $0,00001875 / 1.000 karakter $0,000002 / detik |
$0,00004 / gambar $0,00004 / detik $0,0000375 / 1.000 karakter $0,000004 / detik |
Output Teks | $0,000075 / 1.000 karakter | $0,00015 / 1.000 karakter | ||
Penyesuaian* | Token Pelatihan | $8 / M token | ||
Gemini 1.5 Pro | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00032875 / gambar $0,00032875 / detik $0,0003125 / 1.000 karakter $0,00003125 / detik |
$0,0006575 / gambar $0,0006575 / detik $0,000625 / 1.000 karakter $0,0000625 / detik |
Output Teks | $0,00125 / 1.000 karakter | $0,0025 / 1.000 karakter | ||
Penyesuaian* | Token Pelatihan | $80 / M token | ||
Gemini 1.0 Pro | Multimodal | Input Gambar Input Video Input Teks |
$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter |
|
Output Teks | $0,000375 / 1.000 karakter | |||
Grounding dengan Google Penelusuran | Teks | Permintaan ground | $35 / 1.000 permintaan (untuk hingga 1 juta permintaan per hari). Hubungi tim akun jika Anda memerlukan lebih dari 1 juta permintaan per hari. |
* Harga tercantum dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya pada rasio konteks yang panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung maksimum 32 ribu jendela konteks.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF yang setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Grounding dengan Google Penelusuran: Jika Anda menggunakan pengambilan dinamis untuk mengoptimalkan biaya, hanya permintaan yang berisi setidaknya satu URL dukungan ground dari web dalam responsnya yang dikenai biaya untuk Grounding dengan Google Penelusuran. Biaya untuk Gemini selalu berlaku.
Imagen
Dengan Imagen di Vertex AI, Anda dapat membuat gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda berikan, atau hanya mengedit sebagian gambar menggunakan area mask yang Anda tentukan beserta berbagai kemampuan lainnya.
Model | Fitur | Deskripsi | Input | Output | Harga |
---|---|---|---|---|---|
Gambar 3 | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,04 per gambar |
Imagen 3 Cepat | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,02 per gambar |
Gambar 2, Gambar | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,020 per gambar |
Pengeditan gambar | Edit gambar menggunakan pendekatan tanpa mask atau mask | Perintah Gambar/Teks | Gambar | $0,020 per gambar | |
Peningkatan resolusi | Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k | Gambar | Gambar | $0,003 per gambar | |
Fine tuning | Aktifkan "subjek" yang disediakan pengguna untuk digunakan dalam perintah Imagen (beberapa pelatihan foto) | Subjek dengan ID teks dan 4-8 gambar per subjek | Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) | $ per jam kerja node (harga pelatihan kustom Vertex AI) | |
Teks Keterangan Visual | Membuat teks singkat atau panjang untuk gambar | Gambar | Teks keterangan | $0,0015/gambar | |
Tanya Jawab Visual | Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar | Perintah Gambar/Teks | Jawaban teks | $0,0015/gambar |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Embedding
Model | Fitur | Deskripsi | Input | Output | Harga |
---|---|---|---|---|---|
{i>multimodalembedding<i} | Embedding untuk Multimodal: Teks | Membuat embedding menggunakan teks sebagai input | Teks | Embedding | $0,0002 / 1.000 input karakter |
Embedding untuk Multimodal: Gambar | Membuat embedding menggunakan gambar sebagai input | Gambar | Embedding | $0,0001 / input gambar | |
Embedding untuk Multimodal: Video Plus | Video Plus | Video | Embeddings (hingga 15 embedding per menit video) | $0,0020 per detik video | |
Embedding untuk Multimodal: Standar Video | Standar Video | Video | Embeddings (hingga 8 embedding per menit video) | $0,0010 per detik video | |
Embedding untuk Multimodal: Video Penting | Video Penting | Video | Embeddings (hingga 4 embedding per menit video) | $0,0005 per detik video |
Model | Jenis | Region | Harga per 1.000 karakter |
---|---|---|---|
Embeddings for Text | Input | Global |
|
Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Penyelesaian kode yang didukung AI
AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menyebabkan respons yang difilter hanya dikenai biaya untuk input tersebut. Pada akhir setiap siklus penagihan, pecahan satu sen ($0,01) dibulatkan menjadi satu sen.
Model | Jenis | Region | Harga per 1.000 karakter |
---|---|---|---|
Codey untuk Penyelesaian kode | Input | Global |
|
Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Terjemahan (Teks)
Gunakan Vertex AI API dan LLM terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih fasih dan terdengar manusia daripada model terjemahan klasik, tetapi memiliki dukungan bahasa yang lebih terbatas (Pelajari Lebih Lanjut).
Model | Metode | Penggunaan | Harga per satu juta karakter |
---|---|---|---|
LLM | Terjemahan teks (Pratinjau)* | Jumlah karakter input per bulan |
$10 per satu juta karakter* |
Jumlah karakter output per bulan |
$10 per satu juta karakter* |
Biaya dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
*Harga per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang ditagih
Menyimpan ke Cache Konteks
Dengan penyimpanan cache konteks, Anda dapat mengurangi biaya pemrosesan token input Gemini hingga 75% dan latensi pembuatan konten dengan menyimpan bagian konteks teks atau media input Anda ke model Gemini dalam cache. Lamanya waktu data disimpan dalam cache, yang dapat dikontrol oleh pengguna, menentukan biaya "Penyimpanan Cache Konteks". Saat membuat konteks yang di-cache, pengguna akan ditagih biaya token input standar. Hit cache pada data input akan ditagih dengan tarif yang lebih rendah, yaitu "Input yang Di-Cache", bukan biaya input normal. Ukuran data untuk penyimpanan dan input dihitung dengan cara yang sama seperti harga input Gemini.
Model | Fitur | Jenis | Harga ( =< token input 128 ribu) | Harga ( > token input 128 ribu) |
---|---|---|---|---|
Flash Gemini 1.5 | Input dalam Cache | Input Gambar Input Video Input Teks Input Audio |
0,000005 / gambar 0,000005 / detik 0,0000046875 / 1 ribu karakter 0,0000005 / detik |
0,00001 / gambar 0,00001 / detik 0,000009375 / 1 ribu karakter 0,000001 / detik |
Penyimpanan Cache Konteks | Input Gambar Input Video Input Teks Input Audio |
0,000263 / gambar / jam 0,000263/ detik / jam 0,00025 / 1 ribu karakter / jam 0,000025 / detik / jam |
||
Gemini 1.5 Pro | Input dalam Cache | Input Gambar Input Video Input Teks Input Audio |
0,0000821875 / gambar 0,0000821875 / detik 0,000078125 / 1 ribu karakter 0,0000078125 / detik |
0,000164375 / gambar 0,000164375 / detik 0,00015625 / 1 ribu karakter 0,000015625 / detik |
Penyimpanan Cache Konteks | Input Gambar Input Video Input Teks Input Audio |
0,0011835 / gambar / jam 0,0011835/ detik / jam 0,001125 / 1 ribu karakter / jam 0,0001125 / detik / jam |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Contoh penghitungan biaya yang di-cache
Jika pengguna membuat konteks yang di-cache sebanyak 250.000 karakter dengan TTL selama 2 jam,lalu mengirimkan dua puluh permintaan terpisah ke model Gemini 1.5 Pro selama 2 jam tersebut, dan setiap permintaan memiliki kueri 200 karakter yang ditambahkan ke konteks yang di-cache dan output 400 karakter, total biayanya dihitung sebagai berikut:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Contoh penghitungan biaya
Jika pengguna mengirim lima permintaan terpisah ke model PaLM Text Bison, dan setiap permintaan memiliki input 200 karakter dan output 400 karakter, total biaya akan dihitung sebagai berikut:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Model partner
Model partner adalah daftar pilihan model AI generatif yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.
Model AI21 Lab
Model | Harga |
---|---|
Jamba 1,5 Besar | Input: $2 / juta token Output: $8 / juta token |
Jamba 1.5 Mini | Input: $0,20 / juta token Output: $0,40 / juta token |
Model Claude dari Anthropic
Model | Harga |
---|---|
Claude 3.5 Haiku | Input: $1,00 / juta token Output: $5,00 / juta token |
Claude 3.5 Sonet v2 | Input: $3 / juta token Output: $15 / juta token |
Claude 3.5 Sonnet | Input: $3 / juta token Output: $15 / juta token |
Claude 3 Haiku | Input: $0,25 / juta token Output: $1,25 / juta token |
Claude 3 Sonnet | Input: $3 / juta token Output: $15 / juta token |
Claude 3 Opus | Input: $15 / juta token Output: $75 / juta token |
Model Llama dari Meta
Model | Harga |
---|---|
Llama 3.1 405B | Input: $5 / juta token Output: $16 / juta token |
Model Mistral AI
Model | Harga |
---|---|
Mistral Besar (2407) | Input: $2 / juta token Output: $6 / juta token |
Nemo Mistral | Input: $0,15 / juta token Output: $0,15 / juta token |
Codestral | Input: $0,20 / juta token Output: $0,60 / juta token |