Harga Vertex AI
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Vertex AI.
Model Google
Gemini
Dengan model Multimodal di Vertex AI, Anda dapat memasukkan teks atau media (gambar, video). Input Teks dikenai biaya per 1.000 karakter input (prompt) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari penghitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input Media dihitung per gambar atau per detik (video).
Model | Fitur | Jenis | Harga ( =< 128 ribu token input) |
Harga ( > 128 ribu token input) |
---|---|---|---|---|
Flash Gemini 1.5 | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00002 / gambar $0,00002 / detik $0,00001875 / 1 ribu karakter $0,000002 / detik |
$0,00004 / gambar $0,00004 / detik $0,0000375 / 1.000 karakter $0,000004 / detik |
Output Teks | $0,000075 / 1.000 karakter | $0,00015 / 1.000 karakter | ||
Penyesuaian* | Token Pelatihan | $8 / Juta token | ||
Gemini 1.5 Pro | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00032875 / gambar $0,00032875 / detik $0,0003125 / 1 ribu karakter $0,00003125 / detik |
$0,0006575 / gambar $0,0006575 / detik $0,000625 / 1 ribu karakter $0,0000625 / detik |
Output Teks | $0,00125 / 1.000 karakter | $0,0025 / 1.000 karakter | ||
Penyesuaian* | Token Pelatihan | $80 / M token | ||
Gemini 1.0 Pro | Multimodal | Input Gambar Input Video Input Teks |
$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter |
|
Output Teks | $0,000375 / 1.000 karakter | |||
Perujukan dengan Google Penelusuran | Teks | Permintaan pembumian | $35 / 1 ribu permintaan (hingga 1 juta permintaan per hari). Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari. |
* Harga dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di
SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya sesuai tarif konteks panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu token.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang telah disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Grounding dengan Google Penelusuran: Jika Anda menggunakan pengambilan data dinamis untuk mengoptimalkan biaya, hanya permintaan yang berisi setidaknya satu URL dukungan pembumian dari web dalam responsnya yang akan dikenai biaya untuk Grounding dengan Google Penelusuran. Biaya untuk Gemini selalu berlaku.
Imagen
Dengan Imagen di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian dari gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.
Model | Fitur | Deskripsi | Input | Output | Harga |
---|---|---|---|---|---|
Image 3 | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,04 per image |
Imagen 3 Cepat | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,02 per gambar |
Imagen 2, Imagen | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,020 per gambar |
Pengeditan gambar | Mengedit gambar menggunakan pendekatan mask atau tanpa mask | Perintah Gambar/Teks | Gambar | $0,020 per gambar | |
Peningkatan resolusi | Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k | Gambar | Gambar | $0,003 per gambar | |
Fine tuning | Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam prompt Imagen (beberapa pelatihan pengambilan gambar) | Subjek dengan ID teks dan 4-8 gambar per subjek | Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) | $ per jam kerja node (harga pelatihan kustom Vertex AI) | |
Teks Keterangan Visual | Membuat teks singkat atau panjang untuk gambar | Gambar | Teks keterangan | $0,0015/gambar | |
Tanya Jawab Visual | Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar | Perintah Gambar/Teks | Jawaban teks | $0,0015/gambar |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Embedding
Model | Fitur | Deskripsi | Input | Output | Harga |
---|---|---|---|---|---|
embedding multimodal | Embedding untuk Multimodal: Teks | Membuat embedding menggunakan teks sebagai input | Teks | Embedding | $0,0002 / 1.000 input karakter |
Embedding untuk Multimodal: Gambar | Membuat embedding menggunakan gambar sebagai input | Gambar | Embedding | $0,0001 / input gambar | |
Embedding untuk Multimodal: Video Plus | Video Plus | Video | Embedding (hingga 15 penyematan per menit video) | $0,0020 per detik video | |
Embedding untuk Multimodal: Standar Video | Standar Video | Video | Embedding (hingga 8 penyematan per menit video) | $0,0010 per detik video | |
Embedding untuk Multimodal: Video Essential | Video Esensial | Video | Embedding (hingga 4 embedding per menit video) | $0,0005 per detik video |
Model | Jenis | Region | Harga per 1.000 karakter |
---|---|---|---|
Embeddings for Text | Input | Global |
|
Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Penyelesaian kode yang didukung AI
AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.
Model | Jenis | Region | Harga per 1.000 karakter |
---|---|---|---|
Codey untuk Penyelesaian kode | Input | Global |
|
Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Terjemahan (Teks)
Menggunakan Vertex AI API dan LLM terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar lebih alami dibandingkan model terjemahan klasik, tetapi memiliki dukungan bahasa yang lebih terbatas (Pelajari Lebih Lanjut).
Model | Metode | Penggunaan | Harga per satu juta karakter |
---|---|---|---|
LLM | Terjemahan teks (Pratinjau)* | Jumlah karakter input per bulan |
$10 per juta karakter* |
Jumlah karakter output per bulan |
$10 per juta karakter* |
Biaya dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di
SKU Cloud Platform.
*Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya
Cache Konteks
Dengan caching konteks, Anda dapat mengurangi biaya pemrosesan token input Gemini sebesar 75% dan latensi pembuatan konten dengan meng-cache bagian konteks dari teks atau media input Anda ke model Gemini. Jumlah waktu penyimpanan data dalam cache, yang dapat dikontrol oleh pengguna, menentukan biaya "Context Cache Storage". Saat membuat konteks yang di-cache, pengguna akan dikenai biaya token input standar. Pencocokan cache pada data input dikenai tarif yang lebih rendah, "Input yang Di-cache", bukan biaya input normal. Ukuran data untuk penyimpanan dan input dihitung dengan cara yang sama seperti harga input Gemini.
Model | Fitur | Jenis | Harga ( =< 128 ribu token input ) | Harga ( > 128 ribu token input ) |
---|---|---|---|---|
Flash Gemini 1.5 | Input yang Dikache | Input Gambar Input Video Input Teks Input Audio |
0,000005 / gambar 0,000005 / detik 0,0000046875 / 1.000 karakter 0,0000005 / detik |
0,00001 / gambar 0,00001 / detik 0,000009375 / 1.000 karakter 0,000001 / detik |
Penyimpanan Cache Konteks | Input Gambar Input Video Input Teks Input Audio |
0,000263 / gambar / jam 0,000263/ detik / jam 0,00025 / 1.000 karakter / jam 0,000025 / detik / jam |
||
Gemini 1.5 Pro | Input yang Dikache | Input Gambar Input Video Input Teks Input Audio |
0,0000821875 / gambar 0,0000821875 / detik 0,000078125 / 1.000 karakter 0,0000078125 / detik |
0,000164375 / gambar 0,000164375 / detik 0,00015625 / 1 k karakter 0,000015625 / detik |
Penyimpanan Cache Konteks | Input Gambar Input Video Input Teks Input Audio |
0,0011835 / gambar / jam 0,0011835/ detik / jam 0,001125 / 1 ribu karakter / jam 0,0001125 / detik / jam |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Contoh penghitungan biaya cache
Jika pengguna membuat konteks yang di-cache sepanjang 250.000 karakter dengan TTL 2 jam,lalu mengirimkan 20 permintaan terpisah ke model Gemini 1.5 Pro selama 2 jam tersebut, dan setiap permintaan memiliki kueri sepanjang 200 karakter yang ditambahkan ke konteks yang di-cache dan output sepanjang 400 karakter, total biaya dihitung sebagai berikut:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Contoh penghitungan biaya
Jika pengguna mengirim lima permintaan terpisah ke model PaLM Text Bison, dan setiap permintaan memiliki input 200 karakter dan output 400 karakter, total biaya akan dihitung sebagai berikut:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Model partner
Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.
Model AI21 Lab
Model | Harga |
---|---|
Jamba 1,5 Besar | Input: $2 / juta token Output: $8 / juta token |
Jamba 1.5 Mini | Input: $0,20 / juta token Output: $0,40 / juta token |
Model Claude dari Anthropic
Model | Harga |
---|---|
Claude 3.5 Haiku | Input: $1,00 / juta token Output: $5,00 / juta token |
Claude 3.5 Sonnet v2 | Input: $3 / juta token Output: $15 / juta token |
Claude 3.5 Sonnet | Input: $3 / juta token Output: $15 / juta token |
Claude 3 Haiku | Input: $0,25 / juta token Output: $1,25 / juta token |
Claude 3 Sonnet | Input: $3 / juta token Output: $15 / juta token |
Claude 3 Opus | Input: $15 / juta token Output: $75 / juta token |
Model Llama dari Meta
Model | Harga |
---|---|
Llama 3.1 405B | Input: $5,00 / juta token Output: $16,00 / juta token |
Model Mistral AI
Model | Harga |
---|---|
Mistral Besar (24.11) | Input: $2,00 / juta token Output: $6,00 / juta token |
Mistral Large (24.07) | Input: $2,00 / juta token Output: $6,00 / juta token |
Mistral Nemo | Input: $0,15 / juta token Output: $0,15 / juta token |
Codestral (24.05) | Input: $0,20 / juta token Output: $0,60 / juta token |