Biaya membangun dan men-deploy model AI di Vertex AI
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
Anda hanya dikenai biaya untuk permintaan yang menampilkan kode respons 200. Permintaan yang menampilkan kode respons lain, seperti kode 4xx dan 5xx, tidak dikenai biaya untuk input atau output.
Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Vertex AI.
Model Google
Gemini 3
| Model | Jenis | Harga (/1 juta token) <= 200 ribu token input | Harga (/1 juta token) > 200 ribu token input | Harga (/1 juta token) <= 200 ribu token input yang di-cache | Harga (/1 juta token) > 200 ribu token input yang di-cache | Harga (/1 juta token) <= 200 ribu token input dengan API batch | Harga (/1 juta token) > 200 ribu token input dengan API batch |
|---|---|---|---|---|---|---|---|
| Pratinjau Gemini 3 Pro | |||||||
| Input (teks, gambar, video, audio) | $2 | $4 | $0,2 | $0,4 | $1 | $2 | |
| Output teks (respons dan penalaran) | $12 | $18 | T/A | T/A | $6 | $9 | |
| Output Gambar** | $120 | T/A | T/A | T/A | $60 | T/A | |
| Grounding dengan Google Penelusuran & Grounding Web untuk Perusahaan |
Gemini 3 Pro mencakup 5.000 kueri penelusuran per bulan tanpa biaya tambahan. Kueri penelusuran yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri penelusuran. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Penelusuran (atau Perujukan Web untuk Enterprise). Anda akan dikenai biaya untuk setiap kueri penelusuran yang dilakukan. Penagihan akan dimulai pada 5 Januari 2026. Token input yang disediakan oleh Perujukan dengan Google Penelusuran atau Perujukan Web untuk Enterprise tidak dikenai biaya. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||||
| Grounding dengan Google Maps |
Gemini 3 Pro mencakup 5.000 kueri penelusuran per bulan tanpa biaya tambahan. Kueri Maps yang melebihi batas tersebut akan ditagih sebesar $14 per 1.000 kueri. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Maps. Anda akan dikenai biaya untuk setiap kueri individual yang dijalankan. Penagihan akan dimulai pada 5 Januari 2026 |
||||||
| Grounding dengan data Anda | $2,5 per 1.000 permintaan. | ||||||
* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Gambar output 1K (1024x1024) dan 2K (2048x2048) menggunakan 1.120 token output gambar, yang setara dengan $0,134/gambar yang dihasilkan. Gambar 4K (4096x4096) menggunakan 2.000 token output gambar, yang setara dengan $0,24/gambar yang dihasilkan.
Gemini 2.5
| Model | Jenis | Harga (/1 juta token) <= 200 ribu token input | Harga (/1 juta token) > 200 ribu token input | Harga (/1 juta token) <= 200 ribu token input yang di-cache | Harga (/1 juta token) > 200 ribu token input yang di-cache | Harga (/1 juta token) <= 200 ribu token input dengan API batch | Harga (/1 juta token) > 200 ribu token input dengan API batch |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| Input (teks, gambar, video, audio) | $1.25 | $2,5 | $0,125 | $0,250 | $0,625 | $1.25 | |
| Output teks (respons dan penalaran) | $10 | $15 | T/A | T/A | $5 | $7,5 | |
| Gemini 2.5 Pro Penggunaan Komputer-Pratinjau |
|||||||
| Input (teks, gambar, video, audio) | $1.25 | $2,5 | T/A | T/A | T/A | T/A | |
| Output teks (respons dan penalaran) | $10,00 | $15,00 | T/A | T/A | T/A | T/A | |
Gemini 2.5 Flash |
|||||||
| Input (teks, gambar, video) | $0,30 | $0,30 | $0,030 | $0,030 | $0,15 | $0,15 | |
| Input Audio | $1 | $1 | $0,100 | $0,100 | $0,5 | $0,5 | |
| Output teks (respons dan penalaran) | $2,50 | $2,50 | T/A | T/A | $1.25 | $1.25 | |
| Output gambar*** | $30 | $30 | T/A | T/A | $15 | $15 | |
Live API Gemini 2.5 Flash |
|||||||
| 1 juta token teks input | $0,5 | $0,5 | T/A | T/A | T/A | T/A | |
| 1 juta token audio input | $3 | $3 | T/A | T/A | T/A | T/A | |
| 1 juta token video/gambar input | $3 | $3 | T/A | T/A | T/A | T/A | |
| 1 juta token teks output | $2 | $2 | T/A | T/A | T/A | T/A | |
| 1 juta token audio output | $12 | $12 | T/A | T/A | T/A | T/A | |
Gemini 2.5 Flash Lite |
|||||||
| Input (teks, gambar, video) | $0,1 | $0,1 | $0,010 | $0,010 | $0,05 | $0,05 | |
| Input Audio | $0,3 | $0,3 | $0,030 | $0,030 | $0,15 | $0,15 | |
| Output teks (respons dan penalaran) | $0,4 | $0,4 | T/A | T/A | $0,2 | $0,2 | |
Grounding dengan Google Penelusuran |
Gemini 2.0 Flash, 2.5 Flash,dan 2.5 Flash-Lite mencakup gabungan 1.500 perintah yang dirujukkan per hari tanpa biaya tambahan. Gemini 2.5 Pro mencakup 10.000 perintah yang dirujukkan per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah grounding adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran**. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||||
Grounding Web untuk perusahaan |
$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan**. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||||
| Grounding dengan data Anda | $2,5 per 1.000 permintaan. | ||||||
| Grounding dengan Google Maps | $25 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps. |
||||||
* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
*** Gambar 1024x1024 menggunakan 1.290 token. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
**** Penagihan Penggunaan Komputer menggunakan SKU Gemini 2.5 Pro, untuk memisahkan biaya Penggunaan Komputer, terapkan tag penagihan. Lihat
selengkapnya di sini.
- Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
- Mode Audio Proaktif: Jika diaktifkan, token input akan dikenai biaya saat LiveAPI mendengarkan. Token output hanya dikenakan biaya saat API merespons.
- Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.
Gemini 2.0
Gemini 2.0 ditagih berdasarkan token. Untuk menghitung jumlah token input dalam permintaan Anda sebelum mengirim permintaan, Anda dapat menggunakan tokenizer SDK atau countTokens API. Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.
Gunakan tombol di tabel harga untuk membandingkan harga berbasis token dan harga berbasis modalitas.
Harga berbasis token
| Model | Jenis | Harga | Harga dengan Batch API | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 1 juta token Input | $0,15 | $0,075 | |||
| 1 juta token audio Input | $1,00 | $0,50 | |||
| 1 juta token teks Output | $0,60 | $0,30 | |||
| Penyesuaian untuk 1 juta token pelatihan | $3,00 | ||||
Pembuatan Gambar Gemini 2.0 Flash |
|||||
| 1 juta token input | $0,15 | ||||
| 1 juta token audio input | $1,00 | ||||
| 1 juta token video input | $3 | ||||
| 1 juta token teks output | $0,60 | ||||
| 1 juta token gambar output | $30,00 | ||||
Gemini 2.0 Flash Live API |
|||||
| 1 juta token teks input | $0,5 | ||||
| 1 juta token audio input | $3 | ||||
| 1 juta token video/gambar input | $3 | ||||
| 1 juta token teks output | $2 | ||||
| 1 juta token audio output | $12 | ||||
Gemini 2.0 Flash Lite |
|||||
| 1 juta token Input | $0,075 | $0,0375 | |||
| 1 juta token audio Input | $0,075 | $0,0375 | |||
| 1 juta token teks Output | $0,30 | $0,15 | |||
| Penyesuaian untuk 1 juta token pelatihan | $1,00 | ||||
Grounding dengan Google Penelusuran |
Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||
Grounding Web untuk perusahaan |
$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||
| Grounding dengan data Anda | $2,5 per 1.000 permintaan mulai 16 Juni 2025. | ||||
Grounding dengan Google Maps |
Model Gemini menyertakan sejumlah perintah rujukan harian tanpa biaya tambahan: Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $25 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||
Harga berbasis modalitas
Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:
- 4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.
- Untuk gambar 1024x1024, token yang digunakan adalah 1.290. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
- Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.
- Input audio menggunakan 25 token per detik tanpa stempel waktu.
| Model | Jenis | Harga | Harga dengan Batch API |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Teks input ($/M karakter) | $0,0375 | $0,01875 | |
| Gambar input ($/gambar) | $0,0001935 | $0,00009675 | |
| Video input ($/dtk) | $0,0000387 | $0,00001935 | |
| Input audio ($/detik) | $0,000025 | $0,0000125 | |
| Teks output ($/M karakter) | $0,15 | $0,075 | |
Pembuatan Gambar Gemini 2.0 Flash |
|||
| Teks input ($/M karakter) | $0,0375 | ||
| Gambar input ($/gambar) | $0,0001935 | ||
| Video input ($/dtk) | $0,0000387 | ||
| Input audio ($/detik) | $0,000025 | ||
| Teks output ($/M karakter) | $0,15 | ||
| Gambar output gambar ($/gambar) | $0,04 | ||
Gemini 2.0 Flash Lite |
|||
| Teks input ($/M karakter) | $0,01875 | $0,009375 | |
| Gambar input ($/gambar) | $0,00009675 | $0,000048375 | |
| Video input ($/dtk) | $0,00001935 | $0,000009675 | |
| Input audio ($/detik) | $0,000001875 | $0,000000938 | |
| Teks output ($/M karakter) | $0,075 | $0,0375 | |
Grounding dengan Google Penelusuran |
Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||
Grounding Web untuk perusahaan |
$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||
* Harga tercantum dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada
SKU Cloud Platform.
* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
* Gemini 2.0 Flash Live API: 25 token per detik audio (input/output), 258 token per detik video (input). Grounding dengan Google Penelusuran tetap gratis selama Gemini 2.0 Flash Live API dalam Pratinjau.
- Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
- Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.
Harga Pengoptimal Model Vertex AI (Eksperimental)*
Pengoptimal Model Vertex AI menyederhanakan penggunaan Gemini untuk pelanggan perusahaan dengan menyediakan satu meta-endpoint untuk permintaan model Gemini. Pelanggan yang menggunakan layanan ini tidak perlu menentukan apakah akan menggunakan Flash, Pro, atau versi tertentu. Pengguna hanya perlu memberikan setelan yang dapat dikonfigurasi (biaya, kualitas, atau keseimbangan) untuk menunjukkan preferensi mereka, dan Model Optimizer akan menerapkan tingkat kecerdasan yang tepat untuk tugas tersebut dengan mengirimkan setiap kueri ke model yang paling sesuai.
Vertex AI Model Optimizer menerapkan harga dinamis. Artinya, harga rata-rata per token bergantung pada tingkat kecerdasan model yang diterapkan untuk menyelesaikan tugas. Oleh karena itu, contoh harga disediakan di bawah untuk mengilustrasikan kemungkinan skenario berdasarkan setelan konfigurasi Anda (lihat tabel di bawah). SKU Model Optimizer adalah SKU $1 yang berfungsi sebagai unit pembelian untuk diterapkan pada penagihan Anda. Anda tetap akan ditagih berdasarkan konsumsi setelah menggunakan model.
| Rasio I/O 5:1 | Contoh 1 bot chat |
CATATAN: rentang ini bukan jaminan, hasil pelanggan individu dapat bervariasi | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferensi Pelanggan | Token Input Pelanggan Dikirim ke MO | Token Output Pelanggan Dikirim ke MO | Harga Input Rata-Rata per Juta Token (Rentang Tinggi) | Harga Output Rata-Rata per Juta Token (Rentang Tinggi) | Harga Input Rata-Rata per Juta Token (Rentang Rendah) | Harga Output Rata-Rata per Juta Token (Rentang Rendah) | |||||
| Biaya | 10.000.000 | 2.000.000 | $0,63 | $2,50 | $0,16 | $0,63 | |||||
| Seimbang | 10.000.000 | 2.000.000 | $1,26 | $5,00 | $0,63 | $2,50 | |||||
| Kualitas | 10.000.000 | 2.000.000 | $1,89 | $7,50 | $1,26 | $5,00 | |||||
| Rasio I/O 1:20 | Contoh 2 Pembuatan konten | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferensi Pelanggan | Token Input Pelanggan Dikirim ke MO | Token Output Pelanggan Dikirim ke MO | Harga Input Rata-Rata per Juta Token (Rentang Tinggi) | Harga Output Rata-Rata per Juta Token (Rentang Tinggi) | Harga Input Rata-Rata per Juta Token (Rentang Rendah) | Harga Output Rata-Rata per Juta Token (Rentang Rendah) | |||||
| Biaya | 1.000.000 | 20.000.000 | $0,63 | $2,50 | $0,16 | $0,63 | |||||
| Seimbang | 1.000.000 | 20.000.000 | $1,26 | $5,00 | $0,63 | $2,50 | |||||
| Kualitas | 1.000.000 | 20.000.000 | $1,89 | $7,50 | $1,26 | $5,00 | |||||
Model Gemini lainnya
Semua model Gemini selain Gemini 2.0 atau Gemini 2.5 ditagih berdasarkan modalitas seperti karakter, gambar, detik video/audio. Input teks dikenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input media dikenai biaya per gambar atau per detik (video). Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.
| Model | Fitur | Jenis | Harga ( =< 128 ribu token input) |
Harga ( > 128 ribu token input) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00002 / gambar $0,00002 / detik $0,00001875 / 1.000 karakter $0,000002 / detik |
$0,00004 / gambar $0,00004 / detik $0,0000375 / 1.000 karakter $0,000004 / detik |
||
| Output Teks | $0,000075 / 1.000 karakter | $0,00015 / 1.000 karakter | ||||
| Penyesuaian* | Token Pelatihan | $8 / 1 juta token | ||||
| Gemini 1.5 Pro | Multimodal | Input Gambar Input Video Input Teks Input Audio |
$0,00032875 / gambar $0,00032875 / detik $0,0003125 / 1.000 karakter $0,00003125 / detik |
$0,0006575 / gambar $0,0006575 / detik $0,000625 / 1 ribu karakter $0,0000625 / detik |
||
| Output Teks | $0,00125 / 1.000 karakter | $0,0025 / 1.000 karakter | ||||
| Penyesuaian* | Token Pelatihan | $80 / 1 juta token | ||||
| Gemini 1.0 Pro | Multimodal | Input Gambar Input Video Input Teks |
$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter |
|||
| Output Teks | $0,000375 / 1.000 karakter | |||||
| Grounding dengan Google Penelusuran | Teks | $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||
| Grounding Web untuk perusahaan | Teks | $45 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. |
||||
| Grounding dengan data Anda | Teks | $2,5 per 1.000 permintaan mulai 16 Juni 2025. |
||||
* Harga tercantum dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada
SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya dengan tarif konteks panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
Imagen
Dengan Imagen di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.
| Model | Fitur | Deskripsi | Input | Output | Harga |
|---|---|---|---|---|---|
| Imagen 4 Ultra | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,06 per gambar |
| Imagen 4 | Peningkatan resolusi | Meningkatkan resolusi gambar yang dihasilkan menjadi 2K, 3K, dan 4K | Gambar | Gambar | $0,06 per gambar |
| Imagen 4 | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,04 per gambar |
| Imagen 4 Fast | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,02 per gambar |
| Imagen 3 | Pembuatan gambar | Buat gambar Edit gambar Sesuaikan gambar |
Perintah teks | Gambar | $0,04 per gambar |
| Imagen 3 Fast | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,02 per gambar |
| Imagen 2, Imagen 1 | Pembuatan gambar | Buat gambar | Perintah teks | Gambar | $0,020 per gambar |
| Imagen 2, Imagen 1 | Pengeditan gambar | Mengedit gambar menggunakan pendekatan mask atau tanpa mask | Perintah Gambar/Teks | Gambar | $0,020 per gambar |
| Imagen 1 | Peningkatan resolusi | Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k | Gambar | Gambar | $0,003 per gambar |
| Imagen 1 | Fine tuning | Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam prompt Imagen (beberapa pelatihan pengambilan gambar) | Subjek dengan ID teks dan 4-8 gambar per subjek | Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) | $ per jam kerja node (harga pelatihan kustom Vertex AI) |
| Imagen | Teks Keterangan Visual | Membuat teks singkat atau panjang untuk gambar | Gambar | Teks keterangan | $0,0015/gambar |
| Imagen | Tanya Jawab Visual | Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar | Perintah Gambar/Teks | Jawaban teks | $0,0015/gambar |
| Imagen | Rekonteks Produk | Membayangkan kembali produk dalam adegan baru | 1-3 Gambar produk yang sama dan perintah teks yang menjelaskan adegan yang diinginkan | Gambar | $0,12 per gambar |
| Coba Virtual Vertex | Buat gambar orang yang mengenakan pakaian berbeda | 1 gambar orang dan 1 gambar pakaian | Gambar | $0,06 per gambar |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Veo
Veo membuat video berkualitas sangat tinggi dalam berbagai subjek dan gaya, dengan pemahaman yang lebih baik tentang fisika dunia nyata serta nuansa gerakan dan ekspresi manusia.
| Model | Fitur | Deskripsi | Input | Output | Resolusi Output | Harga |
|---|---|---|---|---|---|---|
| Veo 3.1 | Pembuatan Video + Audio | Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi | Perintah Teks/Gambar | Video + Audio | 720p, 1080p | $0,40/detik |
| Veo 3.1 | Pembuatan video | Buat video berkualitas tinggi dari perintah teks atau gambar referensi | Perintah Teks/Gambar | Video | 720p, 1080p | $0,20/detik |
| Veo 3.1 Fast | Pembuatan Video + Audio | Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat | Perintah Teks/Gambar | Video + Audio | 720p, 1080p | $0,15/detik |
| Veo 3.1 Fast | Pembuatan video | Buat video dari perintah teks atau gambar referensi dengan lebih cepat | Perintah Teks/Gambar | Video | 720p, 1080p | $0,10/detik |
| Veo 3 | Pembuatan Video + Audio | Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi | Perintah Teks/Gambar | Video + Audio | 720p, 1080p | $0,40/detik |
| Veo 3 | Pembuatan video | Buat video berkualitas tinggi dari perintah teks atau gambar referensi | Perintah Teks/Gambar | Video | 720p, 1080p | $0,20/detik |
| Veo 3 Fast | Pembuatan Video + Audio | Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat | Perintah Teks/Gambar | Video + Audio | 720p, 1080p | $0,15/detik |
| Veo 3 Fast | Pembuatan video | Buat video dari perintah teks atau gambar referensi dengan lebih cepat | Perintah Teks/Gambar | Video | 720p, 1080p | $0,10/detik |
| Veo 2 | Pembuatan video | Buat video dari perintah teks atau gambar referensi | Perintah Teks/Gambar | Video | 720p | $0,50/detik |
| Veo 2 | Kontrol Lanjutan | Buat video melalui interpolasi frame awal dan akhir, perpanjang video yang dibuat, dan terapkan kontrol kamera | Perintah Teks/Gambar/Video | Video | 720p | $0,50/detik |
Lyria
Lyria 2 menawarkan pembuatan musik instrumental berkualitas tinggi yang ideal untuk komposisi canggih dan eksplorasi kreatif mendetail yang mengutamakan output bernuansa.
| Model | Fitur | Deskripsi | Input | Output | Harga |
|---|---|---|---|---|---|
| Lyria 2 | Pembuatan musik | Membuat musik dari perintah teks | Perintah teks | Musik | $0,06 per 30 detik |
Memahami biaya embedding untuk aplikasi AI Anda
| Model | Jenis | Region | Harga per 1.000 token input |
|---|---|---|---|
| Gemini Embedding | Input | Global |
|
| Output | Global |
|
| Model | Jenis | Region | Harga per 1.000 karakter |
|---|---|---|---|
| Embedding untuk Teks (Tidak termasuk Embedding Gemini) |
Input | Global |
|
| Output | Global |
|
| Model | Fitur | Deskripsi | Input | Output | Harga |
|---|---|---|---|---|---|
| multimodalembedding | Embedding untuk Multimodal: Teks | Membuat embedding menggunakan teks sebagai input | Teks | Embedding | $0,0002 / 1.000 input karakter |
| Embedding untuk Multimodal: Gambar | Membuat embedding menggunakan gambar sebagai input | Gambar | Embedding | $0,0001 / input gambar | |
| Embeddings for Multimodal: Video Plus | Video Plus | Video | Embedding (hingga 15 embedding per menit video) | $0,0020 per detik video | |
| Embedding untuk Multimodal: Video Standard | Video Standar | Video | Embedding (hingga 8 embedding per menit video) | $0,0010 per detik video | |
| Embeddings for Multimodal: Video Essential | Video Essential | Video | Embedding (hingga 4 embedding per menit video) | $0,0005 per detik video |
| Model Open Source | Jenis | Harga per 1.000 token input |
|---|---|---|
| multilingual-e5-small | Input: Output: Input Batch: Output Batch: |
Permintaan online: $0,000015 Permintaan online: Tanpa biaya Permintaan batch: $0,0000075 Permintaan batch: Tanpa biaya |
| multilingual-e5-large | Input: Output: Input Batch: Output Batch: |
Permintaan online: $0,000025 Permintaan online: Tanpa biaya Permintaan batch: $0,0000125 Permintaan batch: Tanpa biaya |
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Harga untuk pelengkapan kode Vertex AI
AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.
| Model | Jenis | Region | Harga per 1.000 karakter |
|---|---|---|---|
| Codey untuk Penyelesaian kode | Input | Global |
|
| Output | Global |
|
Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.
Terjemahan (Teks)
Menggunakan Vertex AI API dan LLM Terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar seperti manusia dibandingkan model terjemahan klasik, tetapi dukungan bahasanya lebih terbatas (Pelajari Lebih Lanjut).
| Model | Metode | Penggunaan | Harga per juta karakter |
|---|---|---|---|
| LLM | Terjemahan teks* | Jumlah karakter input per bulan |
$10 per juta karakter* |
| Jumlah karakter output per bulan |
$10 per juta karakter* |
Biaya dicantumkan dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada
SKU Cloud Platform.
*Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya
Harga Penyimpanan Cache Konteks untuk Pembuatan Cache Eksplisit
| Model | Fitur | Jenis | Harga (/1 juta token) <= 200 ribu token input |
Harga (/1 juta token) > 200 ribu token input |
|---|---|---|---|---|
| Gemini 3 Pro | Penyimpanan Cache Konteks | Input (teks, gambar, video, audio) | $4,5 (/M Token/jam) | $4,5 (/M Token/jam) |
| Gemini 2.5 Pro | Penyimpanan Cache Konteks | Input (teks, gambar, video, audio) | $4,5 (/M Token/jam) | $4,5 (/M Token/jam) |
| Gemini 2.5 Flash | Penyimpanan Cache Konteks | Input (teks, gambar, video, audio) | $1 (/M Token/jam) | $1 (/M Token/jam) |
| Gemini 2.5 Flash Lite | Penyimpanan Cache Konteks | Input (teks, gambar, video, audio) | $1 (/M Token/jam) | $1 (/M Token/jam) |
Model Gemini 2.0
Harga berbasis token
Model |
Jenis |
Penyimpanan (M tok-hour) |
Harga |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 1 juta token Input | $1,00 | $0,0375 | |
| 1 juta token audio Input | $1,00 | $0,25 | |
| 1 juta token teks Output | NA | NA | |
Gemini 2.0 Flash Lite |
|||
| 1 juta token Input | $1,00 | $0,01875 | |
| 1 juta token audio Input | $1,00 | $0,01875 | |
| 1 juta token teks Output | NA | NA |
Harga berbasis modalitas
Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:
- 4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.
- Untuk gambar 1024x1024, token yang digunakan adalah 1.290. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
- Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.
- Input audio menggunakan 25 token per detik tanpa stempel waktu.
Model |
Jenis |
Penyimpanan (Jam Modalitas) |
Harga |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Teks input ($/M karakter) | $0,25 | $0,009375 | |
| Gambar input ($/gambar) | $0,00129 | $0,000048375 | |
| Video input ($/dtk) | $0,000258 | $0,000009675 | |
| Input audio ($/detik) | $0,000025 | $0,00000625 | |
| Teks output ($/M karakter) | NA | NA | |
Gemini 2.0 Flash Lite |
|||
| Teks input ($/M karakter) | $0,25 | $0,0046875 | |
| Gambar input ($/gambar) | $0,00129 | $0,0000241875 | |
| Video input ($/dtk) | $0,000258 | $0,000009675 | |
| Input audio ($/detik) | $0,000258 | $0,0000048375 | |
| Teks output ($/M karakter) | NA | NA | |
Grounding dengan Google Penelusuran |
Gemini 2.0 Flash mencakup hingga 1.500 permintaan yang dirujuk per hari tanpa biaya tambahan. Permintaan yang dirujuk melebihi 1.500 per hari akan ditagih sebesar $35 per 1.000 permintaan (hingga 1 juta permintaan per hari). Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari. |
||
Grounding Web untuk perusahaan |
$45 per 1.000 permintaan (hingga 1 juta permintaan per hari) mulai 5 Mei 2025. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari. |
||
* Harga tercantum dalam Dolar AS (USD).
Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada
SKU Cloud Platform.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran hanya ditagih untuk permintaan yang menampilkan hasil yang berisi setidaknya satu URL dukungan perujukan dari web. Biaya penggunaan model Gemini standar juga berlaku.
Throughput yang Disediakan
Throughput yang disediakan memastikan throughput untuk kebutuhan AI generatif Anda dan ditransaksikan melalui unit skala AI generatif, atau GSU. Pelajari lebih lanjut throughput yang disediakan setiap GSU di sini dan gunakan alat estimasi online kami di sini.
| Durasi | Harga per GSU | Per |
|---|---|---|
| Komitmen 1 minggu | $1.200 | Minggu |
| Komitmen 1 bulan | $2.700 | Bulan |
| Komitmen 3 bulan | $2.400 | Bulan |
| Komitmen 1 tahun | $2.000 | Bulan |
Contoh penghitungan biaya
Seorang pengguna perlu memastikan bahwa mereka dapat mendukung 10 kueri per detik (QPS) dari kueri dengan input 1.000 token teks dan 500 token audio serta menerima output 300 token teks menggunakan gemini-2.0-flash.
Menggunakan tabel throughput dan laju penurunan, untuk gemini-2.0-flash, kita tahu laju penurunan token teks input adalah 1 token, laju penurunan token audio input adalah 7 token, dan laju penurunan token teks output adalah 4 token.
Total token input pengguna adalah 1.000* (1 token per token teks input) + 500* (7 token per token audio input) = 4.500 token input yang disesuaikan dengan burndown. Total token output pengguna adalah 300* (4 token per token teks output) = 1.200 token output yang disesuaikan dengan burndown. Jika dijumlahkan, kita mendapatkan 4.500 token input yang disesuaikan dengan burndown + 1.200 token output yang disesuaikan dengan burndown = 5.700 total token per kueri.
Dengan mengalikan total token per kueri dengan QPS, kita mendapatkan 5.700 total token per kueri * 10 QPS = 57.000 total token per detik.
Dengan membagi angka ini dengan total throughput per detik per GSU,kita mendapatkan 57.000 total token per detik ÷ 3.360 throughput per detik per GSU = 16,96 GSU. Peningkatan pembelian GSU minimum untuk model ini adalah 1, sehingga pengguna memerlukan 17 GSU.
Jika pengguna ingin mempertahankan throughput ini selama 1 minggu, biayanya adalah $1.200 * 17 GSU = $20.400 per minggu. Jika mereka ingin mempertahankan throughput ini selama 1 bulan, biayanya adalah $2.700 * 17 GSU = $45.900 per bulan. Jika mereka ingin mempertahankan throughput ini selama 3 bulan, biayanya adalah $2.400 * 17 GSU = $40.800 per bulan. Terakhir, jika mereka ingin mempertahankan throughput ini selama 1 tahun, biayanya adalah $2.000 * 17 GSU = $34.000 per bulan.
Penyesuaian Model
Penyesuaian model adalah cara efektif untuk menyesuaikan model besar dengan tugas Anda. Langkah ini penting untuk meningkatkan kualitas dan efisiensi model. Penyesuaian model memberikan manfaat berikut:
- Kualitas lebih tinggi untuk tugas spesifik Anda
- Peningkatan ketahanan model
- Latensi dan biaya inferensi lebih rendah karena perintah yang lebih pendek
Penyesuaian dikenakan biaya per juta token pelatihan. Token pelatihan dihitung berdasarkan total jumlah token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda. Untuk inferensi model, endpoint model yang disesuaikan Gemini memiliki harga prediksi yang sama dengan model dasar.
| Model | Jenis | Harga (/1 juta token pelatihan) |
|---|---|---|
| Gemini 2.5 Pro | Penyesuaian yang diawasi | $25 |
| Gemini 2.5 Flash | Penyesuaian yang diawasi Penyesuaian preferensi |
$5 |
| Gemini 2.5 Flash Lite | Penyesuaian yang diawasi Penyesuaian preferensi |
$1,5 |
| Gemma 3 27B IT | Penyesuaian yang diawasi | $6,83 |
| Llama 3.1 8B | Penyesuaian yang diawasi | $0,67 |
| Llama 3.2 1B | Penyesuaian yang diawasi | $0,28 |
| Llama 3.2 3B | Penyesuaian yang diawasi | $0,61 |
| Llama 3.3 70B | Penyesuaian yang diawasi | $6,72 |
| Llama 4 Scout 17B 16E | Penyesuaian yang diawasi | $5,77 |
| Qwen 3 32B | Penyesuaian yang diawasi | $6,57 |
* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* Endpoint model Gemini yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
Membandingkan harga model partner di Vertex AI
Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi lebih lanjut, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.
Model AI21 Lab
| Model | Harga |
|---|---|
| Jamba 1.5 Large (Tidak digunakan lagi) | Input: $2 / juta token Output: $8 / juta token |
| Jamba 1.5 Mini (Tidak digunakan lagi) | Input: $0,20 / juta token Output: $0,40 / juta token |
Model Claude dari Anthropic
Model dengan harga regional
Global
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Opus 4.5 | Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25 |
|
| Claude Sonnet 4.5 | Input: $3,00 Output: $15,00 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 menit: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch: $1,88 Cache Hit Batch: $0,15 |
Input: $6,00 Output: $22,50 Input Batch: $3,00 Output Batch: $11,25 Penulisan Cache 5 mnt: $7,50 Penulisan Cache 1 jam: $12,00 Cache Hit: $0,60 Penulisan Cache Batch: $3,75 Cache Hit Batch: $0,30 |
| Claude Haiku 4.5 | Input: $1,00 Output: $5,00 Input Batch: $0,50 Output Batch: $2,50 Penulisan Cache 5 mnt: $1,25 Penulisan Cache 1 jam: $2,00 Cache Hit: $0,10 Penulisan Cache Batch: $0,625 Cache Hit Batch: $0,05 |
us-east5
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Opus 4.5 | Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275 |
|
| Claude Sonnet 4.5 | Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17 |
Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33 |
| Claude Haiku 4.5 | Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 menit: $1,375 Penulisan Cache 1 jam: $2,20 Penulisan Cache: $1,375 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055 |
europe-west1
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Opus 4.5 | Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275 |
|
| Claude Sonnet 4.5 | Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17 |
Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33 |
| Claude Haiku 4.5 | Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 menit: $1,375 Penulisan Cache 1 jam: $2,20 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055 |
asia-southeast1
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Opus 4.5 | Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275 |
|
| Claude Sonnet 4.5 | Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17 |
Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33 |
asia-east1
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Haiku 4.5 | Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 menit: $1,375 Penulisan Cache 1 jam: $2,20 Penulisan Cache: $1,375 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055 |
* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
Model dengan harga seragam di semua region
| Model | Harga (/1 juta token) < 200 ribu token input | Harga (/1 juta token) >= 200 ribu token input |
|---|---|---|
| Claude Opus 4.1 | Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 menit: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch: $9,375 Cache Hit Batch: $0,75 |
T/A |
| Claude Opus 4 | Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 menit: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch: $9,375 Cache Hit Batch: $0,75 |
T/A |
| Claude Sonnet 4 | Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch: $1,875 Cache Hit Batch: $0,15 |
Input: $6 Output: $22,50 Input Batch: $3 Output Batch: $11,25 Penulisan Cache 5 menit: $7,50 Penulisan Cache 1 jam: $12,00 Cache Hit: $0,60 Penulisan Cache Batch: $3,75 Cache Hit Batch: $0,30 |
| Claude 3.5 Haiku | Input: $0,80 Output: $4 Input Batch: $0,40 Output Batch: $2 Penulisan Cache 5 mnt: $1 Penulisan Cache 1 jam: $1,60 Cache Hit: $0,08 Penulisan Cache Batch: $0,50 Cache Hit Batch: $0,04 |
T/A |
| Claude 3 Haiku | Input: $0,25 Output: $1,25 5m Cache Write: $0,30 1h Cache Write: $0,50 Cache Hit: $0,03 | T/A |
| Claude 3.7 Sonnet (Tidak Digunakan Lagi) | Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Cache Write: $3,75 Cache Hit: $0,30 Cache Write Batch: $1,875 Cache Hit Batch: $0,15 |
T/A |
| Claude 3.5 Sonnet v2 (Tidak Digunakan Lagi) | Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Cache Write: $3,75 Cache Hit: $0,30 Cache Write Batch: $1,875 Cache Hit Batch: $0,15 |
T/A |
| Claude 3.5 Sonnet (Tidak Digunakan Lagi) | Input: $3 Output: $15 Cache Write: $3,75 Cache Hit: $0,30 |
T/A |
| Claude 3 Opus (Tidak digunakan lagi) | Input: $15 Output: $75 Cache Write: $18.75 Cache Hit: $1.50 |
T/A |
* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
Harga untuk alat
| Alat | Harga |
|---|---|
| Permintaan Penelusuran Web | $10 per 1.000 penelusuran
Model yang Didukung: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, dan Claude Opus 4. |
* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
Model Deepseek
| Model | Harga |
|---|---|
| DeepSeek-V3.1 | Input: $0,60 / juta token Output: $1,70 / juta token Input Batch: $0,30 / juta token Output Batch: $0,85 / juta token |
| DeepSeek-R1 (0528) | Input: $1,35 / juta token Output: $5,40 / juta token Input Batch: $0,675 / juta token Output Batch: $2,70 / juta token |
| DeepSeek-OCR * | Input: $0,30 / juta token (atau $0,0003/halaman) Output: $1,20 / juta token (atau $0,00012/halaman) |
- Tersedia tanpa biaya hingga 10 Nov 2025.
Model MiniMax
| Model | Harga |
|---|---|
| MiniMax-M2 * | Input: $0,30 / juta token Output: $1,20 / juta token |
- Tersedia tanpa biaya hingga 10 Nov 2025.
Model Moonshot
| Model | Harga |
|---|---|
| Kimi-K2-Thinking * | Input: $0,60 / juta token Output: $2,50 / juta token |
- Tersedia tanpa biaya hingga 17 November 2025.
Model Qwen
| Model | Harga |
|---|---|
| Qwen3-Next-80B-Thinking | Input: $0,15 / juta token Output: $1,20 / juta token |
| Qwen3-Next-80B-Instruct | Input: $0,15 / juta token Output: $1,20 / juta token |
| Qwen3-Coder-480B-A35B-Instruct | Input: $0,22 / juta token Output: $1,80 / juta token Input Batch: $0,11 / juta token Output Batch: $0,90 / juta token |
| Qwen3-235B-A22B-Instruct-2507 | Input: $0,22 / juta token Output: $0,88 / juta token Input Batch: $0,11 / juta token Output Batch: $0,44 / juta token |
Model OpenAI
| Model | Harga |
|---|---|
| gpt-oss-120b | Input: $0,09 / juta token Output: $0,36 / juta token Input Batch: $0,045 / juta token Output Batch: $0,18 / juta token |
| gpt-oss-20b | Input: $0,07 / juta token Output: $0,25 / juta token Input Batch: $0,035 / juta token Output Batch: $0,125 / juta token |
Model Llama dari Meta
| Model | Harga |
|---|---|
| Llama 3.1 405B | Input: $5,00 / juta token Output: $16,00 / juta token |
| Llama 3.3 70B | Input: $0,72 / juta token Output: $0,72 / juta token Input Batch: $0,36 / juta token Output Batch: $0,36 / juta token |
| Llama 4 Scout | Input: $0,25 / juta token Output: $0,70 / juta token Input Batch: $0,125 / juta token Output Batch: $0,35 / juta token |
| Llama 4 Maverick | Input: $0,35 / juta token Output: $1,15 / juta token Input Batch: $0,175 / juta token Output Batch: $0,575 / juta token |
Model Mistral AI
| Model | Harga |
|---|---|
| Mistral OCR (25.05) | Input: $0,0005 / juta token (atau $0,0005/halaman) Output: $0,0005 / juta token (atau $0,0005/halaman) |
| Mistral Medium 3 | Input: $0,40 / juta token Output: $2,00 / juta token |
| Mistral Small 3.1 (25.03) | Input: $0,10 / juta token Output: $0,30 / juta token |
| Mistral Large (24.11) (tidak digunakan lagi) | Token input: $2,00 / juta token Token output: $6,00 / juta token |
| Codestral 2 | Input: $0,30 / juta token Output: $0,90 / juta token |
| Codestral (25.01) (tidak digunakan lagi) | Input: $0,30 / juta token Output: $0,90 / juta token |