Biaya membangun dan men-deploy model AI di Vertex AI

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Anda hanya dikenai biaya untuk permintaan yang menampilkan kode respons 200. Permintaan yang menampilkan kode respons lain, seperti kode 4xx dan 5xx, tidak dikenai biaya untuk input atau output.

Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Vertex AI.

Model Google

Gemini 3

Model Jenis Harga (/1 juta token) <= 200 ribu token input Harga (/1 juta token) > 200 ribu token input Harga (/1 juta token) <= 200 ribu token input yang di-cache Harga (/1 juta token) > 200 ribu token input yang di-cache Harga (/1 juta token) <= 200 ribu token input dengan API batch Harga (/1 juta token) > 200 ribu token input dengan API batch
Pratinjau Gemini 3 Pro
Input (teks, gambar, video, audio) $2 $4 $0,2 $0,4 $1 $2
Output teks (respons dan penalaran) $12 $18 T/A T/A $6 $9
Output Gambar** $120 T/A T/A T/A $60 T/A
Grounding dengan Google Penelusuran & Grounding Web untuk Perusahaan Gemini 3 Pro mencakup 5.000 kueri penelusuran per bulan tanpa biaya tambahan.

Kueri penelusuran yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri penelusuran. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Penelusuran (atau Perujukan Web untuk Enterprise). Anda akan dikenai biaya untuk setiap kueri penelusuran yang dilakukan. Penagihan akan dimulai pada 5 Januari 2026.

Token input yang disediakan oleh Perujukan dengan Google Penelusuran atau Perujukan Web untuk Enterprise tidak dikenai biaya.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan Google Maps Gemini 3 Pro mencakup 5.000 kueri penelusuran per bulan tanpa biaya tambahan.

Kueri Maps yang melebihi batas tersebut akan ditagih sebesar $14 per 1.000 kueri. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Maps. Anda akan dikenai biaya untuk setiap kueri individual yang dijalankan. Penagihan akan dimulai pada 5 Januari 2026
Grounding dengan data Anda $2,5 per 1.000 permintaan.

* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Gambar output 1K (1024x1024) dan 2K (2048x2048) menggunakan 1.120 token output gambar, yang setara dengan $0,134/gambar yang dihasilkan. Gambar 4K (4096x4096) menggunakan 2.000 token output gambar, yang setara dengan $0,24/gambar yang dihasilkan.

Gemini 2.5

Model Jenis Harga (/1 juta token) <= 200 ribu token input Harga (/1 juta token) > 200 ribu token input Harga (/1 juta token) <= 200 ribu token input yang di-cache Harga (/1 juta token) > 200 ribu token input yang di-cache Harga (/1 juta token) <= 200 ribu token input dengan API batch Harga (/1 juta token) > 200 ribu token input dengan API batch
Gemini 2.5 Pro
Input (teks, gambar, video, audio) $1.25 $2,5 $0,125 $0,250 $0,625 $1.25
Output teks (respons dan penalaran) $10 $15 T/A T/A $5 $7,5
Gemini 2.5 Pro
Penggunaan Komputer-Pratinjau
Input (teks, gambar, video, audio) $1.25 $2,5 T/A T/A T/A T/A
Output teks (respons dan penalaran) $10,00 $15,00 T/A T/A T/A T/A


Gemini 2.5
Flash
Input (teks, gambar, video) $0,30 $0,30 $0,030 $0,030 $0,15 $0,15
Input Audio $1 $1 $0,100 $0,100 $0,5 $0,5
Output teks (respons dan penalaran) $2,50 $2,50 T/A T/A $1.25 $1.25
Output gambar*** $30 $30 T/A T/A $15 $15




Live API Gemini 2.5 Flash
1 juta token teks input $0,5 $0,5 T/A T/A T/A T/A
1 juta token audio input $3 $3 T/A T/A T/A T/A
1 juta token video/gambar input $3 $3 T/A T/A T/A T/A
1 juta token teks output $2 $2 T/A T/A T/A T/A
1 juta token audio output $12 $12 T/A T/A T/A T/A



Gemini 2.5 Flash Lite
Input (teks, gambar, video) $0,1 $0,1 $0,010 $0,010 $0,05 $0,05
Input Audio $0,3 $0,3 $0,030 $0,030 $0,15 $0,15
Output teks (respons dan penalaran) $0,4 $0,4 T/A T/A $0,2 $0,2


Grounding dengan Google Penelusuran
Gemini 2.0 Flash, 2.5 Flash,dan 2.5 Flash-Lite mencakup gabungan 1.500 perintah yang dirujukkan per hari tanpa biaya tambahan. Gemini 2.5 Pro mencakup 10.000 perintah yang dirujukkan per hari tanpa biaya tambahan.

Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan.

Perintah grounding adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran&ast;&ast;. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

Grounding Web untuk perusahaan
$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan**. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda $2,5 per 1.000 permintaan.
Grounding dengan Google Maps $25 per 1.000 perintah yang dirujukkan.

Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps.

* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
*** Gambar 1024x1024 menggunakan 1.290 token. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
**** Penagihan Penggunaan Komputer menggunakan SKU Gemini 2.5 Pro, untuk memisahkan biaya Penggunaan Komputer, terapkan tag penagihan. Lihat selengkapnya di sini.

  • Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
  • Mode Audio Proaktif: Jika diaktifkan, token input akan dikenai biaya saat LiveAPI mendengarkan. Token output hanya dikenakan biaya saat API merespons.
  • Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

Gemini 2.0

Gemini 2.0 ditagih berdasarkan token. Untuk menghitung jumlah token input dalam permintaan Anda sebelum mengirim permintaan, Anda dapat menggunakan tokenizer SDK atau countTokens API. Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

Gunakan tombol di tabel harga untuk membandingkan harga berbasis token dan harga berbasis modalitas.

Harga berbasis token

Model Jenis Harga Harga dengan Batch API




Gemini 2.0 Flash
1 juta token Input $0,15 $0,075
1 juta token audio Input $1,00 $0,50
1 juta token teks Output $0,60 $0,30
Penyesuaian untuk 1 juta token pelatihan $3,00




Pembuatan Gambar Gemini 2.0 Flash
1 juta token input $0,15
1 juta token audio input $1,00
1 juta token video input $3
1 juta token teks output $0,60
1 juta token gambar output $30,00




Gemini 2.0 Flash Live API
1 juta token teks input $0,5
1 juta token audio input $3
1 juta token video/gambar input $3
1 juta token teks output $2
1 juta token audio output $12




Gemini 2.0 Flash Lite
1 juta token Input $0,075 $0,0375
1 juta token audio Input $0,075 $0,0375
1 juta token teks Output $0,30 $0,15
Penyesuaian untuk 1 juta token pelatihan $1,00


Grounding dengan Google Penelusuran
Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan.

Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan.

Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

Grounding Web untuk perusahaan
$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda $2,5 per 1.000 permintaan mulai 16 Juni 2025.


Grounding dengan Google Maps
Model Gemini menyertakan sejumlah perintah rujukan harian tanpa biaya tambahan:
  • Gemini Flash dan Flash-Lite: gabungan 1.500 perintah yang dirujuk per hari.
  • Gemini Pro: 10.000 perintah yang dirujuk per hari.

  • Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $25 per 1.000 perintah yang dirujukkan.

    Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

    Harga berbasis modalitas

    Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

    • 4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.
    • Untuk gambar 1024x1024, token yang digunakan adalah 1.290. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
    • Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.
    • Input audio menggunakan 25 token per detik tanpa stempel waktu.
    Model Jenis Harga Harga dengan Batch API




    Gemini 2.0 Flash
    Teks input ($/M karakter) $0,0375 $0,01875
    Gambar input ($/gambar) $0,0001935 $0,00009675
    Video input ($/dtk) $0,0000387 $0,00001935
    Input audio ($/detik) $0,000025 $0,0000125
    Teks output ($/M karakter) $0,15 $0,075




    Pembuatan Gambar Gemini 2.0 Flash
    Teks input ($/M karakter) $0,0375
    Gambar input ($/gambar) $0,0001935
    Video input ($/dtk) $0,0000387
    Input audio ($/detik) $0,000025
    Teks output ($/M karakter) $0,15
    Gambar output gambar ($/gambar) $0,04





    Gemini 2.0 Flash Lite
    Teks input ($/M karakter) $0,01875 $0,009375
    Gambar input ($/gambar) $0,00009675 $0,000048375
    Video input ($/dtk) $0,00001935 $0,000009675
    Input audio ($/detik) $0,000001875 $0,000000938
    Teks output ($/M karakter) $0,075 $0,0375


    Grounding dengan Google Penelusuran
    Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan.

    Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan.

    Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

    Grounding Web untuk perusahaan
    $45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

    * Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
    * Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
    * PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
    * Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
    * Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
    * Gemini 2.0 Flash Live API: 25 token per detik audio (input/output), 258 token per detik video (input). Grounding dengan Google Penelusuran tetap gratis selama Gemini 2.0 Flash Live API dalam Pratinjau.

    • Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
    • Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

    Harga Pengoptimal Model Vertex AI (Eksperimental)*

    Pengoptimal Model Vertex AI menyederhanakan penggunaan Gemini untuk pelanggan perusahaan dengan menyediakan satu meta-endpoint untuk permintaan model Gemini. Pelanggan yang menggunakan layanan ini tidak perlu menentukan apakah akan menggunakan Flash, Pro, atau versi tertentu. Pengguna hanya perlu memberikan setelan yang dapat dikonfigurasi (biaya, kualitas, atau keseimbangan) untuk menunjukkan preferensi mereka, dan Model Optimizer akan menerapkan tingkat kecerdasan yang tepat untuk tugas tersebut dengan mengirimkan setiap kueri ke model yang paling sesuai.

    Vertex AI Model Optimizer menerapkan harga dinamis. Artinya, harga rata-rata per token bergantung pada tingkat kecerdasan model yang diterapkan untuk menyelesaikan tugas. Oleh karena itu, contoh harga disediakan di bawah untuk mengilustrasikan kemungkinan skenario berdasarkan setelan konfigurasi Anda (lihat tabel di bawah). SKU Model Optimizer adalah SKU $1 yang berfungsi sebagai unit pembelian untuk diterapkan pada penagihan Anda. Anda tetap akan ditagih berdasarkan konsumsi setelah menggunakan model.

    Rasio I/O 5:1 Contoh 1
    bot chat
    CATATAN: rentang ini bukan jaminan, hasil pelanggan individu dapat bervariasi
    Preferensi Pelanggan Token Input Pelanggan Dikirim ke MO Token Output Pelanggan Dikirim ke MO Harga Input Rata-Rata per Juta Token (Rentang Tinggi) Harga Output Rata-Rata per Juta Token (Rentang Tinggi) Harga Input Rata-Rata per Juta Token (Rentang Rendah) Harga Output Rata-Rata per Juta Token (Rentang Rendah)
    Biaya 10.000.000 2.000.000 $0,63 $2,50 $0,16 $0,63
    Seimbang 10.000.000 2.000.000 $1,26 $5,00 $0,63 $2,50
    Kualitas 10.000.000 2.000.000 $1,89 $7,50 $1,26 $5,00
    Rasio I/O 1:20 Contoh 2 Pembuatan konten
    Preferensi Pelanggan Token Input Pelanggan Dikirim ke MO Token Output Pelanggan Dikirim ke MO Harga Input Rata-Rata per Juta Token (Rentang Tinggi) Harga Output Rata-Rata per Juta Token (Rentang Tinggi) Harga Input Rata-Rata per Juta Token (Rentang Rendah) Harga Output Rata-Rata per Juta Token (Rentang Rendah)
    Biaya 1.000.000 20.000.000 $0,63 $2,50 $0,16 $0,63
    Seimbang 1.000.000 20.000.000 $1,26 $5,00 $0,63 $2,50
    Kualitas 1.000.000 20.000.000 $1,89 $7,50 $1,26 $5,00

    * Model Optimizer adalah penawaran eksperimental berbayar, dan dapat merutekan permintaan ke versi eksperimental Gemini di Vertex.

    Model Gemini lainnya

    Semua model Gemini selain Gemini 2.0 atau Gemini 2.5 ditagih berdasarkan modalitas seperti karakter, gambar, detik video/audio. Input teks dikenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input media dikenai biaya per gambar atau per detik (video). Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

    Model Fitur Jenis Harga
    ( =< 128 ribu token input)
    Harga
    ( > 128 ribu token input)
    Gemini 1.5 Flash Multimodal Input Gambar
    Input Video
    Input Teks
    Input Audio
    $0,00002 / gambar
    $0,00002 / detik
    $0,00001875 / 1.000 karakter
    $0,000002 / detik
    $0,00004 / gambar
    $0,00004 / detik
    $0,0000375 / 1.000 karakter
    $0,000004 / detik
    Output Teks $0,000075 / 1.000 karakter $0,00015 / 1.000 karakter
    Penyesuaian* Token Pelatihan $8 / 1 juta token
    Gemini 1.5 Pro Multimodal Input Gambar
    Input Video
    Input Teks
    Input Audio
    $0,00032875 / gambar
    $0,00032875 / detik
    $0,0003125 / 1.000 karakter
    $0,00003125 / detik
    $0,0006575 / gambar
    $0,0006575 / detik
    $0,000625 / 1 ribu karakter
    $0,0000625 / detik
    Output Teks $0,00125 / 1.000 karakter $0,0025 / 1.000 karakter
    Penyesuaian* Token Pelatihan $80 / 1 juta token
    Gemini 1.0 Pro Multimodal Input Gambar
    Input Video
    Input Teks
    $0,0025 / gambar
    $0,002 / detik
    $0,000125 / 1.000 karakter
    Output Teks $0,000375 / 1.000 karakter
    Grounding dengan Google Penelusuran Teks $35 per 1.000 perintah yang dirujukkan.

    Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
    Grounding Web untuk perusahaan Teks $45 per 1.000 perintah yang dirujukkan.

    Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
    Grounding dengan data Anda Teks $2,5 per 1.000 permintaan mulai 16 Juni 2025.

    * Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
    * Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya dengan tarif konteks panjang.
    * Model Gemini tersedia dalam mode batch dengan diskon 50%.
    * Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu.
    * PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
    * Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
    * Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.

    Imagen

    Dengan Imagen di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.

    Model Fitur Deskripsi Input Output Harga
    Imagen 4 Ultra Pembuatan gambar Buat gambar Perintah teks Gambar $0,06 per gambar
    Imagen 4 Peningkatan resolusi Meningkatkan resolusi gambar yang dihasilkan menjadi 2K, 3K, dan 4K Gambar Gambar $0,06 per gambar
    Imagen 4 Pembuatan gambar Buat gambar Perintah teks Gambar $0,04 per gambar
    Imagen 4 Fast Pembuatan gambar Buat gambar Perintah teks Gambar $0,02 per gambar
    Imagen 3 Pembuatan gambar Buat gambar
    Edit gambar
    Sesuaikan gambar
    Perintah teks Gambar $0,04 per gambar
    Imagen 3 Fast Pembuatan gambar Buat gambar Perintah teks Gambar $0,02 per gambar
    Imagen 2, Imagen 1 Pembuatan gambar Buat gambar Perintah teks Gambar $0,020 per gambar
    Imagen 2, Imagen 1 Pengeditan gambar Mengedit gambar menggunakan pendekatan mask atau tanpa mask Perintah Gambar/Teks Gambar $0,020 per gambar
    Imagen 1 Peningkatan resolusi Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k Gambar Gambar $0,003 per gambar
    Imagen 1 Fine tuning Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam prompt Imagen (beberapa pelatihan pengambilan gambar) Subjek dengan ID teks dan 4-8 gambar per subjek Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna) $ per jam kerja node (harga pelatihan kustom Vertex AI)
    Imagen Teks Keterangan Visual Membuat teks singkat atau panjang untuk gambar Gambar Teks keterangan $0,0015/gambar
    Imagen Tanya Jawab Visual Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar Perintah Gambar/Teks Jawaban teks $0,0015/gambar
    Imagen Rekonteks Produk Membayangkan kembali produk dalam adegan baru 1-3 Gambar produk yang sama dan perintah teks yang menjelaskan adegan yang diinginkan Gambar $0,12 per gambar
    Coba Virtual Vertex Buat gambar orang yang mengenakan pakaian berbeda 1 gambar orang dan 1 gambar pakaian Gambar $0,06 per gambar

    Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

    Veo

    Veo membuat video berkualitas sangat tinggi dalam berbagai subjek dan gaya, dengan pemahaman yang lebih baik tentang fisika dunia nyata serta nuansa gerakan dan ekspresi manusia.

    Model Fitur Deskripsi Input Output Resolusi Output Harga
    Veo 3.1 Pembuatan Video + Audio Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi Perintah Teks/Gambar Video + Audio 720p, 1080p $0,40/detik
    Veo 3.1 Pembuatan video Buat video berkualitas tinggi dari perintah teks atau gambar referensi Perintah Teks/Gambar Video 720p, 1080p $0,20/detik
    Veo 3.1 Fast Pembuatan Video + Audio Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat Perintah Teks/Gambar Video + Audio 720p, 1080p $0,15/detik
    Veo 3.1 Fast Pembuatan video Buat video dari perintah teks atau gambar referensi dengan lebih cepat Perintah Teks/Gambar Video 720p, 1080p $0,10/detik
    Veo 3 Pembuatan Video + Audio Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi Perintah Teks/Gambar Video + Audio 720p, 1080p $0,40/detik
    Veo 3 Pembuatan video Buat video berkualitas tinggi dari perintah teks atau gambar referensi Perintah Teks/Gambar Video 720p, 1080p $0,20/detik
    Veo 3 Fast Pembuatan Video + Audio Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat Perintah Teks/Gambar Video + Audio 720p, 1080p $0,15/detik
    Veo 3 Fast Pembuatan video Buat video dari perintah teks atau gambar referensi dengan lebih cepat Perintah Teks/Gambar Video 720p, 1080p $0,10/detik
    Veo 2 Pembuatan video Buat video dari perintah teks atau gambar referensi Perintah Teks/Gambar Video 720p $0,50/detik
    Veo 2 Kontrol Lanjutan Buat video melalui interpolasi frame awal dan akhir, perpanjang video yang dibuat, dan terapkan kontrol kamera Perintah Teks/Gambar/Video Video 720p $0,50/detik

    Lyria

    Lyria 2 menawarkan pembuatan musik instrumental berkualitas tinggi yang ideal untuk komposisi canggih dan eksplorasi kreatif mendetail yang mengutamakan output bernuansa.

    Model Fitur Deskripsi Input Output Harga
    Lyria 2 Pembuatan musik Membuat musik dari perintah teks Perintah teks Musik $0,06 per 30 detik

    Memahami biaya embedding untuk aplikasi AI Anda

    Model Jenis Region Harga per 1.000 token input
    Gemini Embedding Input Global
    • Permintaan online: $0,00015
    • Permintaan batch: $0,00012
    Output Global
    • Permintaan online: Tanpa biaya
    • Permintaan batch: Tidak ada biaya
    Model Jenis Region Harga per 1.000 karakter
    Embedding untuk Teks
    (Tidak termasuk Embedding Gemini)
    Input Global
    • Permintaan online: $0,000025
    • Permintaan batch: $0,00002
    Output Global
    • Permintaan online: Tanpa biaya
    • Permintaan batch: Tidak ada biaya
    Model Fitur Deskripsi Input Output Harga
    multimodalembedding Embedding untuk Multimodal: Teks Membuat embedding menggunakan teks sebagai input Teks Embedding $0,0002 / 1.000 input karakter
    Embedding untuk Multimodal: Gambar Membuat embedding menggunakan gambar sebagai input Gambar Embedding $0,0001 / input gambar
    Embeddings for Multimodal: Video Plus Video Plus Video Embedding (hingga 15 embedding per menit video) $0,0020 per detik video
    Embedding untuk Multimodal: Video Standard Video Standar Video Embedding (hingga 8 embedding per menit video) $0,0010 per detik video
    Embeddings for Multimodal: Video Essential Video Essential Video Embedding (hingga 4 embedding per menit video) $0,0005 per detik video
    Model Open Source Jenis Harga per 1.000 token input
    multilingual-e5-small Input:
    Output:

    Input Batch:
    Output Batch:
    Permintaan online: $0,000015
    Permintaan online: Tanpa biaya

    Permintaan batch: $0,0000075
    Permintaan batch: Tanpa biaya
    multilingual-e5-large Input:
    Output:

    Input Batch:
    Output Batch:
    Permintaan online: $0,000025
    Permintaan online: Tanpa biaya

    Permintaan batch: $0,0000125
    Permintaan batch: Tanpa biaya

    Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

    Harga untuk pelengkapan kode Vertex AI

    AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.

    Model Jenis Region Harga per 1.000 karakter
    Codey untuk Penyelesaian kode Input Global
    • Permintaan online: $0,00025
    Output Global
    • Permintaan online: $0,0005

    Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

    Terjemahan (Teks)

    Menggunakan Vertex AI API dan LLM Terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar seperti manusia dibandingkan model terjemahan klasik, tetapi dukungan bahasanya lebih terbatas (Pelajari Lebih Lanjut).

    Model Metode Penggunaan Harga per juta karakter
    LLM Terjemahan teks* Jumlah karakter input per bulan

    $10 per juta karakter*

    Jumlah karakter output per bulan

    $10 per juta karakter*

    Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
    *Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya

    Harga Penyimpanan Cache Konteks untuk Pembuatan Cache Eksplisit

    Model Fitur Jenis Harga (/1 juta token)
    <= 200 ribu token input
    Harga (/1 juta token)
    > 200 ribu token input
    Gemini 3 Pro Penyimpanan Cache Konteks Input (teks, gambar, video, audio) $4,5 (/M Token/jam) $4,5 (/M Token/jam)
    Gemini 2.5 Pro Penyimpanan Cache Konteks Input (teks, gambar, video, audio) $4,5 (/M Token/jam) $4,5 (/M Token/jam)
    Gemini 2.5 Flash Penyimpanan Cache Konteks Input (teks, gambar, video, audio) $1 (/M Token/jam) $1 (/M Token/jam)
    Gemini 2.5 Flash Lite Penyimpanan Cache Konteks Input (teks, gambar, video, audio) $1 (/M Token/jam) $1 (/M Token/jam)

    Model Gemini 2.0

    Harga berbasis token


    Model

    Jenis
    Penyimpanan
    (M tok-hour)
    Harga




    Gemini 2.0 Flash
    1 juta token Input $1,00 $0,0375
    1 juta token audio Input $1,00 $0,25
    1 juta token teks Output NA NA


    Gemini 2.0 Flash Lite
    1 juta token Input $1,00 $0,01875
    1 juta token audio Input $1,00 $0,01875
    1 juta token teks Output NA NA

    Harga berbasis modalitas

    Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

    • 4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.
    • Untuk gambar 1024x1024, token yang digunakan adalah 1.290. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
    • Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.
    • Input audio menggunakan 25 token per detik tanpa stempel waktu.

    Model

    Jenis
    Penyimpanan
    (Jam Modalitas)

    Harga




    Gemini 2.0 Flash
    Teks input ($/M karakter) $0,25 $0,009375
    Gambar input ($/gambar) $0,00129 $0,000048375
    Video input ($/dtk) $0,000258 $0,000009675
    Input audio ($/detik) $0,000025 $0,00000625
    Teks output ($/M karakter) NA NA




    Gemini 2.0 Flash Lite
    Teks input ($/M karakter) $0,25 $0,0046875
    Gambar input ($/gambar) $0,00129 $0,0000241875
    Video input ($/dtk) $0,000258 $0,000009675
    Input audio ($/detik) $0,000258 $0,0000048375
    Teks output ($/M karakter) NA NA


    Grounding dengan Google Penelusuran
    Gemini 2.0 Flash mencakup hingga 1.500 permintaan yang dirujuk per hari tanpa biaya tambahan. Permintaan yang dirujuk
    melebihi 1.500 per hari akan ditagih sebesar $35 per 1.000 permintaan (hingga 1 juta permintaan per hari).

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari.

    Grounding Web untuk perusahaan
    $45 per 1.000 permintaan (hingga 1 juta permintaan per hari) mulai 5 Mei 2025.

    Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari.

    * Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
    * PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
    * Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
    * Perujukan dengan Google Penelusuran hanya ditagih untuk permintaan yang menampilkan hasil yang berisi setidaknya satu URL dukungan perujukan dari web. Biaya penggunaan model Gemini standar juga berlaku.

    Throughput yang Disediakan

    Throughput yang disediakan memastikan throughput untuk kebutuhan AI generatif Anda dan ditransaksikan melalui unit skala AI generatif, atau GSU. Pelajari lebih lanjut throughput yang disediakan setiap GSU di sini dan gunakan alat estimasi online kami di sini.

    Durasi Harga per GSU Per
    Komitmen 1 minggu $1.200 Minggu
    Komitmen 1 bulan $2.700 Bulan
    Komitmen 3 bulan $2.400 Bulan
    Komitmen 1 tahun $2.000 Bulan

    Contoh penghitungan biaya

    Seorang pengguna perlu memastikan bahwa mereka dapat mendukung 10 kueri per detik (QPS) dari kueri dengan input 1.000 token teks dan 500 token audio serta menerima output 300 token teks menggunakan gemini-2.0-flash.

    Menggunakan tabel throughput dan laju penurunan, untuk gemini-2.0-flash, kita tahu laju penurunan token teks input adalah 1 token, laju penurunan token audio input adalah 7 token, dan laju penurunan token teks output adalah 4 token.

    Total token input pengguna adalah 1.000* (1 token per token teks input) + 500* (7 token per token audio input) = 4.500 token input yang disesuaikan dengan burndown. Total token output pengguna adalah 300* (4 token per token teks output) = 1.200 token output yang disesuaikan dengan burndown. Jika dijumlahkan, kita mendapatkan 4.500 token input yang disesuaikan dengan burndown + 1.200 token output yang disesuaikan dengan burndown = 5.700 total token per kueri.

    Dengan mengalikan total token per kueri dengan QPS, kita mendapatkan 5.700 total token per kueri * 10 QPS = 57.000 total token per detik.

    Dengan membagi angka ini dengan total throughput per detik per GSU,kita mendapatkan 57.000 total token per detik ÷ 3.360 throughput per detik per GSU = 16,96 GSU. Peningkatan pembelian GSU minimum untuk model ini adalah 1, sehingga pengguna memerlukan 17 GSU.

    Jika pengguna ingin mempertahankan throughput ini selama 1 minggu, biayanya adalah $1.200 * 17 GSU = $20.400 per minggu. Jika mereka ingin mempertahankan throughput ini selama 1 bulan, biayanya adalah $2.700 * 17 GSU = $45.900 per bulan. Jika mereka ingin mempertahankan throughput ini selama 3 bulan, biayanya adalah $2.400 * 17 GSU = $40.800 per bulan. Terakhir, jika mereka ingin mempertahankan throughput ini selama 1 tahun, biayanya adalah $2.000 * 17 GSU = $34.000 per bulan.

    Penyesuaian Model

    Penyesuaian model adalah cara efektif untuk menyesuaikan model besar dengan tugas Anda. Langkah ini penting untuk meningkatkan kualitas dan efisiensi model. Penyesuaian model memberikan manfaat berikut:

    • Kualitas lebih tinggi untuk tugas spesifik Anda
    • Peningkatan ketahanan model
    • Latensi dan biaya inferensi lebih rendah karena perintah yang lebih pendek

    Penyesuaian dikenakan biaya per juta token pelatihan. Token pelatihan dihitung berdasarkan total jumlah token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda. Untuk inferensi model, endpoint model yang disesuaikan Gemini memiliki harga prediksi yang sama dengan model dasar.

    Model Jenis Harga (/1 juta token pelatihan)
    Gemini 2.5 Pro Penyesuaian yang diawasi $25
    Gemini 2.5 Flash Penyesuaian yang diawasi
    Penyesuaian preferensi
    $5
    Gemini 2.5 Flash Lite Penyesuaian yang diawasi
    Penyesuaian preferensi
    $1,5
    Gemma 3 27B IT Penyesuaian yang diawasi $6,83
    Llama 3.1 8B Penyesuaian yang diawasi $0,67
    Llama 3.2 1B Penyesuaian yang diawasi $0,28
    Llama 3.2 3B Penyesuaian yang diawasi $0,61
    Llama 3.3 70B Penyesuaian yang diawasi $6,72
    Llama 4 Scout 17B 16E Penyesuaian yang diawasi $5,77
    Qwen 3 32B Penyesuaian yang diawasi $6,57

    * Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
    * Endpoint model Gemini yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.

    Membandingkan harga model partner di Vertex AI

    Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi lebih lanjut, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.

    Model AI21 Lab

    Model Harga
    Jamba 1.5 Large (Tidak digunakan lagi) Input: $2 / juta token
    Output: $8 / juta token
    Jamba 1.5 Mini (Tidak digunakan lagi) Input: $0,20 / juta token
    Output: $0,40 / juta token

    Model Claude dari Anthropic

    Model dengan harga regional

    Global

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Opus 4.5 Input: $5,00
    Output: $25,00

    Input Batch: $2,50
    Output Batch: $12,50

    Penulisan Cache 5 mnt: $6,25
    Penulisan Cache 1 jam: $10,00

    Cache Hit: $0,50

    Penulisan Cache Batch 5 mnt: $3,125
    Penulisan Cache Batch 1 jam: $5,00
    Cache Hit Batch: $0,25
    Claude Sonnet 4.5 Input: $3,00
    Output: $15,00

    Input Batch: $1,50
    Output Batch: $7,50

    Penulisan Cache 5 menit: $3,75
    Penulisan Cache 1 jam: $6,00

    Cache Hit: $0,30

    Penulisan Cache Batch: $1,88
    Cache Hit Batch: $0,15
    Input: $6,00
    Output: $22,50

    Input Batch: $3,00
    Output Batch: $11,25

    Penulisan Cache 5 mnt: $7,50
    Penulisan Cache 1 jam: $12,00

    Cache Hit: $0,60

    Penulisan Cache Batch: $3,75
    Cache Hit Batch: $0,30
    Claude Haiku 4.5 Input: $1,00
    Output: $5,00

    Input Batch: $0,50
    Output Batch: $2,50

    Penulisan Cache 5 mnt: $1,25
    Penulisan Cache 1 jam: $2,00

    Cache Hit: $0,10

    Penulisan Cache Batch: $0,625
    Cache Hit Batch: $0,05

    us-east5

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Opus 4.5 Input: $5,50
    Output: $27,50

    Input Batch: $2,75
    Output Batch: $13,75

    Penulisan Cache 5 mnt: $6,875
    Penulisan Cache 1 jam: $11,00

    Cache Hit: $0,55

    Penulisan Cache Batch 5 mnt: $3,438
    Penulisan Cache Batch 1 jam: $5,50
    Cache Hit Batch: $0,275
    Claude Sonnet 4.5 Input: $3,30
    Output: $16,50

    Input Batch: $1,65
    Output Batch: $8,25

    Penulisan Cache 5 menit: $4,13
    Penulisan Cache 1 jam: $6,60

    Cache Hit: $0,33

    Penulisan Cache Batch: $2,06
    Cache Hit Batch: $0,17
    Input: $6,60
    Output: $24,75

    Input Batch: $3,30
    Output Batch: $12,38

    Penulisan Cache 5 menit: $8,25
    Penulisan Cache 1 jam: $13,20

    Cache Hit: $0,66

    Penulisan Cache Batch: $4,13
    Cache Hit Batch: $0,33
    Claude Haiku 4.5 Input: $1,10
    Output: $5,50

    Input Batch: $0,55
    Output Batch: $2,75

    Penulisan Cache 5 menit: $1,375
    Penulisan Cache 1 jam: $2,20

    Penulisan Cache: $1,375
    Cache Hit: $0,11

    Penulisan Cache Batch: $0,688
    Cache Hit Batch: $0,055

    europe-west1

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Opus 4.5 Input: $5,50
    Output: $27,50

    Input Batch: $2,75
    Output Batch: $13,75

    Penulisan Cache 5 mnt: $6,875
    Penulisan Cache 1 jam: $11,00

    Cache Hit: $0,55

    Penulisan Cache Batch 5 mnt: $3,438
    Penulisan Cache Batch 1 jam: $5,50
    Cache Hit Batch: $0,275
    Claude Sonnet 4.5 Input: $3,30
    Output: $16,50

    Input Batch: $1,65
    Output Batch: $8,25

    Penulisan Cache 5 menit: $4,13
    Penulisan Cache 1 jam: $6,60

    Cache Hit: $0,33

    Penulisan Cache Batch: $2,06
    Cache Hit Batch: $0,17
    Input: $6,60
    Output: $24,75

    Input Batch: $3,30
    Output Batch: $12,38

    Penulisan Cache 5 menit: $8,25
    Penulisan Cache 1 jam: $13,20

    Cache Hit: $0,66

    Penulisan Cache Batch: $4,13
    Cache Hit Batch: $0,33
    Claude Haiku 4.5 Input: $1,10
    Output: $5,50

    Input Batch: $0,55
    Output Batch: $2,75

    Penulisan Cache 5 menit: $1,375
    Penulisan Cache 1 jam: $2,20

    Cache Hit: $0,11

    Penulisan Cache Batch: $0,688
    Cache Hit Batch: $0,055

    asia-southeast1

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Opus 4.5 Input: $5,50
    Output: $27,50

    Input Batch: $2,75
    Output Batch: $13,75

    Penulisan Cache 5 mnt: $6,875
    Penulisan Cache 1 jam: $11,00

    Cache Hit: $0,55

    Penulisan Cache Batch 5 mnt: $3,438
    Penulisan Cache Batch 1 jam: $5,50
    Cache Hit Batch: $0,275
    Claude Sonnet 4.5 Input: $3,30
    Output: $16,50

    Input Batch: $1,65
    Output Batch: $8,25

    Penulisan Cache 5 menit: $4,13
    Penulisan Cache 1 jam: $6,60

    Cache Hit: $0,33

    Penulisan Cache Batch: $2,06
    Cache Hit Batch: $0,17
    Input: $6,60
    Output: $24,75

    Input Batch: $3,30
    Output Batch: $12,38

    Penulisan Cache 5 menit: $8,25
    Penulisan Cache 1 jam: $13,20

    Cache Hit: $0,66

    Penulisan Cache Batch: $4,13
    Cache Hit Batch: $0,33

    asia-east1

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Haiku 4.5 Input: $1,10
    Output: $5,50

    Input Batch: $0,55
    Output Batch: $2,75

    Penulisan Cache 5 menit: $1,375
    Penulisan Cache 1 jam: $2,20

    Penulisan Cache: $1,375
    Cache Hit: $0,11

    Penulisan Cache Batch: $0,688
    Cache Hit Batch: $0,055

    * Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

    Model dengan harga seragam di semua region

    Model Harga (/1 juta token) < 200 ribu token input Harga (/1 juta token) >= 200 ribu token input
    Claude Opus 4.1 Input: $15
    Output: $75

    Input Batch: $7,50
    Output Batch: $37,50

    Penulisan Cache 5 menit: $18,75
    Penulisan Cache 1 jam: $30

    Cache Hit: $1,50

    Penulisan Cache Batch: $9,375
    Cache Hit Batch: $0,75
    T/A
    Claude Opus 4 Input: $15
    Output: $75

    Input Batch: $7,50
    Output Batch: $37,50

    Penulisan Cache 5 menit: $18,75
    Penulisan Cache 1 jam: $30

    Cache Hit: $1,50

    Penulisan Cache Batch: $9,375
    Cache Hit Batch: $0,75
    T/A
    Claude Sonnet 4 Input: $3
    Output: $15

    Input Batch: $1,50
    Output Batch: $7,50

    Penulisan Cache 5 mnt: $3,75
    Penulisan Cache 1 jam: $6,00

    Cache Hit: $0,30

    Penulisan Cache Batch: $1,875
    Cache Hit Batch: $0,15
    Input: $6
    Output: $22,50

    Input Batch: $3
    Output Batch: $11,25

    Penulisan Cache 5 menit: $7,50
    Penulisan Cache 1 jam: $12,00

    Cache Hit: $0,60

    Penulisan Cache Batch: $3,75
    Cache Hit Batch: $0,30
    Claude 3.5 Haiku Input: $0,80
    Output: $4

    Input Batch: $0,40
    Output Batch: $2

    Penulisan Cache 5 mnt: $1
    Penulisan Cache 1 jam: $1,60

    Cache Hit: $0,08

    Penulisan Cache Batch: $0,50
    Cache Hit Batch: $0,04
    T/A
    Claude 3 Haiku Input: $0,25
    Output: $1,25

    5m Cache Write: $0,30
    1h Cache Write: $0,50

    Cache Hit: $0,03
    T/A
    Claude 3.7 Sonnet (Tidak Digunakan Lagi) Input: $3
    Output: $15

    Input Batch: $1,50
    Output Batch: $7,50

    Cache Write: $3,75
    Cache Hit: $0,30

    Cache Write Batch: $1,875
    Cache Hit Batch: $0,15
    T/A
    Claude 3.5 Sonnet v2 (Tidak Digunakan Lagi) Input: $3
    Output: $15

    Input Batch: $1,50
    Output Batch: $7,50

    Cache Write: $3,75
    Cache Hit: $0,30

    Cache Write Batch: $1,875
    Cache Hit Batch: $0,15
    T/A
    Claude 3.5 Sonnet (Tidak Digunakan Lagi) Input: $3
    Output: $15

    Cache Write: $3,75
    Cache Hit: $0,30
    T/A
    Claude 3 Opus (Tidak digunakan lagi) Input: $15
    Output: $75

    Cache Write: $18.75
    Cache Hit: $1.50
    T/A

    * Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

    Harga untuk alat

    Alat Harga
    Permintaan Penelusuran Web $10 per 1.000 penelusuran
    Model yang Didukung: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, dan Claude Opus 4.

    * Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

    Model Deepseek

    Model Harga
    DeepSeek-V3.1 Input: $0,60 / juta token
    Output: $1,70 / juta token

    Input Batch: $0,30 / juta token
    Output Batch: $0,85 / juta token
    DeepSeek-R1 (0528) Input: $1,35 / juta token
    Output: $5,40 / juta token

    Input Batch: $0,675 / juta token
    Output Batch: $2,70 / juta token
    DeepSeek-OCR * Input: $0,30 / juta token (atau $0,0003/halaman)
    Output: $1,20 / juta token (atau $0,00012/halaman)
    • Tersedia tanpa biaya hingga 10 Nov 2025.

    Model MiniMax

    Model Harga
    MiniMax-M2 * Input: $0,30 / juta token
    Output: $1,20 / juta token
    • Tersedia tanpa biaya hingga 10 Nov 2025.

    Model Moonshot

    Model Harga
    Kimi-K2-Thinking * Input: $0,60 / juta token
    Output: $2,50 / juta token
    • Tersedia tanpa biaya hingga 17 November 2025.

    Model Qwen

    Model Harga
    Qwen3-Next-80B-Thinking Input: $0,15 / juta token
    Output: $1,20 / juta token
    Qwen3-Next-80B-Instruct Input: $0,15 / juta token
    Output: $1,20 / juta token
    Qwen3-Coder-480B-A35B-Instruct Input: $0,22 / juta token
    Output: $1,80 / juta token

    Input Batch: $0,11 / juta token
    Output Batch: $0,90 / juta token
    Qwen3-235B-A22B-Instruct-2507 Input: $0,22 / juta token
    Output: $0,88 / juta token

    Input Batch: $0,11 / juta token
    Output Batch: $0,44 / juta token

    Model OpenAI

    Model Harga
    gpt-oss-120b Input: $0,09 / juta token
    Output: $0,36 / juta token

    Input Batch: $0,045 / juta token
    Output Batch: $0,18 / juta token
    gpt-oss-20b Input: $0,07 / juta token
    Output: $0,25 / juta token

    Input Batch: $0,035 / juta token
    Output Batch: $0,125 / juta token

    Model Llama dari Meta

    Model Harga
    Llama 3.1 405B Input: $5,00 / juta token
    Output: $16,00 / juta token
    Llama 3.3 70B Input: $0,72 / juta token
    Output: $0,72 / juta token

    Input Batch: $0,36 / juta token
    Output Batch: $0,36 / juta token
    Llama 4 Scout Input: $0,25 / juta token
    Output: $0,70 / juta token

    Input Batch: $0,125 / juta token
    Output Batch: $0,35 / juta token
    Llama 4 Maverick Input: $0,35 / juta token
    Output: $1,15 / juta token

    Input Batch: $0,175 / juta token
    Output Batch: $0,575 / juta token

    Model Mistral AI

    Model Harga
    Mistral OCR (25.05) Input: $0,0005 / juta token (atau $0,0005/halaman)
    Output: $0,0005 / juta token (atau $0,0005/halaman)
    Mistral Medium 3 Input: $0,40 / juta token
    Output: $2,00 / juta token
    Mistral Small 3.1 (25.03) Input: $0,10 / juta token
    Output: $0,30 / juta token
    Mistral Large (24.11) (tidak digunakan lagi) Token input: $2,00 / juta token
    Token output: $6,00 / juta token
    Codestral 2 Input: $0,30 / juta token
    Output: $0,90 / juta token
    Codestral (25.01) (tidak digunakan lagi) Input: $0,30 / juta token
    Output: $0,90 / juta token

    Meminta penawaran harga khusus

    Dengan model harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.
    Hubungi bagian penjualan