Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Biaya membangun dan men-deploy model AI di Platform Agen

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Anda hanya dikenai biaya untuk permintaan yang menampilkan kode respons 200. Permintaan yang menampilkan kode respons lain, seperti kode 4xx dan 5xx, tidak dikenai biaya untuk input atau output.

Halaman ini membahas harga untuk AI Generatif di Agent Platform. Untuk semua harga Platform Agen lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Platform Agen.

Model Google

Gemini 3

Standar

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input	Harga (/1 juta token) <= 200 ribu token input yang di-cache	Harga (/1 juta token) > 200 ribu token input yang di-cache
Pratinjau Gemini 3.1 Pro
	Input (teks, gambar, video, audio)	$2	$4	$0,2	$0,4
	Output teks (respons dan penalaran)	$12	$18	T/A	T/A
Gemini 3.5 Flash
	Input (teks, gambar, video, audio)	$1,50 (Global) $1,65 (Non-global)*	$1,50 (Global) $1,65 (Non-global)*	$0,15 (Global) $0,165 (Non-global)*	$0,15 (Global) $0,165 (Non-global)*
	Output teks (respons dan penalaran)	$9,00 (Global) $9,90 (Non-global)*	$9,00 (Global) $9,90 (Non-global)*	T/A	T/A
Pratinjau Gemini 3 Flash
	Input (teks, gambar, video)	$0,5	$0,5	$0,05	$0,05
	Input (audio)	$1	$1	$0,1	$0,1
	Output teks (respons dan penalaran)	$3	$3	T/A	T/A
Gemini 3.1 Flash-Lite
	Input (teks, gambar, video)	$0,25 (Global) $0,275 (Non-global)*	$0,25 (Global) $0,275 (Non-global)*	$0,025 (Global) $0,0275 (Non-global)*	$0,025 (Global) $0,0275 (Non-global)*
	Input (audio)	$0,5 (Global) $0,55 (Non-global)*	$0,5 (Global) $0,55 (Non-global)*	$0,05 (Global) $0,055 (Non-global)*	$0,05 (Global) $0,055 (Non-global)*
	Output teks (respons dan penalaran)	$1,5 (Global) $1,65 (Non-global)*	$1,5 (Global) $1,65 (Non-global)*	T/A	T/A
Gemini 3 Pro Image
	Input (teks, gambar)	$2	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$12	T/A	T/A	T/A
	Output Gambar**	$120	T/A	T/A	T/A
Gemini 3.1 Flash Image
	Input (teks, gambar, video)	$0,50	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$3	T/A	T/A	T/A
	Output Gambar***	$60	T/A	T/A	T/A

Prioritas

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input dengan Prioritas	Harga (/1 juta token) > 200 ribu token input dengan Prioritas	Harga (per 1 juta token) <= 200 ribu token input yang di-cache dengan Prioritas	Harga (/1 juta token) > 200 ribu token input yang di-cache dengan Prioritas
Pratinjau Gemini 3.1 Pro
	Input (teks, gambar, video, audio)	$3,6	$7,2	$0,36	$0,72
	Output teks (respons dan penalaran)	$21,6	$32,4	T/A	T/A
Gemini 3.5 Flash
	Input (teks, gambar, video, audio)	$2,70 (Global) $2,97 (Non-global)*	$2,70 (Global) $2,97 (Non-global)*	$0,27 (Global) $0,297 (Non-global)*	$0,27 (Global) $0,297 (Non-global)*
	Output teks (respons dan penalaran)	$16,20 (Global) $17,82 (Non-global)*	$16,20 (Global) $17,82 (Non-global)*	T/A	T/A
Pratinjau Gemini 3 Flash
	Input (teks, gambar, video)	$0,9	$0,9	$0,09	$0,09
	Input (audio)	$1,8	$1,8	$0,18	$0,18
	Output teks (respons dan penalaran)	$5,40	$5,40	T/A	T/A
Gemini 3.1 Flash-Lite
	Input (teks, gambar, video)	$0,45 (Global) $0,495 (Non-global)*	$0,45 (Global) $0,495 (Non-global)*	$0,045 (Global) $0,0495 (Non-global)*	$0,045 (Global) $0,0495 (Non-global)*
	Input (audio)	$0,9 (Global) $0,99 (Non-global)*	$0,9 (Global) $0,99 (Non-global)*	$0,09 (Global) $0,099 (Non-global)*	$0,09 (Global) $0,099 (Non-global)*
	Output teks (respons dan penalaran)	$2,7 (Global) $2,97 (Non-global)*	$2,7 (Global) $2,97 (Non-global)*	T/A	T/A
Gemini 3 Pro Image
	Input (teks, gambar, video, audio)	T/A	T/A	T/A	T/A
	Output teks (respons dan penalaran)	T/A	T/A	T/A	T/A
	Output Gambar**	T/A	T/A	T/A	T/A
Gemini 3.1 Flash Image
	Input (teks, gambar, video)	T/A	T/A	T/A	T/A
	Output teks (respons dan penalaran)	T/A	T/A	T/A	T/A
	Output Gambar***	T/A	T/A	T/A	T/A

Flex/Batch

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input dengan Flex/Batch	Harga (/1 juta token) > 200 ribu token input dengan Flex/Batch	Harga (per 1 juta token) <= 200 ribu token input yang di-cache dengan Flex/Batch	Harga (/1 juta token) > 200 ribu token input yang di-cache dengan Flex/Batch
Pratinjau Gemini 3.1 Pro
	Input (teks, gambar, video, audio)	$1	$2	T/A	T/A
	Output teks (respons dan penalaran)	$6	$9	T/A	T/A
Gemini 3.5 Flash
	Input (teks, gambar, video, audio)	$0,75 (Global) $0,825 (Non-global)*	$0,75 (Global) $0,825 (Non-global)*	Batch: $0,075 (Global) Flex: $0,08 (Global) $0,0825 (Non-global)*	Batch: $0,075 (Global) Flex: $0,08 (Global) $0,0825 (Non-global)*
	Output teks (respons dan penalaran)	$4,50 (Global) $4,95 (Non-global)*	$4,50 (Global) $4,95 (Non-global)*	T/A	T/A
Pratinjau Gemini 3 Flash
	Input (teks, gambar, video)	$0,25	$0,25	T/A	T/A
	Input (audio)	$0,5	$0,5	T/A	T/A
	Output teks (respons dan penalaran)	$1,5	$1,5	T/A	T/A
Gemini 3.1 Flash-Lite
	Input (teks, gambar, video)	$0,125 (Global) $0,1375 (Non-global)*	$0,125 (Global) $0,1375 (Non-global)*	$0,0125 (Global) $0,01375 (Non-global)*	$0,0125 (Global) $0,01375 (Non-global)*
	Input (audio)	$0,25 (Global) $0,275 (Non-global)*	$0,25 (Global) $0,275 (Non-global)*	$0,025 (Global) $0,0275 (Non-global)*	$0,025 (Global) $0,0275 (Non-global)*
	Output teks (respons dan penalaran)	$0,75 (Global) $0,825 (Non-global)*	$0,75 (Global) $0,825 (Non-global)*	T/A	T/A
Gemini 3 Pro Image
	Input (teks, gambar)	$1	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$6	T/A	T/A	T/A
	Output Gambar**	$60	T/A	T/A	T/A
Gemini 3.1 Flash Image
	Input (teks, gambar, video)	$0,25	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$1,50	T/A	T/A	T/A
	Output Gambar***	$30	T/A	T/A	T/A

Fitur	Harga
Grounding dengan Penelusuran Web Google dan Penelusuran Gambar Google, & Grounding Web untuk Perusahaan	Mencakup 5.000 kueri penelusuran per bulan tanpa biaya, yang diagregatkan di semua model Gemini 3. Kueri penelusuran yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri penelusuran. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Penelusuran (atau Perujukan Web untuk Enterprise). Anda akan dikenai biaya untuk setiap kueri penelusuran yang dilakukan. Penagihan akan dimulai pada 5 Januari 2026. Token input yang disediakan oleh Perujukan dengan Google Penelusuran atau Perujukan Web untuk Enterprise tidak dikenai biaya. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka dengan harga standar.
Grounding dengan Google Maps	Mencakup 5.000 kueri penelusuran per bulan tanpa biaya, yang diagregatkan di semua model Gemini 3. Kueri Maps yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Maps. Anda akan dikenai biaya untuk setiap kueri individual yang dijalankan. Penagihan akan dimulai pada 5 Januari 2026 Token input yang disediakan oleh Google Maps tidak dikenai biaya.
Grounding dengan data Anda	$2,50 per 1.000 perintah.

* Untuk endpoint non-global, harga akan berlaku untuk model Gemini 3 dan model yang lebih baru yang tersedia secara umum mulai 1 Juli 2026. Sebelum 1 Juli 2026, harga endpoint Global berlaku untuk endpoint Non-global.
* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
* Endpoint model yang disesuaikan akan 1,5 kali lipat dari model dasar.
** Gemini 3 Pro Image mengenakan biaya 560 token ($0,0011) per gambar input, dengan biaya gambar output yang disesuaikan berdasarkan resolusi: 1.120 token ($0,134) untuk 1K dan 2K (sekitar 1 MP dan 4 MP), serta 2.000 token ($0,24) untuk 4K (sekitar 16 MP).
*** Gemini 3.1 Flash Image mengenakan biaya 1.120 token ($0,0006) per gambar input, dengan biaya gambar output yang disesuaikan berdasarkan resolusi: 747 token ($0,045 per gambar output) untuk 512 (sekitar 0,25 MP), 1.120 token ($0,067) untuk 1K (sekitar 1 MP), 1.680 token ($0,101) untuk 2K (sekitar 4 MP), dan 2.520 token ($0,15) untuk 4K (sekitar 16 MP).

Agen

Model	Jenis	Harga (/1 juta token)	Harga (/M token input yang di-cache)
Agen Deep Research Gemini	Input (teks)	$2	$0,2
Agen Deep Research Gemini	Output teks (respons dan penalaran)	$12	T/A

Fitur

Harga

Grounding dengan Penelusuran Web Google dan Penelusuran Gambar Google, & Grounding Web untuk Perusahaan

Mencakup 5.000 kueri penelusuran per bulan tanpa biaya, yang diagregatkan di semua model Gemini 3.

Kueri penelusuran yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri penelusuran. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Penelusuran (atau Perujukan Web untuk Enterprise). Anda akan dikenai biaya untuk setiap kueri penelusuran yang dilakukan. Penagihan akan dimulai pada 5 Januari 2026.

Token input yang disediakan oleh Perujukan dengan Google Penelusuran atau Perujukan Web untuk Enterprise tidak dikenai biaya.

Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka dengan harga standar.

Grounding dengan data Anda

$2,50 per 1.000 perintah.

Gemini 2.5

Standar

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input	Harga (/1 juta token) <= 200 ribu token input yang di-cache	Harga (/1 juta token) > 200 ribu token input yang di-cache
Gemini 2.5 Pro
	Input (teks, gambar, video, audio)	$1.25	$2,50	$0,13	$0,25
	Output teks (respons dan penalaran)	$10	$15	T/A	T/A
Gemini 2.5 Pro Penggunaan Komputer-Pratinjau
	Input (teks, gambar, video, audio)	$1.25	$2,5	T/A	T/A
	Output teks (respons dan penalaran)	$10,00	$15,00	T/A	T/A
Gemini 2.5 Flash
	Input (teks, gambar, video)	$0,30	$0,30	$0,03	$0,03
	Input Audio	$1	$1	$0,10	$0,10
	Output teks (respons dan penalaran)	$2,50	$2,50	T/A	T/A
Gambar Gemini 2.5 Flash
	Input (teks, gambar)***	$0,30	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$2,50	T/A	T/A	T/A
	Output gambar***	$30	T/A	T/A	T/A
Gemini 2.5 Flash Live API
	1 juta token teks input	$0,5	$0,5	T/A	T/A
	1 juta token audio input	$3	$3	T/A	T/A
	1 juta token video/gambar input	$3	$3	T/A	T/A
	1 juta token teks output	$2	$2	T/A	T/A
	1 juta token audio output	$12	$12	T/A	T/A
Gemini 2.5 Flash Lite
	Input (teks, gambar, video)	$0,10	$0,10	$0,01	$0,01
	Input Audio	$0,30	$0,30	$0,03	$0,03
	Output teks (respons dan penalaran)	$0,40	$0,40	T/A	T/A

Prioritas

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input dengan Prioritas	Harga (/1 juta token) > 200 ribu token input dengan Prioritas	Harga (per 1 juta token) <= 200 ribu token input yang di-cache dengan Prioritas	Harga (/1 juta token) > 200 ribu token input yang di-cache dengan Prioritas
Gemini 2.5 Pro
	Input (teks, gambar, video, audio)	$2,25	$4,50	$0,23	$0,45
	Output teks (respons dan penalaran)	$18	$27	T/A	T/A
Gemini 2.5 Pro Penggunaan Komputer-Pratinjau
	Input (teks, gambar, video, audio)	T/A	T/A	T/A	T/A
	Output teks (respons dan penalaran)	T/A	T/A	T/A	T/A
Gemini 2.5 Flash
	Input (teks, gambar, video)	$0,54	$0,54	$0,05	$0,05
	Input Audio	$1,80	$1,80	$0,18	$0,18
	Output teks (respons dan penalaran)	$4,50	$4,50	T/A	T/A
Gambar Gemini 2.5 Flash
	Input (teks, gambar)***	T/A	T/A	T/A	T/A
	Output teks (respons dan penalaran)	T/A	T/A	T/A	T/A
	Output gambar***	T/A	T/A	T/A	T/A
Gemini 2.5 Flash Live API
	1 juta token teks input	T/A	T/A	T/A	T/A
	1 juta token audio input	T/A	T/A	T/A	T/A
	1 juta token video/gambar input	T/A	T/A	T/A	T/A
	1 juta token teks output	T/A	T/A	T/A	T/A
	1 juta token audio output	T/A	T/A	T/A	T/A
Gemini 2.5 Flash Lite
	Input (teks, gambar, video)	$0,18	$0,18	$0,02	$0,02
	Input Audio	$0,54	$0,54	$0,05	$0,05
	Output teks (respons dan penalaran)	$0,72	$0,72	T/A	T/A

Flex/Batch

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input dengan Flex/Batch	Harga (/1 juta token) > 200 ribu token input dengan Flex/Batch
Gemini 2.5 Pro
	Input (teks, gambar, video, audio)	$0,625	$1.25
	Output teks (respons dan penalaran)	$5	$7,5
Gemini 2.5 Pro Penggunaan Komputer-Pratinjau
	Input (teks, gambar, video, audio)	T/A	T/A
	Output teks (respons dan penalaran)	T/A	T/A
Gemini 2.5 Flash
	Input (teks, gambar, video)	$0,15	$0,15
	Input Audio	$0,5	$0,5
	Output teks (respons dan penalaran)	$1.25	$1.25

Gambar Gemini 2.5 Flash
	Input (teks, gambar, video)***	$0,15	T/A
	Output teks (respons dan penalaran)	$1.25	T/A
	Output gambar***	$15	T/A
Gemini 2.5 Flash Live API
	1 juta token teks input	T/A	T/A
	1 juta token audio input	T/A	T/A
	1 juta token video/gambar input	T/A	T/A
	1 juta token teks output	T/A	T/A
	1 juta token audio output	T/A	T/A
Gemini 2.5 Flash Lite
	Input (teks, gambar, video)	$0,05	$0,05
	Input Audio	$0,15	$0,15
	Output teks (respons dan penalaran)	$0,2	$0,2

Fitur	Harga
Grounding dengan Google Penelusuran	Gemini 2.0 Flash, 2.5 Flash,dan 2.5 Flash-Lite mencakup gabungan 1.500 perintah yang dirujukkan per hari tanpa biaya tambahan. Gemini 2.5 Pro mencakup 10.000 perintah yang dirujukkan per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah grounding adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran&ast;&ast;. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan**. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.
Grounding dengan data Anda	$2,5 per 1.000 permintaan.
Grounding dengan Google Maps	$25 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps.

* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
** Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
*** Gambar 1024x1024 menggunakan 1.290 token ($0,039 per 1.000 gambar output). Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
**** Penagihan Penggunaan Komputer menggunakan SKU Gemini 2.5 Pro, untuk memisahkan biaya Penggunaan Komputer, terapkan tag penagihan. Lihat selengkapnya di sini.

Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
Mode Audio Proaktif: Jika diaktifkan, token input akan dikenai biaya saat LiveAPI mendengarkan. Token output hanya dikenai biaya saat API merespons.
Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

Gemini 2.0

Gemini 2.0 ditagih berdasarkan token. Untuk menghitung jumlah token input dalam permintaan Anda sebelum mengirim permintaan, Anda dapat menggunakan tokenizer SDK atau countTokens API. Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

Gunakan tombol di tabel harga untuk membandingkan harga berbasis token dan harga berbasis modalitas.

Harga berbasis token

Model	Jenis	Harga	Harga dengan Batch API
Gemini 2.0 Flash
	1 juta token Input	$0,15	$0,075
	1 juta token audio Input	$1,00	$0,50
	1 juta token teks Output	$0,60	$0,30
	Penyesuaian untuk 1 juta token pelatihan	$3,00
Pembuatan Gambar Gemini 2.0 Flash
	1 juta token input	$0,15
	1 juta token audio input	$1,00
	1 juta token video input	$3
	1 juta token teks output	$0,60
	1 juta token gambar output	$30,00
Gemini 2.0 Flash Live API
	1 juta token teks input	$0,5
	1 juta token audio input	$3
	1 juta token video/gambar input	$3
	1 juta token teks output	$2
	1 juta token audio output	$12
Gemini 2.0 Flash Lite
	1 juta token Input	$0,075	$0,0375
	1 juta token audio Input	$0,075	$0,0375
	1 juta token teks Output	$0,30	$0,15
	Penyesuaian untuk 1 juta token pelatihan	$1,00
Grounding dengan Google Penelusuran	Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujukkan per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.
Grounding dengan data Anda	$2,5 per 1.000 permintaan mulai 16 Juni 2025.
Grounding dengan Google Maps	Model Gemini mencakup sejumlah perintah perujukan harian tanpa biaya tambahan: Gemini Flash dan Flash-Lite: gabungan 1.500 perintah yang dirujuk per hari. Gemini Pro: 10.000 perintah yang dirujuk per hari. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $25 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

Harga berbasis modalitas

Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.

Untuk gambar 1024x1024, gambar tersebut menggunakan 1.290 token. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.

Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.

Input audio menggunakan 25 token per detik tanpa stempel waktu.

Model	Jenis	Harga	Harga dengan Batch API
Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,0375	$0,01875
	Gambar input ($/gambar)	$0,0001935	$0,00009675
	Video input ($/dtk)	$0,0000387	$0,00001935
	Input audio ($/detik)	$0,000025	$0,0000125
	Teks output ($/juta karakter)	$0,15	$0,075
Pembuatan Gambar Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,0375
	Gambar input ($/gambar)	$0,0001935
	Video input ($/dtk)	$0,0000387
	Input audio ($/detik)	$0,000025
	Teks output ($/juta karakter)	$0,15
	Gambar output gambar ($/gambar)	$0,04
Gemini 2.0 Flash Lite
	Teks input ($/juta karakter)	$0,01875	$0,009375
	Gambar input ($/gambar)	$0,00009675	$0,000048375
	Video input ($/dtk)	$0,00001935	$0,000009675
	Input audio ($/detik)	$0,000001875	$0,000000938
	Teks output ($/juta karakter)	$0,075	$0,0375
Grounding dengan Google Penelusuran	Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujukkan per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
* Gemini 2.0 Flash Live API: 25 token per detik audio (input/output), 258 token per detik video (input). Grounding dengan Google Penelusuran tetap gratis selama Gemini 2.0 Flash Live API dalam Pratinjau.

Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

Gemma

Model	Harga
Gemma 4 26B	Input: $0,15 / juta token Output: $0,60 / juta token Cache Hit: $0,015 / juta token

Harga Pengoptimal Model Agent Platform (Eksperimental)*

Pengoptimal Model Platform Agen menyederhanakan penggunaan Gemini untuk pelanggan perusahaan dengan menyediakan satu meta-endpoint untuk permintaan model Gemini. Pelanggan yang menggunakan layanan ini tidak perlu menentukan apakah akan menggunakan Flash, Pro, atau versi tertentu. Sebagai gantinya, mereka cukup memberikan setelan yang dapat dikonfigurasi (biaya, kualitas, atau keseimbangan) untuk menunjukkan preferensi mereka, dan Model Optimizer menerapkan tingkat kecerdasan yang tepat dan sesuai untuk tugas tersebut dengan mengirimkan setiap kueri ke model yang paling cocok.

Pengoptimal Model Platform Agen menerapkan harga dinamis. Artinya, harga rata-rata per token bergantung pada tingkat kecerdasan model yang diterapkan untuk menyelesaikan tugas. Oleh karena itu, contoh harga disediakan di bawah untuk mengilustrasikan kemungkinan skenario berdasarkan setelan konfigurasi Anda (lihat tabel di bawah). SKU Model Optimizer adalah SKU $1 yang berfungsi sebagai unit pembelian untuk diterapkan pada penagihan Anda. Anda tetap akan ditagih berdasarkan konsumsi setelah menggunakan model.

Rasio I/O 5:1	Contoh 1 bot chat	CATATAN: rentang ini bukan jaminan, hasil pelanggan individu dapat bervariasi
Preferensi Pelanggan	Token Input Pelanggan Dikirim ke MO	Token Output Pelanggan Dikirim ke MO	Harga Input Rata-Rata per Juta Token (Rentang Tinggi)	Harga Output Rata-Rata per Juta Token (Rentang Tinggi)	Harga Input Rata-Rata per Juta Token (Rentang Rendah)	Harga Output Rata-Rata per Juta Token (Rentang Rendah)
Biaya	10.000.000	2.000.000	$0,63	$2,50	$0,16	$0,63
Seimbang	10.000.000	2.000.000	$1,26	$5,00	$0,63	$2,50
Kualitas	10.000.000	2.000.000	$1,89	$7,50	$1,26	$5,00

Rasio I/O 1:20	Contoh 2 Pembuatan konten
Preferensi Pelanggan	Token Input Pelanggan Dikirim ke MO	Token Output Pelanggan Dikirim ke MO	Harga Input Rata-Rata per Juta Token (Rentang Tinggi)	Harga Output Rata-Rata per Juta Token (Rentang Tinggi)	Harga Input Rata-Rata per Juta Token (Rentang Rendah)	Harga Output Rata-Rata per Juta Token (Rentang Rendah)
Biaya	1.000.000	20.000.000	$0,63	$2,50	$0,16	$0,63
Seimbang	1.000.000	20.000.000	$1,26	$5,00	$0,63	$2,50
Kualitas	1.000.000	20.000.000	$1,89	$7,50	$1,26	$5,00

* Model Optimizer adalah penawaran eksperimental berbayar, dan dapat merutekan permintaan ke versi eksperimental Gemini di Agent Platform.

Model Gemini lainnya

Semua model Gemini selain Gemini 2.0 atau Gemini 2.5 ditagih berdasarkan modalitas seperti karakter, gambar, detik video/audio. Input teks dikenai biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input media dikenai biaya per gambar atau per detik (video). Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

Model	Fitur	Jenis	Harga ( =< 128 ribu token input)	Harga ( > 128 ribu token input)
Gemini 1.5 Flash	Multimodal	Input Gambar Input Video Input Teks Input Audio	$0,00002 / gambar $0,00002 / detik $0,00001875 / 1.000 karakter $0,000002 / detik	$0,00004 / gambar $0,00004 / detik $0,0000375 / 1.000 karakter $0,000004 / detik
		Output Teks	$0,000075 / 1.000 karakter	$0,00015 / 1.000 karakter
	Penyesuaian*	Token Pelatihan	$8 / 1 juta token
Gemini 1.5 Pro	Multimodal	Input Gambar Input Video Input Teks Input Audio	$0,00032875 / gambar $0,00032875 / detik $0,0003125 / 1.000 karakter $0,00003125 / detik	$0,0006575 / gambar $0,0006575 / detik $0,000625 / 1 ribu karakter $0,0000625 / detik
		Output Teks	$0,00125 / 1.000 karakter	$0,0025 / 1.000 karakter
	Penyesuaian*	Token Pelatihan	$80 / 1 juta token
Gemini 1.0 Pro	Multimodal	Input Gambar Input Video Input Teks	$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter
Gemini 1.0 Pro		Output Teks	$0,000375 / 1.000 karakter
Grounding dengan Google Penelusuran	Teks	$35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	Teks	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda	Teks	$2,5 per 1.000 permintaan mulai 16 Juni 2025.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya dengan tarif konteks panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.

Imagen

Dengan Imagen di Platform Agen, Anda dapat membuat gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.

Model	Fitur	Deskripsi	Input	Output	Harga
Imagen 4 Ultra	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,06 per gambar
Imagen 4	Peningkatan resolusi	Meningkatkan resolusi gambar yang dihasilkan menjadi 2K, 3K, dan 4K	Gambar	Gambar	$0,06 per gambar
Imagen 4	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,04 per gambar
Imagen 4 Fast	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,02 per gambar
Imagen 3	Pembuatan gambar	Buat gambar Edit gambar Sesuaikan gambar	Perintah teks	Gambar	$0,04 per gambar
Imagen 3 Fast	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,02 per gambar
Imagen 2, Imagen 1	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,020 per gambar
Imagen 2, Imagen 1	Pengeditan gambar	Mengedit gambar menggunakan pendekatan mask atau tanpa mask	Perintah Gambar/Teks	Gambar	$0,020 per gambar
Imagen 1	Peningkatan resolusi	Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k	Gambar	Gambar	$0,003 per gambar
Imagen 1	Fine tuning	Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam perintah Imagen (pelatihan beberapa pengambilan gambar)	Subjek dengan ID teks dan 4-8 gambar per subjek	Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna)	$ per jam kerja node (harga pelatihan kustom Platform Agen)
Imagen	Teks Keterangan Visual	Membuat teks singkat atau panjang untuk gambar	Gambar	Teks keterangan	$0,0015/gambar
Imagen	Tanya Jawab Visual	Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar	Perintah Gambar/Teks	Jawaban teks	$0,0015/gambar
Imagen	Rekontekstualisasi Produk	Membayangkan kembali produk dalam adegan baru	1-3 Gambar produk yang sama dan perintah teks yang menjelaskan adegan yang diinginkan	Gambar	$0,12 per gambar
	Coba dengan AR	Buat gambar orang yang mengenakan pakaian berbeda	1 gambar orang dan 1 gambar pakaian	Gambar	$0,06 per gambar

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Veo

Veo membuat video berkualitas sangat tinggi dalam berbagai subjek dan gaya, dengan pemahaman yang lebih baik tentang fisika dunia nyata serta nuansa gerakan dan ekspresi manusia.

Model	Fitur	Deskripsi	Input	Output	Resolusi Output	Harga
Veo 3.1	Pembuatan Video + Audio	Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,40/detik
	Pembuatan Video + Audio		Perintah Teks/Gambar	Video + Audio	4.000	$0,60/detik
	Pembuatan video	Buat video berkualitas tinggi dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p, 1080p	$0,20/detik
	Pembuatan video		Perintah Teks/Gambar	Video	4.000	$0,40/detik
Veo 3.1 Fast	Pembuatan Video + Audio	Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video + Audio	720p	$0,10/detik
					1080p	$0,12/detik
					4.000	$0,30/detik
	Pembuatan video	Buat video dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video	720p	$0,08/detik
					1080p	$0,10/detik
					4.000	$0,25/detik
Veo 3.1 Lite	Pembuatan Video + Audio	Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan cepat	Perintah Teks/Gambar	Video + Audio	720p	$0,05/detik
	Pembuatan Video + Audio		Perintah Teks/Gambar	Video + Audio	1080p	$0,08/detik
	Pembuatan video	Buat video dari perintah teks atau gambar referensi dengan cepat	Perintah Teks/Gambar	Video	720p	$0,03/detik
	Pembuatan video		Perintah Teks/Gambar	Video	1080p	$0,05/detik
Veo 3	Pembuatan Video + Audio	Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,40/detik
Veo 3	Pembuatan video	Buat video berkualitas tinggi dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p, 1080p	$0,20/detik
Veo 3 Fast	Pembuatan Video + Audio	Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video + Audio	720p	$0,10/detik
	Pembuatan Video + Audio		Perintah Teks/Gambar	Video + Audio	1080p	$0,12/detik
	Pembuatan video	Buat video dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video	720p	$0,08/detik
	Pembuatan video		Perintah Teks/Gambar	Video	1080p	$0,10/detik
Veo 2	Pembuatan video	Buat video dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p	$0,50/detik
Veo 2	Kontrol Lanjutan	Buat video melalui interpolasi frame awal dan akhir, perpanjang video yang dibuat, dan terapkan kontrol kamera	Perintah Teks/Gambar/Video	Video	720p	$0,50/detik

Lyria

Rangkaian model Lyria menawarkan pembuatan musik berkualitas tinggi yang ideal untuk komposisi canggih dan eksplorasi kreatif mendetail yang memerlukan output bernuansa.

Model	Fitur	Deskripsi	Input	Output	Harga
Lyria 3 Pro	Pembuatan musik lagu lengkap	Lyria 3 Pro membuat komposisi musik lengkap dari input multimodal seperti teks atau gambar	Teks, Gambar	Lagu lengkap	$0,08 per lagu penuh hingga 3 menit
Lyria 3	Pembuatan klip musik 30 detik	Lyria 3 menghasilkan klip audio 30 detik fidelitas tinggi dari perintah teks atau gambar	Teks, Gambar	Klip musik 30 detik	$0,04 per lagu 30 detik
Lyria 2	Pembuatan musik	Membuat musik dari perintah teks	Perintah teks	Musik	$0,06 per 30 detik

Memahami biaya embedding untuk aplikasi AI Anda

Model	Jenis	Region	Harga per 1.000 token input
Gemini Embedding	Input	Global	Permintaan online: $0,00015 Permintaan batch: $0,00012
Gemini Embedding	Output	Global	Permintaan online: Tanpa biaya Permintaan batch: Tanpa biaya

Model	Jenis	Region	Harga per 1.000 karakter
Embedding untuk Teks (Tidak termasuk Gemini Embedding)	Input	Global	Permintaan online: $0,000025 Permintaan batch: $0,00002
Embedding untuk Teks (Tidak termasuk Gemini Embedding)	Output	Global	Permintaan online: Tanpa biaya Permintaan batch: Tanpa biaya

Embedding Multimodal

Model	Jenis	Deskripsi	Harga
Gemini Embedding 2 (Multimodal Terpadu, Pratinjau)	Teks input ($/1 juta token)	Membuat embedding menggunakan teks sebagai input	$0,2
	Gambar input ($/gambar)	Membuat embedding menggunakan gambar sebagai input	$0,00012
	Video input ($/per frame)	Membuat embedding menggunakan video sebagai input	$0,00079
	Input audio ($/detik)	Membuat embedding menggunakan audio sebagai input	$0,00016

*Tidak ada biaya untuk token output.

Model	Fitur	Deskripsi	Input	Output	Harga
multimodalembedding	Embedding untuk Multimodal: Teks	Membuat embedding menggunakan teks sebagai input	Teks	Embedding	$0,0002 / 1.000 input karakter
	Embedding untuk Multimodal: Gambar	Membuat embedding menggunakan gambar sebagai input	Gambar	Embedding	$0,0001 / input gambar
	Embeddings for Multimodal: Video Plus	Video Plus	Video	Embedding (hingga 15 embedding per menit video)	$0,0020 per detik video
	Embeddings for Multimodal: Video Standard	Video Standar	Video	Embeddings (hingga 8 embeddings per menit video)	$0,0010 per detik video
	Embedding untuk Multimodal: Video Penting	Video Essential	Video	Embedding (hingga 4 embedding per menit video)	$0,0005 per detik video

Model Open Source	Jenis	Harga per 1.000 token input
multilingual-e5-small	Input: Output: Input Batch: Output Batch:	Permintaan online: $0,000015 Permintaan online: Tanpa biaya Permintaan batch: $0,0000075 Permintaan batch: Tanpa biaya
multilingual-e5-large	Input: Output: Input Batch: Output Batch:	Permintaan online: $0,000025 Permintaan online: Tanpa biaya Permintaan batch: $0,0000125 Permintaan batch: Tanpa biaya

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Harga untuk penyelesaian kode Agent Platform

AI Generatif di Agent Platform mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.

Model	Jenis	Region	Harga per 1.000 karakter
Codey untuk Penyelesaian kode	Input	Global	Permintaan online: $0,00025
Codey untuk Penyelesaian kode	Output	Global	Permintaan online: $0,0005

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Terjemahan (Teks)

Menggunakan Agent Platform API dan LLM Terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar seperti manusia dibandingkan model terjemahan klasik, tetapi dukungan bahasanya lebih terbatas (Pelajari Lebih Lanjut).

Model	Metode	Penggunaan	Harga per juta karakter
LLM	Terjemahan teks^*	Jumlah karakter input per bulan	$10 per juta karakter^*
	Terjemahan teks^*	Jumlah karakter output per bulan	$10 per juta karakter^*
	LLM Terjemahan 002	Terjemahan teks^*	Jumlah karakter input per bulan	$20 per juta karakter^*
Jumlah karakter output per bulan		Terjemahan teks^*	$20 per juta karakter^*

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
^*Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya

Harga Penyimpanan Cache Konteks untuk Explicit Caching

Model	Fitur	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Gemini 3.1 Pro	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$4,5 (/Juta Token/jam)	$4,5 (/Juta Token/jam)
Gemini 3 Flash	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)
Gemini 3.1 Flash Lite	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)
Gemini 3 Pro	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$4,5 (/Juta Token/jam)	$4,5 (/Juta Token/jam)
Gemini 2.5 Pro	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$4,5 (/Juta Token/jam)	$4,5 (/Juta Token/jam)
Gemini 2.5 Flash	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)
Gemini 2.5 Flash Lite	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)

Model Gemini 2.0

Harga berbasis token

Model	Jenis	Penyimpanan (juta token-jam)	Harga
Gemini 2.0 Flash
	1 juta token Input	$1,00	$0,0375
	1 juta token audio Input	$1,00	$0,25
	1 juta token teks Output	NA	NA
Gemini 2.0 Flash Lite
	1 juta token Input	$1,00	$0,01875
	1 juta token audio Input	$1,00	$0,01875
	1 juta token teks Output	NA	NA

Harga berbasis modalitas

Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.

Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.

Input audio menggunakan 25 token per detik tanpa stempel waktu.

Model	Jenis	Penyimpanan (Jam Modalitas)	Harga
Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,25	$0,009375
	Gambar input ($/gambar)	$0,00129	$0,000048375
	Video input ($/dtk)	$0,000258	$0,000009675
	Input audio ($/detik)	$0,000025	$0,00000625
	Teks output ($/juta karakter)	NA	NA
Gemini 2.0 Flash Lite
	Teks input ($/juta karakter)	$0,25	$0,0046875
	Gambar input ($/gambar)	$0,00129	$0,0000241875
	Video input ($/dtk)	$0,000258	$0,000009675
	Input audio ($/detik)	$0,000258	$0,0000048375
	Teks output ($/juta karakter)	NA	NA
Grounding dengan Google Penelusuran	Gemini 2.0 Flash mencakup hingga 1.500 permintaan yang dirujukkan per hari tanpa biaya tambahan. Permintaan yang dirujuk melebihi 1.500 per hari akan ditagih sebesar $35 per 1.000 permintaan (hingga 1 juta permintaan per hari). Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.
Grounding Web untuk perusahaan	$45 per 1.000 permintaan (hingga 1 juta permintaan per hari) mulai 5 Mei 2025. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari. Pelanggan dapat memutuskan untuk tidak menampilkan Saran Penelusuran dengan Hasil yang Di-grounding di antarmuka Aplikasi Pelanggan mereka; namun, hal ini tunduk pada harga alternatif. Hubungi tim Akun Google Cloud Anda untuk meminta pengecualian ini.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran hanya ditagih untuk permintaan yang menampilkan hasil yang berisi setidaknya satu URL dukungan perujukan dari web. Biaya penggunaan model Gemini standar juga berlaku.

Throughput yang Disediakan

Throughput yang disediakan memastikan throughput untuk kebutuhan AI generatif Anda dan ditransaksikan melalui unit skala AI generatif, atau GSU. Pelajari lebih lanjut jumlah throughput yang disediakan setiap GSU di sini dan gunakan alat estimasi online kami di sini.

Durasi	Harga per GSU	Per
Komitmen 1 minggu	$1.200 (Global) $1.320 (Non-Global)*	Minggu
Komitmen 1 bulan	$2.700 (Global) $2.970 (Non-Global)*	Bulan
Komitmen 3 bulan	$2.400 (Global) $2.640 (Non-Global)*	Bulan
Komitmen 1 tahun	$2.000 (Global) $2.200 (Non-Global)*	Bulan

Contoh penghitungan biaya

Seorang pengguna perlu memastikan bahwa mereka dapat mendukung 10 kueri per detik (QPS) dari kueri dengan input 1.000 token teks dan 500 token audio serta menerima output 300 token teks menggunakan gemini-2.0-flash.

Menggunakan tabel throughput dan laju penurunan, untuk gemini-2.0-flash, kita tahu laju penurunan token teks input adalah 1 token, laju penurunan token audio input adalah 7 token, dan laju penurunan token teks output adalah 4 token.

Total token input pengguna adalah 1.000* (1 token per token teks input) + 500* (7 token per token audio input) = 4.500 token input yang disesuaikan dengan burndown. Total token output pengguna adalah 300* (4 token per token teks output) = 1.200 token output yang disesuaikan dengan burndown. Jika dijumlahkan, kita mendapatkan 4.500 token input yang disesuaikan dengan burndown + 1.200 token output yang disesuaikan dengan burndown = 5.700 total token per kueri.

Dengan mengalikan total token per kueri dengan QPS, kita mendapatkan 5.700 total token per kueri * 10 QPS = 57.000 total token per detik.

Dengan membagi angka ini dengan total throughput per detik per GSU,kita mendapatkan 57.000 total token per detik ÷ 3.360 throughput per detik per GSU = 16,96 GSU. Peningkatan pembelian GSU minimum untuk model ini adalah 1, sehingga pengguna memerlukan 17 GSU.

Jika pengguna ingin mempertahankan throughput ini selama 1 minggu, biayanya adalah $1.200 * 17 GSU = $20.400 per minggu. Jika mereka ingin mempertahankan throughput ini selama 1 bulan, biayanya adalah $2.700 * 17 GSU = $45.900 per bulan. Jika mereka ingin mempertahankan throughput ini selama 3 bulan, biayanya adalah $2.400 * 17 GSU = $40.800 per bulan. Terakhir, jika mereka ingin mempertahankan throughput ini selama 1 tahun, biayanya adalah $2.000 * 17 GSU = $34.000 per bulan.

Penyesuaian Model

Penyesuaian model adalah cara efektif untuk menyesuaikan model besar dengan tugas Anda. Langkah ini penting untuk meningkatkan kualitas dan efisiensi model. Penyesuaian model memberikan manfaat berikut:

Kualitas lebih tinggi untuk tugas spesifik Anda
Peningkatan ketahanan model
Latensi dan biaya inferensi lebih rendah karena perintah yang lebih pendek

Penyesuaian dikenakan biaya per juta token pelatihan. Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda. Mulai dari Gemini 3, harga prediksi endpoint model yang disesuaikan akan menjadi 1,5 kali lipat harga model dasar. Harga prediksi model Gemini lama (Gemini 2.5 dan sebelumnya) tetap sama dengan model dasar.

Model	Jenis	Harga (/1 juta token pelatihan)
Gemini 3.1 Flash Lite	Supervised fine-tuning	$3
Gemini 2.5 Pro	Supervised fine-tuning	$25
Gemini 2.5 Flash	Supervised fine-tuning Penyesuaian preferensi	$5
Gemini 2.5 Flash Lite	Supervised fine-tuning Penyesuaian preferensi	$1,5
Gemma 3 1B IT	Supervised fine-tuning	$0,47
Gemma 3 4B IT	Supervised fine-tuning	$1,14
Gemma 3 12B IT	Supervised fine-tuning	$1,82
Gemma 3 27B IT	Supervised fine-tuning	$6,83
Medgemma 1.5 4B IT	Supervised fine-tuning	$1,14
Llama 3.1 8B	Supervised fine-tuning	$0,67
Llama 3.2 1B	Supervised fine-tuning	$0,28
Llama 3.2 3B	Supervised fine-tuning	$0,61
Llama 3.3 70B	Supervised fine-tuning	$6,72
Llama 4 Scout 17B 16E	Supervised fine-tuning	$5,77
Qwen 3 4B	Supervised fine-tuning	$1,35
Qwen 3 8B	Supervised fine-tuning	$4,18
Qwen 3 14B	Supervised fine-tuning	$8,46
Qwen 3 32B	Supervised fine-tuning	$6,57

* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* Untuk inferensi model yang dimulai dari Gemini 3, harga prediksi endpoint model yang disesuaikan akan menjadi 1,5 kali lipat harga model dasar. Harga prediksi model Gemini lama tetap sama dengan model dasar.

Kasus Khusus Pengisian Daya Berdasarkan Karakter

Model	Jenis	Harga (/1 juta karakter pelatihan)
LLM Terjemahan 002	Supervised fine-tuning	$6,25

Membandingkan harga model partner di Platform Agen

Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi lebih lanjut, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.

Model Claude dari Anthropic

Model dengan harga regional

Global

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.8	Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25	Input: $5,00 Output: $25,00 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50
Claude Opus 4.7	Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25	Input: $5,00 Output: $25,00 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50
Claude Opus 4.6	Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25	Input: $5,00 Output: $25,00 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50
Claude Opus 4.5	Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25
Claude Sonnet 4.6	Input: $3,00 Output: $15,00 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch 5 mnt: $1,88 Penulisan Cache Batch 1 jam: $3,00 Cache Hit Batch: $0,15	Input: $3,00 Output: $15,00 5m Cache Write: $3,75 1h Cache Write: $6,00 Cache Hit: $0,30
Claude Sonnet 4.5	Input: $3,00 Output: $15,00 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch 5 mnt: $1,88 Penulisan Cache Batch 1 jam: $3,00 Cache Hit Batch: $0,15	Input: $6,00 Output: $22,50 Penulisan Cache 5 menit: $7,50 Penulisan Cache 1 jam: $12,00 Cache Hit: $0,60
Claude Haiku 4.5	Input: $1,00 Output: $5,00 Input Batch: $0,50 Output Batch: $2,50 Penulisan Cache 5 menit: $1,25 Penulisan Cache 1 jam: $2,00 Cache Hit: $0,10 Penulisan Cache Batch 5 menit: $0,625 Penulisan Cache Batch 1 jam: $1,00 Cache Hit Batch: $0,05

Multi-Region AS (us)

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.8	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55
Claude Opus 4.7	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55

Multi-Region Uni Eropa (eu)

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.8	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55
Claude Opus 4.7	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55

us-east5

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.6	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.6	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17 Input: $6,60 Output: $24,75 Penulisan Cache 5 mnt: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66	Input: $3,30 Output: $16,50 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Penulisan Cache 5 mnt: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 mnt: $1,375 Penulisan Cache 1 jam: $2,20 Penulisan Cache: $1,375 Cache Hit: $0,11 Penulisan Cache Batch 5 mnt: $0,688 Penulisan Cache Batch 1 jam: $1,10 Cache Hit Batch: $0,055

europe-west1

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.6	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.6	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17	Input: $3,30 Output: $16,50 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Penulisan Cache 5 mnt: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 mnt: $1,375 Penulisan Cache 1 jam: $2,20 Cache Hit: $0,11 Penulisan Cache Batch 5 mnt: $0,688 Penulisan Cache Batch 1 jam: $1,10 Cache Hit Batch: $0,055

asia-southeast1

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.6	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275	Input: $5,50 Output: $27,50 5 m Penulisan Cache: $6,875 1 jam Penulisan Cache: $11,00 Cache Hit: $0,55
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.6	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17	Input: $3,30 Output: $16,50 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 mnt: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch 5 mnt: $2,06 Penulisan Cache Batch 1 jam: $3,30 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Penulisan Cache 5 mnt: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66

asia-east1

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 mnt: $1,375 Penulisan Cache 1 jam: $2,20 Cache Hit: $0,11 Penulisan Cache Batch 5 mnt: $0,688 Penulisan Cache Batch 1 jam: $1,10 Cache Hit Batch: $0,055

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Model dengan harga seragam di semua region

Model	Harga (/1 juta token) =< 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Claude Opus 4.1	Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 menit: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch 5 menit: $9,375 Penulisan Cache Batch 1 jam: $15,00 Cache Hit Batch: $0,75	T/A
Claude Opus 4 (Tidak Digunakan Lagi)	Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 menit: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch 5 menit: $9,375 Penulisan Cache Batch 1 jam: $15,00 Cache Hit Batch: $0,75	T/A
Claude Sonnet 4 (Tidak Digunakan Lagi)	Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch 5 mnt: $1,875 Penulisan Cache Batch 1 jam: $3,00 Cache Hit Batch: $0,15
Claude 3 Haiku (Tidak Digunakan Lagi)	Input: $0,25 Output: $1,25 5m Cache Write: $0,30 1h Cache Write: $0,50 Cache Hit: $0,03	T/A
Claude 3.5 Haiku (Tidak Digunakan Lagi)	Input: $0,80 Output: $4 Input Batch: $0,40 Output Batch: $2 Penulisan Cache 5 m: $1 Penulisan Cache 1 jam: $1,60 Cache Hit: $0,08 Penulisan Cache Batch: $0,50 Cache Hit Batch: $0,04	T/A
Claude 3.7 Sonnet (Tidak Digunakan Lagi)	Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Cache Write: $3,75 Cache Hit: $0,30 Cache Write Batch: $1,875 Cache Hit Batch: $0,15	T/A

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Harga untuk alat

Alat	Harga
Permintaan Penelusuran Web	$10 per 1.000 penelusuran Model yang Didukung: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4.6, Claude Sonnet 4, Claude Opus 4.1, Claude Opus 4, Claude Opus 4.5, dan Claude Opus 4.6.

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Model Grok xAI

Model	Harga
Penalaran Grok 4.20	Input: $1,25 / juta token Output: $2,50 / juta token Cache Hit: $0,20 / juta token
Grok 4.20 Non-Reasoning	Input: $1,25 / juta token Output: $2,50 / juta token Cache Hit: $0,20 / juta token
Penalaran Cepat Grok 4.1	Input: $0,20 / juta token Output: $0,50 / juta token Cache Hit: $0,05 / juta token
Grok 4.1 Fast Non-Reasoning	Input: $0,20 / juta token Output: $0,50 / juta token Cache Hit: $0,05 / juta token

Model Deepseek

Model	Harga
DeepSeek-V3.1	Input: $0,60 / juta token Output: $1,70 / juta token Cache Hit: $0,06 / juta token Input Batch: $0,30 / juta token Output Batch: $0,85 / juta token
DeepSeek-V3.2	Input: $0,56 / juta token Output: $1,68 / juta token Cache Hit: $0,056 / juta token Input Batch: $0,28 / juta token Output Batch: $0,84 / juta token
DeepSeek-R1 (0528)	Input: $1,35 / juta token Output: $5,40 / juta token Input Batch: $0,675 / juta token Output Batch: $2,70 / juta token
DeepSeek-OCR	Input: $0,30 / juta token (atau $0,0003/halaman) Output: $1,20 / juta token (atau $0,00012/halaman)

Model MiniMax

Model	Harga
MiniMax-M2	Input: $0,30 / juta token Output: $1,20 / juta token Cache Hit: $0,03 / juta token

Model Moonshot

Model	Harga
Kimi-K2-Thinking	Input: $0,60 / juta token Output: $2,50 / juta token Cache Hit: $0,06 / juta token

Model Qwen

Model	Harga
Qwen3-Next-80B-Thinking	Input: $0,15 / juta token Output: $1,20 / juta token
Qwen3-Next-80B-Instruct	Input: $0,15 / juta token Output: $1,20 / juta token
Qwen3-Coder-480B-A35B-Instruct	Input: $0,22 / juta token Output: $1,80 / juta token Cache Hit: $0,022 / juta token Input Batch: $0,11 / juta token Output Batch: $0,90 / juta token
Qwen3-235B-A22B-Instruct-2507	Input: $0,22 / juta token Output: $0,88 / juta token Input Batch: $0,11 / juta token Output Batch: $0,44 / juta token

Model GLM

Model	Harga
GLM-4.7	Input: $0,60 / juta token Output: $2,20 / juta token
GLM-5 *	Input: $1 / juta token Output: $3,2 / juta token Cache Hit: $0,1 / juta token

Model OpenAI

Model	Harga
gpt-oss-120b	Input: $0,09 / juta token Output: $0,36 / juta token Input Batch: $0,045 / juta token Output Batch: $0,18 / juta token
gpt-oss-20b	Input: $0,07 / juta token Output: $0,25 / juta token Cache Hit: $0,007 / juta token Input Batch: $0,035 / juta token Output Batch: $0,125 / juta token

Model Llama dari Meta

Model	Harga
Llama 3.3 70B	Input: $0,72 / juta token Output: $0,72 / juta token Input Batch: $0,36 / juta token Output Batch: $0,36 / juta token
Llama 4 Scout	Input: $0,25 / juta token Output: $0,70 / juta token Input Batch: $0,125 / juta token Output Batch: $0,35 / juta token
Llama 4 Maverick	Input: $0,35 / juta token Output: $1,15 / juta token Input Batch: $0,175 / juta token Output Batch: $0,575 / juta token

Model Mistral AI

Model	Harga
Mistral OCR (25.05)	Input: $0,0005 / juta token (atau $0,0005/halaman) Output: $0,0005 / juta token (atau $0,0005/halaman)
Mistral Medium 3	Input: $0,40 / juta token Output: $2,00 / juta token
Mistral Small 3.1 (25.03)	Input: $0,10 / juta token Output: $0,30 / juta token
Codestral 2	Input: $0,30 / juta token Output: $0,90 / juta token

Meminta penawaran harga khusus

Dengan model harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

Hubungi bagian penjualan