Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Model Google

Vertex AI memiliki daftar model dasar yang terus bertambah, yang dapat Anda uji, deploy, dan sesuaikan untuk digunakan dalam aplikasi berbasis AI. Model dasar disesuaikan untuk kasus penggunaan tertentu dan ditawarkan dengan berbagai titik harga. Halaman ini merangkum model yang tersedia di berbagai API dan memberikan panduan tentang model yang akan dipilih berdasarkan kasus penggunaan.

Untuk mengetahui informasi selengkapnya tentang semua API dan model AI di Vertex AI, lihat Menjelajahi model AI di Model Garden.

Model Gemini

Tabel berikut merangkum model yang tersedia di Gemini API. Untuk informasi selengkapnya tentang detail API, lihat referensi Gemini API.

Untuk menjelajahi model di konsol Google Cloud, pilih kartu modelnya di Model Garden.

Model	Input	Output	Kasus penggunaan	Mencoba model
Gemini 2.0 Flash `gemini-2.0-flash`	Teks, Kode, Gambar, Audio, Video, Video dengan Audio, PDF	Teks, Audio (pratinjau pribadi), Gambar (pratinjau pribadi)	Model andalan untuk semua tugas harian. Performa keseluruhan yang kuat dan mendukung Live API streaming real-time.	Coba Gemini 2.0 Flash
Pratinjau Gemini 2.5 Pro `gemini-2.5-pro-preview-03-25`	Teks, Gambar, Video, Audio, PDF	Teks	Model Gemini penalaran paling canggih, terutama untuk pemahaman multimodal, coding, dan pengetahuan dunia.	Coba Pratinjau Gemini 2.5 Pro
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Teks, Gambar, Video, Audio, PDF	Teks	Penawaran hemat biaya kami untuk mendukung throughput tinggi.	Coba Gemini 2.0 Flash-Lite
Gemini 2.0 Flash Thinking `gemini-2.0-flash-thinking-exp-01-21`	Teks, Gambar	Teks	Memberikan kemampuan penalaran yang lebih kuat dan menyertakan proses pemikiran dalam respons.	Coba Gemini 2.0 Flash Thinking

Informasi berikut memberikan detail untuk setiap model Gemini.

Gemini 2.0 Flash

Generasi berikutnya dari model Gemini Flash kami. Gemini 2.0 Flash memberikan kecepatan dan dukungan yang unggul untuk berbagai fitur yang diperluas seperti streaming dua arah dengan Multimodal Live API, pembuatan respons multimodal, dan penggunaan alat bawaan.

Kemampuan

Kemampuan	Ketersediaan
Grounding dengan Google Penelusuran
Eksekusi kode
Penyesuaian
Petunjuk sistem	Lihat Menggunakan petunjuk sistem.
Pembuatan terkontrol
Throughput yang disediakan	Lihat Model yang didukung.
Prediksi batch
Panggilan fungsi

Spesifikasi

Spesifikasi	Nilai
Token input maks	1.048.576
Token output maks	8.192
Data pelatihan	Hingga Juni 2024

Pratinjau Gemini 2.5 Pro

Pratinjau Gemini 2.5 Pro adalah model terkuat kami untuk pemahaman multimodal, coding, dan pengetahuan dunia. Model ini memiliki jendela konteks panjang 1 juta. Pratinjau Gemini 2.5 Pro tersedia sebagai model pratinjau di Vertex AI dan merupakan jalur upgrade bagi pengguna 1.5 Pro yang menginginkan kualitas yang lebih baik, atau yang sangat tertarik dengan konteks dan kode yang panjang.

Kemampuan

Kemampuan	Ketersediaan
Grounding dengan Google Penelusuran
Eksekusi kode
Penyesuaian
Petunjuk sistem	Lihat Menggunakan petunjuk sistem.
Pembuatan terkontrol
Throughput yang disediakan	Lihat Model yang didukung.

Spesifikasi

Spesifikasi	Nilai
Token input maks	1.048.576
Token output maks	64.000
Data pelatihan	Hingga Januari 2025
Batas kuota	20 kueri per menit (QPM)

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite adalah model Flash tercepat dan paling hemat biaya. Mode ini memberikan kualitas dan kecepatan yang lebih baik.

Kemampuan

Kemampuan	Ketersediaan
Grounding dengan Google Penelusuran
Eksekusi kode
Penyesuaian
Petunjuk sistem	Lihat Menggunakan petunjuk sistem.
Pembuatan terkontrol
Throughput yang disediakan	Lihat Model yang didukung.
Prediksi batch
Panggilan fungsi

Spesifikasi

Spesifikasi	Nilai
Token input maks	1.048.576
Token output maks	8.192
Data pelatihan	Hingga Januari 2025

Model Flash Thinking Gemini 2.0

Gemini 2.0 Flash Thinking adalah model komputasi waktu pengujian eksperimental yang dilatih untuk menghasilkan "proses berpikir" yang dilakukan model sebagai bagian dari responsnya. Akibatnya, Flash Thinking mampu memiliki kemampuan penalaran yang lebih kuat dalam responsnya daripada model Gemini 2.0 Flash dasar. Untuk mengetahui informasi selengkapnya, lihat dokumentasi Flash Thinking Gemini 2.0

Kemampuan

Kemampuan	Ketersediaan
Grounding dengan Google Penelusuran
Penyesuaian
Petunjuk sistem	Lihat Menggunakan petunjuk sistem.
Pembuatan terkontrol
Throughput yang Disediakan	Lihat Model yang didukung.

Spesifikasi

Spesifikasi	Nilai
Token input maks	1.048.576
Token output maks	65,536
Data pelatihan	Hingga Mei 2024

Dukungan bahasa Gemini

Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:

Arab (ar), Bengali (bn), Bulgaria (bg), China sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)
Model Gemini 2.0 Flash, Gemini 1.5 Pro, dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:

Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

Model Gemma

Tabel berikut merangkum model Gemma.

Model	Input	Output	Kasus penggunaan	Mencoba model
Gemma 3 Detail model	Teks, Gambar	Teks	Model terbuka berukuran kecil dan ringan yang mendukung tugas pembuatan teks dan pemahaman gambar, termasuk penjawaban pertanyaan, peringkasan, dan penalaran. Dapat di-deploy di lingkungan dengan resource terbatas.	Coba Gemma 3
Gemma 2 Detail model	Teks	Teks	Model teks terbuka berukuran kecil dan ringan yang mendukung pembuatan, peringkasan, dan ekstraksi teks. Dapat di-deploy di lingkungan dengan resource terbatas.	Coba Gemma 2
Gemma Detail model	Teks	Teks	Model teks terbuka berukuran kecil dan ringan yang mendukung pembuatan, peringkasan, dan ekstraksi teks. Dapat di-deploy di lingkungan dengan resource terbatas.	Coba Gemma
CodeGemma Detail model	Teks, Kode, PDF	Teks	Kumpulan model kode terbuka yang ringan dan dibuat di atas Gemma. Terbaik untuk pembuatan dan penyelesaian kode.	Coba CodeGemma
PaliGemma 2 Detail model	Teks, Gambar	Teks	Model bahasa-visio (VLM) yang ringan. Paling cocok untuk tugas pemberian teks gambar serta tugas pertanyaan dan jawaban visual.	Coba PaliGemma 2
PaliGemma Detail model	Teks, Gambar	Teks	Model bahasa-visio (VLM) yang ringan. Paling cocok untuk tugas pemberian teks gambar serta tugas pertanyaan dan jawaban visual.	Coba PaliGemma
ShieldGemma 2 Detail model	Teks, Gambar	Teks	Model bahasa-visio (VLM) ringan yang memeriksa keamanan gambar sintetis dan alami untuk membantu Anda membuat set data dan model yang andal.	Coba ShieldGemma 2
TxGemma Detail model	Teks	Teks	Kumpulan model bahasa terbuka yang ringan untuk mempercepat pengembangan terapi. Paling cocok untuk tugas prediksi terapi, termasuk tugas klasifikasi, regresi, atau pembuatan, dan penalaran.	Coba TxGemma

Dukungan bahasa Gemma

Gemma dan Gemma 2 hanya mendukung bahasa Inggris. Gemma 3 memberikan dukungan multibahasa dalam lebih dari 140 bahasa.

Model penyematan

Tabel berikut meringkas model yang tersedia di Embeddings API.

Nama model	Deskripsi	Spesifikasi	Mencoba model
Embedding untuk teks (`text-embedding-004, text-embedding-005`) Detail model	Menampilkan embedding untuk input teks bahasa Inggris. Mendukung penyesuaian yang diawasi model Embedding untuk teks, khusus bahasa Inggris.	Input token maksimum: 2.048. Dimensi penyematan: `text-embedding-004, text-embedding-005`: <=768. Lainnya: 768.	Mencoba Embedding untuk teks
Embedding untuk teks multibahasa (`text-multilingual-embedding-002`) Detail model	Menampilkan embedding untuk input teks dari lebih dari 100 bahasa Mendukung penyesuaian yang diawasi model `text-multilingual-embedding-002`. Mendukung 100 bahasa.	Input token maksimum: 2.048. Dimensi penyematan: `text-multilingual-embedding-002`: <=768. Lainnya: 768.	Mencoba Penyematan untuk teks multibahasa
Embedding untuk multimodal `(multimodalembedding)` Detail model	Menampilkan embedding untuk input teks, gambar, dan video, untuk membandingkan konten di berbagai model. Mengonversi teks, gambar, dan video menjadi ruang vektor yang sama. Video hanya mendukung 1.408 dimensi. Khusus bahasa Inggris	Input token maksimum: 32. Ukuran gambar maksimum: 20 MB. Durasi video maksimum: Dua menit. Dimensi penyematan: 128, 256, 512, atau 1408 untuk input teks+gambar, 1408 untuk input video.	Mencoba Embedding untuk multimodal
Penyematan untuk teks (Inggris, multibahasa, Kode) (`text-embedding-large-exp-03-07`) Detail model	Menampilkan embedding untuk input teks dalam lebih dari 100 bahasa, serta kode Python dan Java. Model ini bersifat eksperimental. Model eksperimental tidak mengikuti skema pembuatan versi dan rencana siklus proses model standar Google, dan satu model dapat diganti dengan model lain tanpa pemberitahuan sebelumnya. Kami juga tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.	Input token maksimum: 8192 Dimensi penyematan: 3072	Mencoba Embedding untuk teks besar

Dukungan bahasa penyematan

Model penyematan multibahasa teks mendukung bahasa berikut:
Afrikaans, Albania, Amharik, Arab, Armenia, Azerbaijan, Basque, Belarusia, Bengali, Bulgaria, Burma, Katalan, Cebuano, Chichewa, Cina, Korsika, Ceko, Denmark, Belanda, Inggris, Esperanto, Estonia, Filipina, Finlandia, Prancis, Galicia, Georgia, Jerman, Yunani, Gujarati, Kreol Haiti, Hausa, Hawaii, Ibrani, Hindi, Hmong, Hungaria, Islandia, Igbo, Indonesia, Irlandia, Italia, Jepang, Jawa, Kannada, Kazakh, Khmer, Korea, Kurdi, Kirgiz, Laos, Latin, Latvia, Lituania, Luksemburg, Makedonia, Malagasi, Melayu, Malayalam, Malta, Maori, Marathi, Mongolia, Nepal, Norwegia, Pashto, Persia, Polandia, Portugis, Punjabi, Rumania, Rusia, Samoa, Gaelik Skotlandia, Serbia, Shona, Sindhi, Sinhala, Slovakia, Slovenia, Somalia, Sotho, Spanyol, Sunda, Swahili, Swedia, Tajik, Tamil, Telugu, Thailand, Turki, Ukraina, Urdu, Uzbek, Vietnam, Welsh, Frisia Barat, Xhosa, Yiddish, Yoruba, Zulu.

Model Imagen

Tabel berikut merangkum model yang tersedia di Imagen API:

Model	Input	Output	Kasus penggunaan	Mencoba model
Imagen 3 (`imagen-3.0-generate-001`, `imagen-3.0-fast-generate-001`) Imagen 2 (`imagegeneration@006`, `imagegeneration@005`) Imagen (`imagegeneration@002`) Detail model	Teks	Gambar	Model ini mendukung pembuatan dan pengeditan gambar untuk membuat gambar berkualitas tinggi dalam hitungan detik. Hal ini mencakup pembuatan gambar menggunakan zero-shot learning.	Mencoba Imagen untuk pembuatan gambar
Imagen 3 (Pengeditan dan penyesuaian) (`imagen-3.0-capability-001`) Imagen 2 (Pengeditan) (`imagegeneration@006`) Imagen (Pengeditan) `imagegeneration@002`) Detail model	Teks dan gambar	Gambar	Model ini mendukung pengeditan gambar dan pembuatan gambar kustom (beberapa gambar) untuk membuat gambar berkualitas tinggi dalam hitungan detik. Fitur pengeditan mendukung inpainting (penghapusan atau penyematan objek), outpainting, dan pengeditan gambar produk. Penyesuaian mendukung pembelajaran beberapa tahap, sehingga Anda dapat memberikan gambar referensi untuk memandu pembuatan gambar output. Model ini mendukung jenis penyesuaian berikut: subjek (produk, orang, dan hewan peliharaan), gaya, penyesuaian terkontrol (coretan atau tepi canny), dan penyesuaian petunjuk (transfer gaya).	Mencoba Imagen untuk pengeditan dan penyesuaian

Dukungan bahasa Imagen 3

Imagen 3 mendukung bahasa berikut:
Inggris, China, Hindi, Jepang, Korea, Portugis, dan Spanyol.

Model penyelesaian kode

Tabel berikut meringkas model yang tersedia di Codey API:

Model	Input	Output	Kasus penggunaan	Mencoba model
Codey for Code Completion (`code-gecko`) Detail model	Kode dalam bahasa yang didukung	Kode dalam bahasa yang didukung	Model yang disesuaikan untuk menyarankan penyelesaian kode berdasarkan konteks dalam kode yang ditulis.	Coba Codey untuk Penyelesaian Kode

Dukungan bahasa model penyelesaian kode

Model Penyelesaian kode mendukung bahasa Inggris.

Model MedLM

Tabel berikut meringkas model yang tersedia di MedLM API:

Nama model	Deskripsi	Spesifikasi	Mencoba model
MedLM-medium (`medlm-medium`) Detail model	Rangkaian model dan API yang disesuaikan secara medis dan sesuai dengan HIPAA yang didukung oleh Google Research. Model ini membantu praktisi layanan kesehatan dengan tugas pertanyaan dan jawaban medis, serta tugas ringkasan untuk dokumen layanan kesehatan dan medis. Memberikan throughput yang lebih baik dan menyertakan data yang lebih baru daripada model `medlm-large`.	Token maksimum (input + output): 32.768. Token output maksimum: 8.192.	Coba MedLM-medium
MedLM-large (`medlm-large`) Detail model	Rangkaian model dan API yang disesuaikan secara medis dan sesuai dengan HIPAA yang didukung oleh Google Research. Model ini membantu praktisi layanan kesehatan dengan tugas pertanyaan dan jawaban medis, serta tugas ringkasan untuk dokumen layanan kesehatan dan medis.	Token input maksimum: 8.192. Token output maksimum: 1.024.	Coba MedLM-large

Dukungan Throughput yang Disediakan MedLM

MedLM-medium dan MedLM-large mendukung Provisioned Throughput. Lihat Model yang didukung.

Dukungan bahasa MedLM

Model MedLM mendukung bahasa Inggris.

Lokasi

Untuk mengetahui daftar lokasi tempat model ini tersedia, lihat Lokasi AI Generatif di Vertex AI.

Versi model

Untuk mempelajari versi model, lihat Versi model.

Mempelajari semua model di Model Garden

Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model & aset OSS tertentu serta eksklusif Google. Untuk mempelajari model dan API AI generatif yang tersedia di Vertex AI, buka Model Garden di Konsol Google Cloud.

Buka Model Garden

Untuk mempelajari lebih lanjut Model Garden, termasuk model dan kemampuan yang tersedia, lihat Mempelajari model AI di Model Garden.

Langkah berikutnya

Coba tutorial panduan memulai menggunakan Vertex AI Studio atau Vertex AI API.
Pelajari cara menguji perintah teks.
Pelajari cara menguji prompt chat.
Pelajari model terlatih di Model Garden.
Pelajari cara menyesuaikan model dasar.
Pelajari praktik terbaik responsible AI dan filter keamanan Vertex AI.
Pelajari cara mengontrol akses ke model tertentu di Model Garden dengan menggunakan kebijakan organisasi Model Garden.

Model Google Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Model Gemini

Gemini 2.0 Flash

Kemampuan

Spesifikasi

Pratinjau Gemini 2.5 Pro

Kemampuan

Spesifikasi

Gemini 2.0 Flash-Lite

Kemampuan

Spesifikasi

Model Flash Thinking Gemini 2.0

Kemampuan

Spesifikasi

Dukungan bahasa Gemini

Model Gemma

Dukungan bahasa Gemma

Model penyematan

Dukungan bahasa penyematan

Model Imagen

Dukungan bahasa Imagen 3

Model penyelesaian kode

Dukungan bahasa model penyelesaian kode

Model MedLM

Dukungan Throughput yang Disediakan MedLM

Dukungan bahasa MedLM

Lokasi

Versi model

Mempelajari semua model di Model Garden

Langkah berikutnya

Model Google