Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Gemini 2

Model Gemini 2 adalah model Google terbaru yang didukung di Vertex AI. Halaman ini membahas model berikut:

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
Pratinjau Gemini 2.5 Pro

Jika Anda mencari informasi tentang model Pratinjau Gemini 2.5 Pro, buka dokumentasi Pratinjau Gemini 2.5 Pro.

Model

2.0 Flash

Gemini 2.0 Flash adalah model terbaru kami yang tersedia secara umum dalam keluarga Gemini. Ini adalah model andalan kami untuk semua tugas harian dan menampilkan performa yang ditingkatkan serta mendukung Live API real-time.

Gemini 2.0 Flash memperkenalkan fitur baru dan yang ditingkatkan berikut:

Multimodal Live API: API baru ini memungkinkan interaksi suara dan video dua arah dengan latensi rendah dengan Gemini.
Kualitas: Meningkatkan performa di sebagian besar tolok ukur kualitas.
Kemampuan agen yang ditingkatkan: 2.0 Flash memberikan peningkatan pada pemahaman multimodal, coding, mengikuti petunjuk yang kompleks, dan pemanggilan fungsi. Peningkatan ini bekerja sama untuk mendukung pengalaman agen yang lebih baik.
Modalitas baru: Flash 2.0 memperkenalkan pembuatan gambar bawaan dan kemampuan text-to-speech yang dapat dikontrol, yang memungkinkan pengeditan gambar, pembuatan karya seni yang dilokalkan, dan penceritaan yang ekspresif.

Fitur Gemini 2.0 Flash:

Input multimodal
Output teks (ketersediaan umum) / output multimodal (pratinjau pribadi)
Pengoptimal perintah
Pembuatan terkontrol
Panggilan fungsi
Grounding dengan Google Penelusuran
Eksekusi kode
Token jumlah

Gunakan ID model ini untuk menggunakan Gemini 2.0 Flash dengan Gen AI SDK: gemini-2.0-flash

Ketersediaan fitur

Fitur berikut tersedia untuk Gemini 2.0 Flash:

Fitur	Tingkat ketersediaan
Pembuatan teks	Tersedia secara umum
Grounding dengan Google Penelusuran	Tersedia secara umum
Gen AI SDK	Tersedia secara umum
Multimodal Live API	Pratinjau publik
Deteksi kotak pembatas	Pratinjau publik
Pembuatan gambar	Pratinjau pribadi
Pembuatan ucapan	Pratinjau pribadi

Tersedia secara umum: Fitur ini tersedia secara publik dan didukung untuk digunakan dalam kode tingkat produksi.
Pratinjau publik: Fitur ini tersedia secara publik dengan kapasitas yang dikurangi. Jangan gunakan fitur yang dirilis sebagai pratinjau publik dalam kode produksi, karena tingkat dukungan dan fungsi fitur tersebut dapat berubah tanpa peringatan.
Pratinjau pribadi: Fitur ini hanya tersedia untuk pengguna yang tercantum dalam daftar yang diizinkan. Jangan gunakan fitur yang dirilis sebagai pratinjau pribadi dalam kode produksi, karena tingkat dukungan dan fungsi fitur tersebut dapat berubah tanpa peringatan.

Harga

Informasi tentang harga Gemini 2.0 Flash tersedia di halaman Harga kami.

Kuota dan batasan

Fitur GA di Gemini 2.0 Flash menggunakan kuota bersama dinamis.

Penyelarasan dengan Google Penelusuran di Gemini 2.0 Flash tunduk pada pembatasan kapasitas.

2.0 Flash-Lite

Gemini 2.0 Flash-Lite adalah model Flash tercepat dan paling hemat biaya.

Gemini 2.0 Flash-Lite mencakup:

Input multimodal, output teks
Jendela konteks input token 1 juta
Jendela konteks output 8 ribu token

2.0 Flash-Lite tidak menyertakan fitur berikut:

Pembuatan output multimodal
Integrasi dengan Multimodal Live API
Mode berpikir
Penggunaan alat bawaan

Gunakan ID model ini untuk menggunakan Gemini 2.0 Flash-Lite dengan Gen AI SDK: gemini-2.0-flash-lite

2.5 Pro

Pratinjau Gemini 2.5 Pro adalah model Gemini penalaran kami yang paling canggih, terutama untuk pemahaman multimodal, coding, dan pengetahuan dunia. Pratinjau Gemini 2.5 Pro tersedia sebagai model pratinjau di Vertex AI.

Fitur Pratinjau Gemini 2.5 Pro:

Berpikir dan bernalar
Input multimodal
Output teks
Pengoptimal perintah
Pembuatan terkontrol
Panggilan fungsi (tidak termasuk panggilan fungsi komposisi)
Grounding dengan Google Penelusuran
Eksekusi kode
Token jumlah

Gunakan ID model ini untuk menggunakan Pratinjau Gemini 2.5 Pro dengan Gen AI SDK: gemini-2.5-pro-preview-03-25

Kuota dan batasan

Pratinjau Gemini 2.5 Pro dibatasi kapasitasnya hingga 20 kueri per menit (QPM) selama periode pratinjaunya.

Grounding dengan Google Penelusuran di Pratinjau Gemini 2.5 Pro tunduk pada pembatasan kapasitas.

Google Gen AI SDK

Gen AI SDK menyediakan antarmuka terpadu ke Gemini 2 melalui Gemini Developer API dan Gemini API di Vertex AI. Dengan beberapa pengecualian, kode yang berjalan di satu platform akan berjalan di kedua platform. Artinya, Anda dapat membuat prototipe aplikasi menggunakan Developer API, lalu memigrasikan aplikasi ke Vertex AI tanpa menulis ulang kode.

SDK ini umumnya tersedia di Python. Dukungan untuk Go masih dalam Pratinjau, dan dukungan Java serta JavaScript akan segera hadir.

Anda dapat mulai menggunakan SDK seperti yang ditunjukkan.

Gen AI SDK for Python

Instal

pip install --upgrade google-genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="How does AI work?",
)
print(response.text)
# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#
# Here's a simplified overview:
# ...

Gemini 2 Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Model

2.0 Flash

Ketersediaan fitur

Harga

Kuota dan batasan

2.0 Flash-Lite

2.5 Pro

Kuota dan batasan

Google Gen AI SDK

Gen AI SDK for Python

Instal

Gemini 2