Halaman ini diterjemahkan oleh Cloud Translation API.

Bermigrasi ke model Gemini terbaru

Panduan ini menjelaskan cara mengupdate aplikasi Anda ke versi Gemini terbaru. Panduan ini mengasumsikan bahwa aplikasi Anda sudah menggunakan versi Gemini yang lebih lama. Untuk mempelajari cara mulai menggunakan Gemini di Vertex AI, lihat panduan memulai Gemini API di Vertex AI.

Panduan ini tidak membahas cara mengalihkan aplikasi Anda dari Vertex AI SDK ke Google Gen AI SDK saat ini. Untuk mengetahui informasi tersebut, lihat panduan migrasi Vertex AI SDK kami.

Apa perubahan yang akan terjadi?

Mengupdate sebagian besar aplikasi AI generatif ke versi Gemini terbaru hanya memerlukan sedikit perubahan kode atau perintah. Namun, beberapa aplikasi mungkin memerlukan penyesuaian perintah. Sulit untuk memprediksi perubahan ini tanpa menguji perintah Anda terlebih dahulu dengan versi baru. Pengujian menyeluruh direkomendasikan sebelum melakukan migrasi sepenuhnya. Untuk mengetahui tips tentang cara membuat perintah yang efektif, lihat panduan strategi perintah kami. Gunakan daftar periksa kesehatan perintah kami untuk membantu menemukan dan memperbaiki masalah perintah.

Anda hanya perlu melakukan perubahan kode besar untuk perubahan yang menyebabkan gangguan tertentu atau untuk menggunakan kemampuan Gemini baru.

Model Gemini mana yang harus saya migrasikan?

Model Gemini yang Anda gunakan bergantung pada kebutuhan aplikasi Anda. Tabel berikut membandingkan model Gemini 1.5 lama dengan model Gemini terbaru:

Fitur	1.5 Pro	1.5 Flash	2.0 Flash	2.0 Flash-Lite	2.5 Pro	2.5 Flash	2.5 Flash-Lite
Tahap peluncuran	Pensiunan	Pensiunan	Tersedia secara umum	Tersedia secara umum	Tersedia secara umum	Tersedia secara umum	Tersedia secara umum
Modalitas input	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video	Teks, Kode, Gambar, Audio, Video
Modalitas output	Teks	Teks	Teks	Teks	Teks	Teks	Teks
Jendela konteks, batas total token	2.097.152	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576
Panjang konteks output	8.192 (default)	8.192 (default)	8.192 (default)	8.192 (default)	65.535 (default)	65.535 (default)	65.536 (default)
Melakukan grounding dengan Google Penelusuran
Panggilan fungsi
Eksekusi kode
Penyimpanan cache konteks
Prediksi batch
Live API^*
Penyesuaian (fine-tuning)
Latensi
SDK yang direkomendasikan	Vertex AI SDK	Vertex AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK
Menghitung harga unit	Berbasis karakter	Berbasis karakter	Token	Token	Token	Token	Token
Tanggal penghentian	24 September 2025	24 September 2025	5 Februari 2026	25 Februari 2026	17 Juni 2026	17 Juni 2026	22 Juli 2026

^* Live API tersedia sebagai penawaran pratinjau sebagai bagian dari gemini-live-2.5-flash dan gemini-live-2.5-flash-preview-native-audio.

Sebelum Anda mulai bermigrasi

Sebelum memulai proses migrasi, Anda harus mempertimbangkan hal-hal berikut:

Keamanan informasi (InfoSec), tata kelola, dan persetujuan peraturan
Ketersediaan lokasi
Perbedaan harga berdasarkan tokenisasi dan modalitas
Membeli atau mengubah pesanan Throughput yang Disediakan
Penyesuaian yang diawasi
Pengujian regresi

InfoSec, tata kelola, dan persetujuan peraturan

Dapatkan persetujuan dari tim keamanan informasi (InfoSec), risiko, dan kepatuhan Anda sejak awal. Mencakup aturan kepatuhan dan risiko tertentu, terutama di industri yang diatur seperti layanan kesehatan dan keuangan.

Ketersediaan lokasi

Model dan fitur AI generatif Google dan Partner di Vertex AI tersedia melalui endpoint regional dan endpoint global tertentu. Endpoint global mencakup seluruh dunia dan menawarkan ketersediaan dan keandalan yang lebih baik dibandingkan dengan region tunggal.

Ketersediaan endpoint regional bervariasi menurut model. Untuk mengetahui detail setiap model, lihat panduan lokasi kami.

Perbedaan harga berdasarkan modalitas dan tokenisasi

Harga bervariasi di setiap model Gemini. Halaman harga kami mencantumkan biaya untuk semua modalitas (teks, kode, gambar, ucapan, dll.) per model.

Membeli atau mengubah pesanan Throughput yang Disediakan

Jika perlu, beli lebih banyak Throughput yang Disediakan atau ubah pesanan Throughput yang Disediakan yang ada.

Penyesuaian yang diawasi

Model Gemini terbaru menawarkan kualitas output yang lebih baik. Hal ini dapat berarti aplikasi Anda tidak lagi memerlukan model yang di-tune. Jika aplikasi Anda menggunakan penyesuaian terawasi dengan model Gemini yang lebih lama, uji terlebih dahulu aplikasi Anda dengan model terbaru tanpa penyesuaian dan evaluasi hasilnya.

Jika memilih untuk menggunakan penyesuaian terperinci yang diawasi, Anda tidak dapat memindahkan model yang sudah disesuaikan dari versi Gemini yang lebih lama. Anda perlu menjalankan tugas penyesuaian baru untuk versi Gemini yang baru.

Saat menyetel model Gemini baru, mulailah dengan setelan penyetelan default. Jangan menggunakan kembali nilai hyperparameter dari versi Gemini sebelumnya, karena layanan penyesuaian dioptimalkan untuk versi terbaru. Menggunakan kembali setelan lama kemungkinan tidak akan memberikan hasil yang optimal.

Pengujian regresi

Saat mengupgrade ke versi Gemini terbaru, Anda memerlukan tiga jenis utama uji regresi:

Uji regresi kode: Pengujian regresi dari perspektif rekayasa software dan operasi developer (DevOps). Jenis pengujian regresi ini selalu diperlukan.
Pengujian regresi performa model: Pengujian regresi dari perspektif data science atau machine learning. Artinya, memastikan bahwa versi model Gemini baru memberikan output yang setidaknya mempertahankan tingkat kualitas yang sama dengan versi sebelumnya.

Pengujian regresi performa model adalah evaluasi model yang dilakukan saat sistem atau model dasarnya berubah. Contohnya meliputi:
- Pengujian performa offline: Pengujian yang menegaskan kualitas output model dalam lingkungan eksperimen khusus berdasarkan berbagai metrik kualitas output model.
- Pengujian performa model online: Pengujian yang menegaskan kualitas output model dalam deployment online langsung berdasarkan masukan pengguna implisit atau eksplisit.
Pengujian beban: Pengujian ini memeriksa seberapa baik aplikasi menangani banyak permintaan sekaligus. Pengujian beban diperlukan untuk aplikasi yang menggunakan Throughput yang Disediakan.

Cara melakukan migrasi ke versi terbaru

Bagian berikut menguraikan langkah-langkah untuk bermigrasi ke versi Gemini terbaru. Untuk hasil yang optimal, selesaikan langkah-langkah ini secara berurutan.

1. Mendokumentasikan persyaratan evaluasi dan pengujian model

Bersiaplah untuk mengulangi evaluasi relevan yang Anda lakukan saat pertama kali membuat aplikasi, ditambah evaluasi apa pun yang dilakukan sejak saat itu.
Jika evaluasi saat ini tidak sepenuhnya mencakup atau mengukur semua tugas yang dilakukan aplikasi Anda, rancang dan siapkan lebih banyak evaluasi. Anda dapat menggunakan playbook evaluasi dan resep evaluasi kami untuk membantu Anda memulai.
Jika aplikasi Anda melibatkan RAG, penggunaan alat, alur kerja agentik yang kompleks, atau rangkaian perintah, pastikan data evaluasi yang ada memungkinkan penilaian setiap komponen secara independen. Jika tidak, kumpulkan contoh input-output untuk setiap komponen.
Jika aplikasi Anda bersifat penting atau merupakan bagian dari sistem real-time yang lebih besar dan berinteraksi dengan pengguna, sertakan evaluasi online.

2. Melakukan upgrade kode dan menjalankan pengujian

Mengupgrade kode Anda memerlukan tiga perubahan utama:

Mengupgrade ke Google Gen AI SDK
Mengubah panggilan Gemini Anda
Memperbaiki perubahan kode yang menyebabkan gangguan

Bagian berikut akan membahas perubahan ini secara lebih detail.

Mengupgrade ke Google Gen AI SDK

Jika aplikasi Gemini 1.x Anda menggunakan Vertex AI SDK, beralihlah ke Gen AI SDK. Lihat panduan migrasi Vertex AI SDK kami untuk mengetahui detailnya, termasuk contoh kode untuk melakukan panggilan serupa dengan Gen AI SDK. Rilis Vertex AI SDK setelah Juni 2026 tidak akan mendukung Gemini, dan fitur Gemini baru hanya tersedia di Gen AI SDK.

Jika Anda baru menggunakan Gen AI SDK, lihat notebook Mulai menggunakan AI Generatif Google dengan Gen AI SDK.

Mengubah panggilan Gemini Anda

Perbarui kode prediksi Anda untuk menggunakan salah satu model Gemini terbaru. Setidaknya, hal ini berarti mengubah nama endpoint model.

Perubahan kode yang tepat akan bervariasi berdasarkan cara Anda membangun aplikasi, terutama apakah Anda menggunakan Gen AI SDK atau Vertex AI SDK.

Setelah melakukan perubahan kode, jalankan pengujian regresi kode dan pengujian software lainnya untuk memastikan kode Anda berfungsi seperti yang diharapkan. Langkah ini memeriksa apakah kode berfungsi, tetapi tidak memeriksa kualitas respons model.

Memperbaiki perubahan kode yang merusak

Pengambilan dinamis: Beralih ke penggunaan Grounding dengan Google Penelusuran. Fitur ini memerlukan Gen AI SDK dan tidak didukung oleh Vertex AI SDK.
Filter konten: Perhatikan setelan filter konten default. Ubah kode Anda jika kode tersebut mengandalkan default yang telah berubah.
Parameter pengambilan sampel token Top-K: Model setelah gemini-1.0-pro-vision tidak mendukung perubahan parameter Top-K.

Untuk langkah ini, hanya fokus pada perubahan kode. Anda mungkin perlu membuat perubahan lain nanti, tetapi tunggu hingga Anda memulai evaluasi. Setelah evaluasi, pertimbangkan penyesuaian berikut berdasarkan hasil evaluasi:

Jika beralih dari pengambilan dinamis, Anda mungkin perlu menyesuaikan petunjuk sistem untuk mengontrol kapan Google Penelusuran digunakan (misalnya, "Only generate queries for the Google Search tool if the user asks about sports. Don't generate queries for any other topic."). Namun, tunggu hingga Anda mengevaluasi sebelum mengubah perintah.
Jika Anda menggunakan parameter Top-K, sesuaikan parameter pengambilan sampel token lainnya, seperti Top-P, untuk mendapatkan hasil yang serupa.

3. Menjalankan evaluasi offline

Ulangi evaluasi yang Anda lakukan saat pertama kali mengembangkan dan meluncurkan aplikasi, evaluasi offline yang dilakukan sejak saat itu, dan evaluasi tambahan yang Anda identifikasi di langkah 1. Jika Anda masih merasa evaluasi Anda tidak sepenuhnya mencakup cakupan aplikasi Anda, lakukan evaluasi lebih lanjut.

Jika Anda tidak memiliki cara otomatis untuk menjalankan evaluasi offline, pertimbangkan untuk menggunakan layanan evaluasi AI generatif.

Jika aplikasi Anda menggunakan penyesuaian, lakukan evaluasi offline sebelum menyesuaikan ulang model Anda dengan Gemini versi terbaru. Model terbaru menawarkan kualitas output yang lebih baik, yang berarti aplikasi Anda tidak lagi memerlukan model yang disesuaikan.

4. Menilai hasil evaluasi dan menyesuaikan perintah serta hyperparameter Anda

Jika evaluasi offline menunjukkan bahwa aplikasi Anda berperforma kurang efektif, tingkatkan kualitas aplikasi Anda hingga performanya cocok dengan model lama. Lakukan hal ini dengan:

Memperbaiki perintah Anda secara berulang untuk meningkatkan performa ("Hill Climbing"). Jika Anda baru mengenal pendakian bukit, lihat pelatihan online pendakian bukit Gemini Vertex. Pengoptimal perintah Vertex AI (contoh notebook) juga dapat membantu.
Jika aplikasi Anda terpengaruh oleh perubahan merusakPengambilan Dinamis dan Top-K, coba sesuaikan perintah dan parameter pengambilan sampel token Anda.

5. Menjalankan pengujian beban

Jika aplikasi Anda memerlukan throughput minimum tertentu, lakukan pengujian beban untuk memastikan versi terbaru aplikasi Anda memenuhi persyaratan throughput Anda.

Pengujian beban harus dilakukan sebelum evaluasi online, karena evaluasi online melibatkan pemaparan model ke traffic aktif. Gunakan alat pengujian beban dan instrumentasi yang sudah ada untuk langkah ini.

Jika aplikasi Anda sudah memenuhi kebutuhan throughput, pertimbangkan untuk menggunakan Throughput yang Disediakan. Anda memerlukan Throughput yang Disediakan jangka pendek tambahan untuk mencakup pengujian beban, sementara pesanan Throughput yang Disediakan saat ini menangani traffic produksi.

6. (Opsional) Menjalankan evaluasi online

Lanjutkan ke evaluasi online hanya jika evaluasi offline Anda menunjukkan kualitas output Gemini yang tinggi dan aplikasi Anda memerlukan evaluasi online.

Evaluasi online adalah jenis pengujian online tertentu. Coba gunakan alat dan metode yang sudah ada di organisasi Anda untuk evaluasi online. Contoh:

Jika organisasi Anda rutin melakukan pengujian A/B, lakukan pengujian untuk membandingkan versi aplikasi Anda saat ini dengan versi Gemini terbaru.
Jika organisasi Anda sering menggunakan deployment canary, gunakan deployment tersebut dengan model terbaru dan ukur perubahan perilaku pengguna.

Anda juga dapat melakukan evaluasi online dengan menambahkan fitur pengukuran dan masukan baru ke aplikasi Anda. Aplikasi yang berbeda memerlukan metode masukan yang berbeda. Contoh:

Menambahkan tombol suka dan tidak suka di samping output model dan membandingkan rasio antara model lama dan model Gemini terbaru.
Menampilkan output dari model lama dan model terbaru secara berdampingan kepada pengguna dan meminta mereka memilih yang paling mereka sukai.
Melacak seberapa sering pengguna mengganti atau menyesuaikan output secara manual dari model lama dibandingkan dengan model terbaru.

Metode masukan ini sering kali mengharuskan Anda menjalankan Gemini versi terbaru bersama dengan versi yang ada. Deployment paralel ini terkadang disebut "mode bayangan" atau "deployment biru-hijau".

Jika hasil evaluasi online sangat berbeda dengan hasil evaluasi offline, evaluasi offline Anda tidak mencakup aspek utama lingkungan aktif atau pengalaman pengguna. Terapkan temuan evaluasi online untuk membuat evaluasi offline baru yang mencakup kesenjangan tersebut, lalu kembali ke langkah 3.

Jika menggunakan Throughput yang Disediakan, Anda mungkin perlu membeli Throughput yang Disediakan jangka pendek tambahan untuk terus memenuhi persyaratan throughput bagi pengguna dalam evaluasi online.

7. Men-deploy ke produksi

Setelah evaluasi Anda menunjukkan bahwa model Gemini terbaru berperforma sama baiknya atau lebih baik daripada model lama, ganti versi aplikasi yang ada dengan versi baru. Ikuti prosedur standar organisasi Anda untuk peluncuran produksi.

Jika Anda menggunakan Throughput yang Disediakan, ubah pesanan Throughput yang Disediakan ke model Gemini pilihan Anda. Jika Anda meluncurkan aplikasi secara bertahap, gunakan Throughput yang Disediakan jangka pendek untuk memenuhi kebutuhan throughput dua model Gemini yang berbeda.

Meningkatkan performa model

Saat Anda melakukan migrasi, terapkan tips berikut untuk mendapatkan performa optimal dari model Gemini pilihan Anda:

Periksa petunjuk sistem, perintah, dan contoh pembelajaran beberapa cuplikan untuk melihat apakah ada inkonsistensi, pertentangan, atau petunjuk dan contoh yang tidak relevan.
Uji model yang lebih canggih. Misalnya, jika Anda mengevaluasi Gemini 2.0 Flash-Lite, coba Gemini 2.0 Flash.
Tinjau hasil evaluasi otomatis untuk memastikan hasilnya sesuai dengan penilaian manusia, terutama hasil yang menggunakan model penilaian. Pastikan petunjuk model penilaian Anda jelas, konsisten, dan tidak ambigu.
Untuk meningkatkan kualitas petunjuk model penilaian, uji petunjuk dengan beberapa manusia yang bekerja secara terpisah. Jika manusia menafsirkan petunjuk secara berbeda dan memberikan penilaian yang berbeda, petunjuk model pemberi penilaian Anda tidak jelas.
Sesuaikan model.
Periksa output evaluasi untuk menemukan pola yang menunjukkan jenis kegagalan tertentu. Mengelompokkan kegagalan menurut model, jenis, atau kategori memberikan data evaluasi yang lebih bertarget, sehingga mempermudah penyesuaian perintah untuk memperbaiki kesalahan ini.
Pastikan Anda mengevaluasi berbagai komponen AI generatif secara terpisah.
Bereksperimen dengan menyesuaikan parameter pengambilan sampel token.

Mendapatkan bantuan

Jika Anda memerlukan bantuan, Google Cloud menawarkan paket dukungan untuk memenuhi kebutuhan Anda, seperti cakupan 24/7, dukungan telepon, dan akses ke pengelola dukungan teknis. Untuk mengetahui informasi selengkapnya, lihat Google Cloud Dukungan.

Langkah berikutnya

Lihat daftar pertanyaan umum (FAQ).
Migrasi dari PaLM API ke Gemini API di Vertex AI.