Model Gemini yang tersedia

Gemini adalah rangkaian model yang memproses informasi dari berbagai modalitas, termasuk teks, gambar, audio, dan video. Gemini dapat menjelajahi dan menganalisis informasi dalam jumlah besar untuk memahami dan memproses jenis data multimodal ini dengan lancar. Untuk mengetahui informasi selengkapnya, lihat Ringkasan Gemini.

Gemini 1.5 Flash adalah versi ringan, cepat, dan hemat biaya dari rangkaian model Gemini. Gemini 1.5 Pro dirancang agar lebih andal.

Halaman ini menjelaskan spesifikasi model Gemini yang dapat Anda gunakan di Google Distributed Cloud (GDC) yang terisolasi.

Kasus penggunaan model

Tabel berikut merangkum kasus penggunaan model yang tersedia di Gemini API.

Model Input Output Kasus penggunaan
Gemini 1.5 Pro Teks, kode, gambar, audio, video, video dengan audio, dokumen Teks Mendukung aplikasi yang memerlukan kualitas respons yang lebih baik.
Gemini 1.5 Flash Teks, kode, gambar, audio, video, video dengan audio, dokumen Teks Menyediakan kecepatan dan efisiensi untuk aplikasi yang hemat biaya.

Informasi berikut memberikan detail untuk setiap model Gemini.

Fitur Gemini 1.5 Pro Gemini 1.5 Flash
Deskripsi Model serbaguna untuk kasus penggunaan multimodal. Gunakan saat Anda memerlukan model yang dapat menangani sejumlah besar permintaan dan pemahaman konteks panjang. Versi ringan, cepat, dan hemat biaya yang didesain untuk kasus penggunaan multimodal. Gunakan saat Anda memerlukan model yang dapat menangani sejumlah besar permintaan dan hemat biaya.
Kemampuan
  • Perintah teks
  • Perintah multimodal:
    • Gambar
    • Audio
    • Video
    • Dokumen
  • Perintah teks
  • Perintah multimodal:
    • Gambar
    • Audio
    • Video
    • Dokumen
Jendela konteks Hingga 32.000 token Hingga 32.000 token
Jumlah maksimum gambar per perintah 100 100
Ukuran gambar mentah maksimum 20 MB 20 MB
Ukuran gambar berenkode base64 maksimum 7 MB 7 MB
Maks. file audio per perintah Tak terbatas Tak terbatas
Durasi audio maksimum 15 menit 09 menit
Video maksimum per perintah 10 10
Durasi maksimal video (khusus frame) 120 detik 120 detik
Durasi maksimal video (frame dan audio) 100 detik 100 detik
Ukuran file dokumen maksimum 50 MB 50 MB
File dokumen maksimum per permintaan 100 100
Halaman maksimum per dokumen 100 100

Memilih model dan membuat perintah

Anda harus memilih model yang ingin digunakan untuk membuat respons dari permintaan pembuatan konten. Model yang Anda pilih memengaruhi output dan biaya.

ID endpoint model Gemini di GDC adalah sebagai berikut:

Nama ID endpoint model
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

Kemudian, Anda harus membuat perintah untuk mendapatkan output dari model. Anda dapat meningkatkan kualitas output dengan memberikan petunjuk, contoh, dan konteks yang diperlukan atau informasi khusus kepada model. Untuk mengetahui informasi selengkapnya tentang perintah, lihat Pengantar perintah.