FAQ Gemini API

Dokumen ini berisi jawaban atas pertanyaan umum (FAQ) tentang Gemini API, yang disusun ke dalam kategori berikut:

Perbandingan model

Apa perbedaan antara PaLM dan Gemini?

Model Gemini dirancang untuk aplikasi multimodal. Model Gemini menerima perintah yang mencakup, misalnya, teks dan gambar, lalu menampilkan respons teks. Gemini juga mendukung panggilan fungsi, yang memungkinkan developer meneruskan deskripsi fungsi, lalu model menampilkan fungsi dan parameter yang paling cocok dengan deskripsi. Selanjutnya, developer dapat memanggil fungsi tersebut di API dan layanan eksternal.

Model PaLM 2 Tersedia secara Umum (GA). Model PaLM 2 dirancang untuk aplikasi bahasa dan berperforma baik pada kasus penggunaan seperti ringkasan teks dan pembuatan teks. PaLM 2 juga menawarkan dukungan penuh untuk layanan MLOps di Vertex AI, seperti pemantauan model, yang tidak tersedia dengan Gemini.

Dengan Vertex AI Studio, Anda dapat menyesuaikan model Gemini dan PaLM 2 dengan kontrol data penuh dan memanfaatkan dukungan kepatuhan, tata kelola data, keamanan, dan keselamatan Google Cloud. Perintah dan data penyesuaian untuk Gemini dan PaLM 2 tidak pernah digunakan untuk melatih atau meningkatkan kualitas model dasar kami.

Mengapa Anda memilih PaLM daripada Gemini?

Untuk kasus penggunaan yang secara eksklusif memerlukan input-output teks (seperti ringkasan teks, pembuatan teks, dan Tanya Jawab), model PaLM 2 dapat memberikan respons berkualitas yang cukup tinggi.

Model Gemini cocok untuk kasus penggunaan yang menyertakan input multimodal, memerlukan panggilan fungsi, atau memerlukan teknik perintah yang kompleks (seperti rantai pemikiran dan mengikuti petunjuk yang kompleks).

Apakah PaLM 2 tidak digunakan lagi?

Tidak ada rencana untuk menghentikan penggunaan PaLM 2.

Apa perbedaan antara Imagen di Vertex AI dan Gemini API untuk kasus penggunaan visi?

Imagen adalah model visi untuk kasus penggunaan pembuatan, pengeditan, teks, dan Tanya Jawab gambar. Sebagai bagian dari perintah Anda, Gemini dapat mengambil beberapa gambar atau video dan memberikan jawaban tentang input Anda, sedangkan Imagen hanya dapat mengambil satu gambar input. Gemini tidak mendukung pembuatan gambar atau pengeditan gambar.

Apa perbedaan antara Vertex AI Codey API dan Gemini API untuk kasus penggunaan coding?

Codey API dibuat khusus untuk pembuatan kode, penyelesaian kode, dan chat kode. Codey API didukung oleh Gemini dan model lainnya yang dikembangkan oleh Google. Anda dapat menggunakan API di seluruh siklus proses pengembangan software dengan mengintegrasikannya ke dalam IDE, alur kerja CI/CD, dasbor, dan aplikasi lainnya. Anda juga dapat menyesuaikan model dengan codebase Anda. Kami tidak merekomendasikan Gemini 1.0 Pro Vision untuk pembuatan kode.

Cara mengirim perintah ke model Gemini 1.0 Pro atau Gemini 1.0 Pro Vision

Ada sejumlah metode yang dapat Anda gunakan untuk mengirim permintaan ke Gemini API. Misalnya, Anda dapat menggunakan konsol Google Cloud, SDK bahasa pemrograman, atau REST API untuk mengirim permintaan ke gemini-1.0-pro (Gemini 1.0 Pro) atau gemini-1.0-pro-vision (Gemini 1.0 Pro Vision).

Untuk memulai, lihat Mencoba Gemini API.

Apakah fine-tuning tersedia untuk Gemini?

Anda dapat menyesuaikan versi 002 dari versi stabil Gemini 1.0 Pro (gemini-1.0-pro-002). Untuk informasi selengkapnya, lihat Ringkasan penyesuaian model untuk Gemini.

Keamanan dan penggunaan data

Mengapa respons saya diblokir?

AI Generatif di Vertex AI menggunakan filter keamanan untuk mencegah respons yang berpotensi berbahaya. Anda dapat menyesuaikan nilai minimum filter keamanan ini. Untuk mengetahui informasi selengkapnya, lihat Responsible AI.

Bagaimana data input saya digunakan?

Google memastikan bahwa timnya mematuhi komitmen privasi AI/ML kami melalui praktik tata kelola data yang andal, yang mencakup peninjauan data yang digunakan Google Cloud dalam pengembangan produknya. Untuk mengetahui detailnya, lihat AI Generatif dan Tata Kelola Data.

Apakah Anda menyimpan data saya dalam cache?

Google dapat meng-cache input dan output pelanggan untuk model Gemini guna mempercepat respons terhadap perintah berikutnya dari pelanggan. Konten dalam cache disimpan hingga 24 jam. Secara default, penyimpanan dalam cache data diaktifkan untuk setiap project Google Cloud. Setelan cache yang sama untuk project Google Cloud berlaku untuk semua wilayah. Anda dapat menggunakan perintah curl berikut untuk mendapatkan status penyimpanan dalam cache, menonaktifkan penyimpanan dalam cache, atau mengaktifkan kembali penyimpanan dalam cache. Untuk informasi selengkapnya, lihat Prediksi di halaman AI Generatif dan Tata Kelola Data. Jika Anda menonaktifkan atau mengaktifkan kembali penyimpanan dalam cache, perubahan tersebut akan diterapkan ke semua region Google Cloud. Untuk mengetahui informasi selengkapnya tentang cara menggunakan Identity and Access Management untuk memberikan izin yang diperlukan guna mengaktifkan atau menonaktifkan penyimpanan dalam cache, lihat Kontrol akses Vertex AI dengan IAM. Luaskan bagian berikut untuk mempelajari cara mendapatkan setelan cache saat ini, untuk menonaktifkan penyimpanan dalam cache, dan untuk mengaktifkan penyimpanan dalam cache.

Mendapatkan setelan penyimpanan dalam cache saat ini

Jalankan perintah berikut untuk menentukan apakah penyimpanan dalam cache diaktifkan atau dinonaktifkan untuk project. Untuk menjalankan perintah ini, pengguna harus diberi salah satu peran berikut: roles/aiplatform.viewer, roles/aiplatform.user, atau roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# GetCacheConfig
$ curl -X GET -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig

# Response if caching is enabled (caching is enabled by default).
{
  "name": "projects/PROJECT_ID/cacheConfig"
}

# Response if caching is disabled.
{
  "name": "projects/PROJECT_ID/cacheConfig"
  "disableCache": true
}
    

Nonaktifkan penggunaan cache

Jalankan perintah curl berikut untuk menonaktifkan penyimpanan dalam cache untuk project Google Cloud. Untuk menjalankan perintah ini, pengguna harus diberi peran administrator Vertex AI, roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt-out of caching.
$ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": true
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_ID}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

Aktifkan simpan ke cache

Jika Anda menonaktifkan penyimpanan dalam cache untuk project Google Cloud dan ingin mengaktifkannya kembali, jalankan perintah curl berikut. Untuk menjalankan perintah ini, pengguna harus diberi peran administrator Vertex AI, roles/aiplatform.admin.

PROJECT_ID=PROJECT_ID
LOCATION_ID="us-central1"
# Setup project_id
$ gcloud config set project PROJECT_ID

# Setup project_id.
$ gcloud config set project ${PROJECT_ID}

# Opt in to caching.
$ curl -X PATCH     -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{
  "name": "projects/PROJECT_ID/cacheConfig",
  "disableCache": false
}'

# Response.
{
  "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_NUMBER}",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/google.protobuf.Empty"
  }
}
    

Migrasi

Bagaimana cara memigrasikan Gemini di Google AI Studio ke Vertex AI Studio?

Bermigrasi ke platform Vertex AI Google Cloud menawarkan rangkaian alat MLOps yang menyederhanakan penggunaan, deployment, dan pemantauan model AI untuk efisiensi dan keandalan. Untuk memigrasikan pekerjaan Anda ke Vertex AI, impor dan upload data yang ada ke Vertex AI Studio dan gunakan Vertex AI Gemini API. Untuk mengetahui informasi selengkapnya, lihat Bermigrasi dari Gemini di Google AI ke Vertex AI.

Bagaimana cara beralih dari PaLM 2 ke Vertex AI Gemini API sebagai model dasarnya?

Anda tidak perlu melakukan perubahan arsitektur besar pada aplikasi saat beralih dari model PaLM ke model Gemini. Dari perspektif API, beralih dari satu model ke model lain memerlukan perubahan satu baris kode atau update SDK. Untuk mengetahui informasi selengkapnya, lihat Bermigrasi dari PaLM API ke Vertex AI Gemini API.

Karena respons dapat bervariasi antarmodel, sebaiknya lakukan pengujian perintah untuk membandingkan respons model PaLM dan Gemini guna memeriksa apakah respons memenuhi ekspektasi Anda.

Ketersediaan dan harga

Di lokasi mana Gemini tersedia?

Gemini 1.0 Pro dan Gemini 1.0 Pro Vision tersedia di wilayah Asia, Amerika Serikat, dan Eropa. Untuk mengetahui informasi selengkapnya, lihat Lokasi AI Generatif di Vertex AI.

Apakah ada paket evaluasi gratis untuk Vertex AI Gemini API?

Hubungi perwakilan Google Cloud Anda untuk mendapatkan informasi selengkapnya.

Berapa harga Vertex AI Gemini API?

Informasi harga untuk model Gemini tersedia di bagian Multimodal dalam Harga untuk AI Generatif di Vertex AI.

Bagaimana cara mendapatkan akses ke Gemini Ultra?

Hubungi perwakilan akun Google Anda untuk meminta akses.

Kuota

Bagaimana cara mengatasi error kuota (429) saat membuat permintaan API?

Ada permintaan yang berlebihan atau permintaan melebihi kuota per project Anda. Pastikan rasio permintaan Anda kurang dari kuota untuk project Anda. Untuk melihat kuota project, buka halaman Quotas di Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Kuota dan batas Vertex AI untuk AI Generatif di Vertex AI.

Bagaimana cara meningkatkan kuota project untuk Gemini?

Anda dapat meminta peningkatan dari Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat AI Generatif di Vertex AI tentang kuota dan batas Vertex AI.