Halaman ini diterjemahkan oleh Cloud Translation API.

Membandingkan perintah

Fitur Bandingkan memungkinkan Anda melihat bagaimana perintah, model, atau setelan parameter yang berbeda mengubah output model. Anda dapat melihat setiap perintah dan responsnya secara berdampingan untuk membandingkan dan menganalisis dengan cara berikut:

Dengan perintah baru.
Dengan perintah tersimpan lainnya.
Dengan kebenaran nyata.

Sebelum memulai

Untuk mengakses fitur Bandingkan, ikuti langkah-langkah berikut:

Di konsol Google Cloud , buka halaman Create prompt.

Buka Buat perintah
Pilih Bandingkan. Halaman Compare akan muncul.

Membuat perintah di fitur Bandingkan

Di halaman Bandingkan, Anda dapat membuat perintah sebelum memilih perintah lain untuk membandingkan hasilnya.

Untuk membuat perintah, ikuti langkah-langkah berikut:

Di kolom New Prompt, masukkan perintah Anda.
Klik Submit prompts. Respons model akan muncul di bawah teks perintah yang Anda masukkan.
Klik Simpan sebagai baru. Dialog Simpan perintah akan muncul.
Masukkan nama perintah baru Anda di kolom Nama perintah.
Pilih region Anda di kolom Region, atau biarkan region default.
Jika kunci enkripsi yang dikelola pelanggan (CMEK) berlaku, lakukan hal berikut:
1. Pilih kotak centang Customer-managed encryption key (CMEK).
2. Pilih kunci dari kolom Pilih kunci Cloud KMS.
Klik Simpan, yang akan menyimpan perintah Anda dalam daftar perintah untuk digunakan di halaman Bandingkan perintah tersimpan.
Klik Kirim perintah untuk membandingkan perintah dan responsnya.

Anda dapat memperbarui perintah, dan menyimpan versi yang diperbarui sebagai perintah baru.

Membandingkan dengan perintah baru

Untuk membandingkan perintah tersimpan dengan perintah baru, ikuti langkah-langkah berikut:

Klik Bandingkan perintah baru. Panel Bandingkan akan muncul.
Opsional: Klik Ganti model untuk menggunakan model yang berbeda dari model default.
Opsional: Luaskan Output.

Output:

Opsional: Jika Anda ingin model menghasilkan output dalam format tertentu seperti JSON, klik tombol Output terstruktur. Setelah Anda memilih Output terstruktur, opsi Perujukan akan dinonaktifkan, karena perujukan tidak didukung dengan output terstruktur.
Opsional: Ubah Anggaran berpikir ke salah satu opsi berikut:

Otomatis: Model hanya berpikir saat diperlukan. Model menyesuaikan seberapa banyak ia berpikir atau menganalisis suatu situasi berdasarkan apa yang diperlukan pada saat itu.
Manual: Anda dapat menyesuaikan token anggaran penalaran.
Nonaktif: Tidak ada pemikiran atau anggaran yang digunakan.

Opsional: Luaskan Alat.

Alat:

Pilih salah satu opsi berikut:

Perujukan: Google: Merujuk dengan Google Penelusuran atau Google Maps.
Perujukan: Data Anda: Perujukan dengan Vertex AI RAG Engine, Vertex AI Search, atau Elasticsearch.

Jika Anda memilih Perujukan: Data Anda, pilih sumber data yang ingin Anda gunakan.

Opsional: Luaskan Lanjutan:

Lanjutan:

Pilih Region.
Pilih Setelan Filter Keamanan. Dialog akan muncul. Tetapkan default Nonaktif, atau Anda dapat menentukan Blokir sedikit, Blokir beberapa, atau Blokir sebagian besar untuk setiap opsi berikut:

Ujaran kebencian: Komentar negatif atau berbahaya yang menargetkan identitas atau atribut yang dilindungi.
Konten berbahaya: Mempromosikan atau memungkinkan akses ke barang, layanan, dan aktivitas berbahaya.
Konten seksual vulgar: Berisi referensi ke tindakan seksual atau konten cabul lainnya.
Konten pelecehan: Komentar berbahaya, mengintimidasi, menindas, atau melecehkan yang menargetkan individu lain.

Klik Simpan untuk menyimpan setelan dan menutup dialog.
Pilih suhu dari kolom Suhu. Suhu mengontrol keacakan dalam pemilihan token. Temperatur yang lebih rendah akan efektif jika Anda mengharapkan respons yang benar atau tepat. Temperatur yang lebih tinggi dapat memberikan hasil yang beragam atau tidak terduga.
Pilih batas token output dari kolom Batas token output. Batas token output menentukan jumlah maksimum output teks dari satu perintah. Token terdiri atas sekitar empat karakter.
Pilih respons maksimum dari kolom Respons maks.. Jika jumlah maksimum respons model yang dihasilkan per perintah. Karena filter keamanan atau kebijakan lainnya, respons masih dapat diblokir.
Pilih nilai dari kolom Top-P. Top-p mengubah cara model memilih token untuk output.
Klik tombol di kolom Respons model streaming. Jika dipilih, respons akan dicetak saat dihasilkan.
Masukkan urutan perhentian di kolom Tambahkan urutan perhentian. Tekan Enter setelah setiap urutan.

Klik Simpan untuk menyimpan perubahan pada setelan Anda.
Klik Terapkan.
Klik Kirim perintah untuk membandingkan perintah dan responsnya.

Untuk mengetahui informasi selengkapnya tentang batas token untuk setiap model, lihat Mengontrol anggaran pemikiran.

Membandingkan dengan perintah tersimpan lainnya

Untuk membandingkan perintah tersimpan Anda dengan perintah tersimpan lainnya, ikuti langkah-langkah berikut:

Klik Bandingkan perintah tersimpan. Panel Existing Prompt akan muncul.
Pilih hingga dua perintah yang ada untuk dibandingkan.
1. Pilih Nama perintah. Jika Anda memiliki banyak perintah dalam daftar, klik di kolom Filter, lalu pilih properti yang ingin Anda filter. Masukkan nilai, lalu tekan Enter.
2. Klik Terapkan. Halaman Bandingkan menampilkan perintah yang telah Anda pilih bersama dengan perintah lain yang telah Anda buat atau pilih untuk perbandingan.
Klik Kirim perintah untuk membandingkan perintah dan responsnya.

Membandingkan dengan kebenaran nyata

Kebenaran dasar adalah jawaban yang Anda pilih atas perintah. Semua respons model lainnya dievaluasi terhadap jawaban kebenaran dasar.

Untuk membandingkan perintah tersimpan Anda dengan data sebenarnya, ikuti langkah-langkah berikut:

Klik Kebenaran dasar. Panel Kebenaran dasar akan muncul.
Masukkan kebenaran nyata Anda untuk membuat metrik evaluasi tambahan.
Klik Simpan untuk menyimpan data sebenarnya.
Klik Kirim perintah untuk membandingkan perintah dan responsnya.

Metrik evaluasi yang dihasilkan saat Anda membandingkan perintah dengan kebenaran dasar tidak terpengaruh oleh region yang Anda pilih.

Langkah berikutnya

Pelajari contoh perintah lainnya di Galeri perintah.
Untuk mengetahui informasi selengkapnya tentang cara mengevaluasi model, lihat Ringkasan layanan evaluasi AI generatif.