Dokumen ini menjelaskan cara menggunakan pengoptimal berbasis data untuk mengoptimalkan performa perintah secara otomatis dengan meningkatkan kualitas petunjuk sistem untuk serangkaian perintah.
Pengoptimal berbasis data dapat membantu Anda meningkatkan kualitas perintah dengan cepat dalam skala besar, tanpa menulis ulang petunjuk sistem atau perintah satu per satu secara manual. Hal ini sangat berguna saat Anda ingin menggunakan petunjuk dan perintah sistem yang ditulis untuk satu model dengan model yang berbeda.
Contoh pengoptimalan perintah
Misalnya, untuk mengoptimalkan petunjuk sistem untuk serangkaian perintah yang merujuk informasi kontekstual untuk menjawab pertanyaan tentang memasak, Anda dapat menggunakan pengoptimal berbasis data. Untuk menyelesaikan tugas ini, Anda akan menyiapkan input yang mirip dengan berikut:
Petunjuk sistem
You are a professional chef. Your goal is teaching how to cook healthy cooking recipes to your apprentice. Given a question from your apprentice and some context, provide the correct answer to the question. Use the context to return a single and correct answer with some explanation.
Template perintah
Question: {input_question} Facts: {input_context}
Contoh perintah
input_question |
input_context |
---|---|
Apa saja teknik memasak daging merah dan daging babi yang dapat memaksimalkan rasa dan kelembutan sekaligus meminimalkan pembentukan senyawa yang tidak sehat? | Daging merah dan daging babi harus dimasak hingga suhu internal 145 derajat Fahrenheit (63 derajat Celsius) untuk memastikan keamanannya. Memarinasi daging dalam bahan-bahan asam seperti jus lemon atau cuka dapat membantu melunakkan daging dengan memecah serat otot yang keras. Metode memasak dengan suhu tinggi seperti memanggang dan menggoreng di wajan dapat menghasilkan kecokelatan dan karamelisasi yang lezat, tetapi penting untuk menghindari gosong, yang dapat menghasilkan senyawa berbahaya. |
Apa saja cara kreatif untuk menambahkan rasa dan nutrisi pada minuman protein tanpa menggunakan gula tambahan atau bahan buatan? | Menambahkan sayuran hijau seperti bayam atau kale adalah cara yang bagus untuk meningkatkan nilai gizi minuman Anda tanpa mengubah rasanya secara drastis. Menggunakan susu almond tanpa pemanis atau air kelapa sebagai pengganti susu biasa dapat menambahkan rasa manis yang halus dan meningkatkan lemak sehat atau elektrolit. Tahukah Anda bahwa terlalu lama memblender minuman shake dapat membuatnya menjadi panas? Untuk menjaga suhu tetap dingin dan menyegarkan, blender dengan kecepatan rendah dan istirahatkan blender Anda jika diperlukan. |
Petunjuk sistem yang dioptimalkan
As a highly skilled chef with a passion for healthy cooking, you love sharing your knowledge with aspiring chefs. Today, a culinary intern approaches you with a question about healthy cooking. Given the intern's question and some facts, provide a clear, concise, and informative answer that will help the intern excel in their culinary journey.
Cara kerja pengoptimalan
Pengoptimal berbasis data menggunakan parameter berikut:
- Mode pengoptimalan: menentukan apakah pengoptimal berbasis data mengoptimalkan petunjuk sistem, memilih contoh prompt untuk ditambahkan ke petunjuk sistem sebagai contoh few-shot, atau keduanya.
- Metrik evaluasi: metrik yang digunakan pengoptimal berbasis data untuk mengoptimalkan petunjuk sistem dan/atau memilih contoh perintah.
- Model target: Model Google yang dioptimalkan oleh pengoptimal berbasis data untuk petunjuk sistem dan memilih perintah contoh.
Saat Anda menjalankan pengoptimal berbasis data, pengoptimal ini akan mengoptimalkan petunjuk sistem berdasarkan pilihan Anda dengan menjalankan tugas pelatihan kustom yang secara berulang mengevaluasi perintah contoh Anda dan menulis ulang petunjuk sistem untuk menemukan versi yang menghasilkan skor evaluasi terbaik untuk model target.
Di akhir tugas, pengoptimal berbasis data akan menghasilkan petunjuk sistem yang dioptimalkan beserta skor evaluasinya.
Metrik evaluasi
Pengoptimal berbasis data menggunakan metrik evaluasi untuk mengoptimalkan petunjuk sistem dan memilih contoh perintah. Anda dapat menggunakan metrik evaluasi standar atau menentukan metrik evaluasi kustom Anda sendiri. Catatan: Semua metrik evaluasi HARUS memiliki properti bahwa skor yang lebih tinggi menunjukkan performa yang lebih baik.
Anda dapat menggunakan beberapa metrik sekaligus. Namun, metrik kustom hanya dapat digunakan satu per satu. Jika Anda menggunakan metrik standar dan kustom secara bersamaan, hanya satu metrik yang dapat berupa metrik kustom. Metrik lainnya harus berupa metrik standar.
Untuk mempelajari cara menentukan metrik satu per satu atau secara bersamaan, lihat EVALUATION_METRIC_PARAMETERS di tab SDK dalam Membuat template perintah dan petunjuk sistem.
Metrik evaluasi kustom
Metrik kustom berguna jika metrik standar tidak sesuai dengan aplikasi Anda. Perhatikan bahwa pengoptimal berbasis data hanya mendukung satu metrik kustom dalam satu waktu.
Untuk mempelajari cara membuat metrik kustom, lihat Membuat metrik kustom.
Metrik evaluasi standar
Pengoptimal berbasis data mendukung metrik evaluasi kustom, dan juga mendukung metrik evaluasi berikut:
Jenis metrik | Kasus penggunaan | Metrik | Deskripsi |
---|---|---|---|
Berbasis model | Ringkasan | summarization_quality |
Mendeskripsikan kemampuan model untuk menjawab pertanyaan berdasarkan sekumpulan teks yang akan dirujuk. |
Question answering | question_answering_correctness * |
Mendeskripsikan kemampuan model untuk menjawab pertanyaan dengan benar. | |
question_answering_quality |
Mendeskripsikan kemampuan model untuk menjawab pertanyaan berdasarkan sekumpulan teks yang akan dirujuk. | ||
Coherence | coherence |
Mendeskripsikan kemampuan model untuk memberikan respons yang koheren dan mengukur seberapa baik teks yang dihasilkan mengalir secara logis dan masuk akal. | |
Keselamatan | safety |
Mendeskripsikan tingkat keamanan model, yaitu apakah respons berisi teks yang tidak aman. | |
Kefasihan | fluency |
Menjelaskan penguasaan bahasa model. | |
Perujukan (Groundedness) | groundedness |
Mendeskripsikan kemampuan model untuk memberikan atau merujuk informasi yang hanya disertakan dalam teks input. | |
Comet | comet** |
Mendeskripsikan kemampuan model dalam kualitas terjemahan terhadap referensi. | |
MetricX | metricx** |
Mendeskripsikan kemampuan model dalam kualitas terjemahan. | |
Berbasis komputasi | Penggunaan alat dan panggilan fungsi | tool_call_valid * |
Mendeskripsikan kemampuan model untuk memprediksi panggilan alat yang valid. |
tool_name_match * |
Menjelaskan kemampuan model untuk memprediksi panggilan alat dengan nama alat yang benar. Hanya panggilan alat pertama yang diperiksa. | ||
tool_parameter_key_match * |
Menjelaskan kemampuan model untuk memprediksi panggilan alat dengan nama parameter yang benar. | ||
tool_parameter_kv_match * |
Menjelaskan kemampuan model untuk memprediksi panggilan alat dengan nama parameter dan nilai kunci yang benar. | ||
Pembuatan teks umum | bleu * |
Menyimpan hasil algoritma untuk mengevaluasi kualitas prediksi, yang telah diterjemahkan dari satu bahasa alami ke bahasa alami lainnya. Kualitas prediksi dianggap sebagai korespondensi antara parameter prediksi dan parameter referensinya. | |
exact_match * |
Menghitung apakah parameter prediksi sama persis dengan parameter rujukan. | ||
rouge_1 * |
Digunakan untuk membandingkan parameter prediksi yang diberikan dengan parameter rujukan. | ||
rouge_2 * |
|||
rouge_l * |
|||
rouge_l_sum * |
* Jika Anda ingin mengoptimalkan perintah menggunakan evaluasi berbasis komputasi atau
question_answering_correctness
, Anda harus melakukan salah satu hal berikut:
- Tambahkan variabel yang merepresentasikan respons kebenaran dasar untuk perintah Anda ke template perintah Anda.
- Jika Anda tidak memiliki respons kebenaran nyata untuk perintah, tetapi sebelumnya menggunakan perintah dengan model Google dan mencapai hasil yang diinginkan, Anda dapat menambahkan parameter
source_model
ke konfigurasi, bukan menambahkan respons kebenaran nyata. Jika parametersource_model
ditetapkan, pengoptimal berbasis data akan menjalankan perintah sampel Anda pada model sumber untuk menghasilkan respons kebenaran dasar bagi Anda.
** Jika Anda ingin mengoptimalkan perintah menggunakan comet
atau metricx
, Anda harus memberikan parameter translation_source_field_name
ke konfigurasi yang menentukan nama kolom yang sesuai dari teks sumber dalam data. Selain itu, nilai MetricX telah diubah menjadi antara 0 (terburuk) dan 25 (terbaik) untuk menghormati properti makin besar makin baik.
Sebelum memulai
Untuk memastikan bahwa akun layanan default Compute Engine memiliki izin yang diperlukan untuk mengoptimalkan perintah, minta administrator untuk memberikan peran IAM berikut kepada akun layanan default Compute Engine di project:
-
Pengguna Vertex AI (
roles/aiplatform.user
) -
Storage Object Admin (
roles/storage.objectAdmin
) -
Pembaca Artifact Registry (
roles/artifactregistry.reader
) -
Jika menggunakan metrik kustom:
-
Cloud Run Developer (
roles/run.developer
) -
Cloud Run Invoker (
roles/run.invoker
)
-
Cloud Run Developer (
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Administrator Anda mungkin juga dapat memberikan izin yang diperlukan kepada akun layanan default Compute Engine melalui peran khusus atau peran bawaan lainnya.
Mengoptimalkan perintah
Anda dapat mengoptimalkan perintah dengan cara berikut:
- menggunakan pengoptimal perintah Vertex AI di Konsol Vertex AI
- menggunakan Vertex AI API
- menjalankan notebook pengoptimal perintah Vertex AI.
Untuk mengoptimalkan perintah, pilih metode yang ingin Anda gunakan, lalu selesaikan langkah-langkah seperti yang dijelaskan secara mendetail di bagian berikut:
- Membuat template perintah dan petunjuk sistem
- Menyiapkan contoh perintah
- Opsional: buat metrik kustom
- Membuat konfigurasi
- Jalankan tugas pengoptimalan perintah
- Menganalisis hasil dan melakukan iterasi
Membuat template perintah dan petunjuk sistem
Template perintah menentukan format semua perintah Anda melalui variabel yang dapat diganti. Saat Anda menggunakan template perintah untuk mengoptimalkan perintah, variabel diganti dengan data dalam set data perintah.
Variabel template perintah harus memenuhi persyaratan berikut:
- Variabel harus diapit dalam tanda kurung kurawal
- Nama variabel tidak boleh berisi spasi atau tanda hubung
-
Variabel yang merepresentasikan input multimodal harus menyertakan string
MIME_TYPE
setelah variabel:@@@MIME_TYPE
Ganti
MIME_TYPE
dengan jenis MIME gambar, video, audio, atau dokumen yang didukung oleh model target.
Buat template perintah dan petunjuk sistem menggunakan salah satu metode berikut:
Notebook
Jika Anda ingin menjalankan pengoptimal berbasis data melalui notebook, buat petunjuk sistem dan template perintah dengan melakukan hal berikut:
Di Colab Enterprise, buka notebook pengoptimal perintah Vertex AI.
Di bagian Buat template perintah dan petunjuk sistem, lakukan hal berikut:
Di kolom SYSTEM_INSTRUCTION, masukkan petunjuk sistem Anda. Contoh:
Based on the following images and articles respond to the questions.'\n' Be concise, and answer \"I don't know\" if the response cannot be found in the provided articles or images.
Di kolom PROMPT_TEMPLATE, masukkan template perintah Anda. Misalnya:
Article 1:\n\n{article_1}\n\nImage 1:\n\n{image_1} @@@image/jpeg\n\nQuestion: {question}
Jika Anda ingin mengoptimalkan perintah menggunakan evaluasi berbasis komputasi atau
question_answering_correctness
, Anda harus melakukan salah satu hal berikut:
Tambahkan variabel
{target}
ke template perintah, untuk merepresentasikan respons kebenaran dasar perintah. Contoh:Article 1:\n\n{article_1}\n\nImage 1:\n\n{image_1} @@@image/jpeg\n\nQuestion: {question}\n\n Answer: {target}
Jika Anda tidak memiliki respons kebenaran dasar untuk perintah, tetapi Anda sebelumnya menggunakan perintah dengan model Google dan mencapai hasil yang diinginkan, Anda dapat menambahkan parameter
source_model
ke konfigurasi, bukan menambahkan respons kebenaran dasar. Jika parametersource_model
ditetapkan, pengoptimal berbasis data akan menjalankan perintah contoh Anda pada model sumber untuk menghasilkan respons kebenaran dasar bagi Anda.
SDK
Jika Anda ingin menjalankan pengoptimal berbasis data melalui SDK tanpa menggunakan notebook, buat file teks untuk template perintah dan petunjuk sistem dengan melakukan hal berikut:
Buat file teks untuk petunjuk sistem Anda.
Dalam file teks, tentukan petunjuk sistem Anda ke file teks. Misalnya:
Based on the following images and articles respond to the questions.'\n' Be concise, and answer \"I don't know\" if the response cannot be found in the provided articles or images.
Buat file teks untuk template perintah Anda.
Dalam file teks, tentukan template perintah yang menyertakan satu atau beberapa variabel. Contoh:
Article 1:\n\n{article_1}\n\nImage 1:\n\n{image_1} @@@image/jpeg\n\nQuestion: {question}
Jika Anda ingin mengoptimalkan perintah menggunakan evaluasi berbasis komputasi atau
question_answering_correctness
, Anda harus melakukan salah satu hal berikut:Tambahkan variabel
{target}
ke template perintah, untuk merepresentasikan respons kebenaran dasar perintah. Contoh:Article 1:\n\n{article_1}\n\nImage 1:\n\n{image_1} @@@image/jpeg\n\nQuestion: {question}\n\n Answer: {target}
Jika Anda tidak memiliki respons kebenaran dasar untuk perintah, tetapi Anda sebelumnya menggunakan perintah dengan model Google dan mencapai hasil yang diinginkan, Anda dapat menambahkan parameter
source_model
ke konfigurasi, bukan menambahkan respons kebenaran dasar. Jika parametersource_model
ditetapkan, pengoptimal berbasis data akan menjalankan perintah contoh Anda pada model sumber untuk menghasilkan respons kebenaran dasar bagi Anda.
Menyiapkan contoh perintah
Untuk mendapatkan hasil terbaik dari pengoptimal berbasis data, gunakan 50-100 perintah sampel.
- Alat ini tetap efektif dengan sedikitnya 5 perintah contoh.
- Contoh terbaik mencakup contoh saat model target berperforma buruk dan contoh saat model target berperforma baik.
Contoh perintah berisi data yang menggantikan variabel dalam template perintah. Anda dapat menggunakan file JSONL atau CSV untuk menyimpan contoh perintah.
File JSONL
- Buat file JSONL.
Dalam file JSONL, tambahkan data perintah yang menggantikan setiap variabel. Misalnya:
{"article_1": "The marine life …", "image_1": "gs://path_to_image", "Question": "What are some most effective ways to reduce ocean pollution?", "target": "The articles and images don't answer this question."} {"article_1": "During the year …", "image_1": "gs://path_to_image", "Question": "Who was the president in 2023?", "target": "Joe Biden"}
File CSV
- Buat file CSV.
- Di baris pertama, tambahkan variabel dari template perintah Anda.
- Di baris berikut, tambahkan data sampel yang menggantikan setiap variabel.
- Upload file CSV ke bucket Cloud Storage.
Opsional: Membuat metrik kustom
Buat metrik kustom dengan melakukan langkah berikut:
Buat file teks bernama
requirements.txt
.Dalam file
requirements.txt
, tentukan library yang diperlukan untuk fungsi metrik evaluasi kustom. Semua fungsi memerlukan paketfunctions-framework
.Misalnya, file
requirements.txt
untuk metrik kustom yang menghitung ROUGE-L akan terlihat mirip dengan berikut ini:functions-framework==3.* rouge-score
Buat file Python bernama
main.py
.Dalam file
main.py
, tulis fungsi evaluasi kustom Anda. Fungsi harus menerima hal berikut:- Permintaan POST HTTP
- Input JSON yang berisi
response
, yang merupakan output dari LLM, danreference
, yang merupakan respons kebenaran nyata untuk perintah jika disediakan dalam set data perintah.
Misalnya, file
main.py
untuk metrik kustom yang menghitung ROUGE-L akan terlihat mirip dengan berikut ini:from typing import Any import json import functions_framework from rouge_score import rouge_scorer # Register an HTTP function with the Functions Framework @functions_framework.http def main(request): request_json = request.get_json(silent=True) if not request_json: raise ValueError('Can not find request json.') """Extract 'response' and 'reference' from the request payload. 'response' represents the model's response, while 'reference' represents the ground truth response.""" response = request_json['response'] reference = request_json['reference'] # Compute ROUGE-L F-measure scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True) scores = scorer.score(reference, response) final_score = scores['rougeL'].fmeasure # Return the custom score in the response return json.dumps({ # The following key is the CUSTOM_METRIC_NAME that you pass to the job 'custom_accuracy': final_score, # The following key is optional 'explanation': 'ROUGE_L F-measure between reference and response', })
Deploy fungsi evaluasi kustom Anda sebagai fungsi Cloud Run dengan menjalankan perintah
gcloud functions deploy
:gcloud functions deploy FUNCTION_NAME \ --project PROJECT_ID \ --gen2 \ --memory=2Gb \ --concurrency=6 \ --min-instances 6 \ --region=REGION \ --runtime="python310" \ --source="." \ --entry-point main \ --trigger-http \ --timeout=3600 \ --quiet
Ganti kode berikut:
FUNCTION_NAME
: nama untuk metrik evaluasi kustom.PROJECT_ID
: project ID Anda.REGION
: region tempat Anda ingin men-deploy fungsi. Region ini harus sama dengan region saat menggunakan model target.
Membuat konfigurasi
Konfigurasi pengoptimal berbasis data menentukan parameter yang ingin Anda tetapkan untuk tugas pengoptimalan perintah.
Buat konfigurasi menggunakan salah satu opsi berikut:
Notebook
Jika Anda ingin menjalankan pengoptimal berbasis data melalui notebook, buat konfigurasi dengan melakukan hal berikut:
Di Colab Enterprise, buka notebook pengoptimal berbasis data.
Di bagian Configure project settings, lakukan hal berikut:
- Di kolom PROJECT_ID, masukkan project ID Anda.
- Di kolom LOCATION, masukkan lokasi tempat Anda ingin menjalankan pengoptimal berbasis data.
- Di kolom OUTPUT_PATH, masukkan URI untuk bucket Cloud Storage tempat Anda ingin pengoptimal berbasis data menulis petunjuk sistem yang dioptimalkan dan/atau contoh beberapa cuplikan.
Contoh,
gs://bucket-name/output-path
. - Di kolom INPUT_PATH, masukkan URI untuk contoh
perintah di bucket Cloud Storage Anda. Contoh,
gs://bucket-name/sample-prompts.jsonl
.
Di bagian Konfigurasi setelan pengoptimalan, lakukan hal berikut:
- Di kolom TARGET_MODEL, masukkan model yang ingin Anda optimalkan prompt-nya.
- Di kolom THINKING_BUDGET, masukkan anggaran penalaran untuk model target yang ingin Anda optimalkan perintahnya. Nilai defaultnya adalah -1, yang berarti tidak ada penalaran untuk model non-penalaran dan penalaran otomatis untuk model penalaran seperti Gemini-2.5. Lihat Pertimbangan untuk mempelajari setelan anggaran manual.
- Di OPTIMIZATION_MODE, masukkan mode pengoptimalan yang ingin Anda gunakan. Harus salah satu dari
instruction
,demonstration
, atauinstruction_and_demo
. - Di kolom EVAL_METRIC, masukkan metrik evaluasi yang ingin Anda optimalkan untuk perintah Anda.
- Opsional: Di kolom SOURCE_MODEL, masukkan
model Google yang sebelumnya digunakan dengan
petunjuk dan perintah sistem. Jika parameter
source_model
ditetapkan, pengoptimal berbasis data akan menjalankan perintah contoh Anda pada model sumber untuk menghasilkan respons kebenaran dasar bagi Anda, untuk metrik evaluasi yang memerlukan respons kebenaran dasar. Jika sebelumnya Anda tidak menjalankan perintah dengan model Google atau Anda tidak mencapai hasil target, tambahkan respons data sebenarnya ke perintah Anda. Untuk mengetahui informasi selengkapnya, lihat bagian Membuat perintah dan petunjuk sistem dalam dokumen ini.
Opsional: Di bagian Konfigurasi setelan pengoptimalan lanjutan, Anda juga dapat menambahkan parameter opsional ke konfigurasi.
- Di kolom NUM_INST_OPTIMIZATION_STEPS, masukkan jumlah
iterasi yang digunakan pengoptimal berbasis data dalam
mode pengoptimalan perintah. Durasi meningkat secara linear saat Anda
menaikkan nilai ini. Harus berupa bilangan bulat antara
10
dan20
. Jika tidak disetel, defaultnya adalah10
. - Di kolom NUM_DEMO_OPTIMIZATION_STEPS, masukkan jumlah demonstrasi yang dievaluasi oleh pengoptimal berbasis data.
Digunakan dengan mode pengoptimalan
demonstration
daninstruction_and_demo
. Harus berupa bilangan bulat antara10
dan30
. Jika tidak disetel, defaultnya adalah10
. - Di kolom NUM_DEMO_PER_PROMPT, masukkan jumlah
demonstrasi yang dibuat per perintah. Harus berupa bilangan bulat antara
2
dan dan jumlah total perintah contoh - 1. Jika tidak disetel, defaultnya adalah3
. - Di kolom TARGET_MODEL_QPS, masukkan kueri per detik (QPS)
yang dikirim pengoptimal berbasis data ke model target.
Waktu proses menurun secara linear saat Anda meningkatkan nilai ini. Harus berupa
float yang
3.0
atau lebih besar, tetapi kurang dari kuota QPS yang Anda miliki pada model target. Jika tidak disetel, defaultnya adalah3.0
. - Di kolom SOURCE_MODEL_QPS, masukkan kueri per detik
(QPS) yang dikirim pengoptimal berbasis data ke
model sumber. Harus berupa float yang
3.0
atau lebih besar, tetapi kurang dari kuota QPS yang Anda miliki pada model sumber. Jika tidak disetel, defaultnya adalah3.0
. - Di kolom EVAL_QPS, masukkan kueri per detik (QPS)
yang dikirim pengoptimal berbasis data ke layanan evaluasi AI Generatif atau fungsi Cloud Run.
- Untuk metrik berbasis model, harus berupa float yang
3.0
atau lebih besar. Jika tidak disetel, defaultnya adalah3.0
. - Untuk metrik kustom, harus berupa float yang
3.0
atau lebih besar. Hal ini menentukan kecepatan pemanggilan fungsi Cloud Run metrik kustom Anda oleh pengoptimal berbasis data.
- Untuk metrik berbasis model, harus berupa float yang
- Jika Anda ingin menggunakan lebih dari satu metrik evaluasi, lakukan hal berikut:
- Di kolom EVAL_METRIC_1, masukkan metrik evaluasi yang ingin Anda gunakan.
- Di kolom EVAL_METRIC_1_WEIGHT, masukkan bobot yang Anda inginkan agar pengoptimal berbasis data digunakan saat menjalankan pengoptimalan.
- Di kolom EVAL_METRIC_2, masukkan metrik evaluasi yang ingin Anda gunakan.
- Di kolom EVAL_METRIC_2_WEIGHT, masukkan bobot yang Anda inginkan agar pengoptimal berbasis data digunakan saat menjalankan pengoptimalan.
- Di kolom EVAL_METRIC_3, masukkan metrik evaluasi yang ingin Anda gunakan (opsional).
- Di kolom EVAL_METRIC_3_WEIGHT, masukkan bobot yang Anda inginkan agar pengoptimal berbasis data menggunakannya saat menjalankan pengoptimalan.
- Di kolom METRIC_AGGREGATION_TYPE, masukkan bobot yang Anda inginkan agar pengoptimal berbasis data gunakan saat menjalankan pengoptimalan.
- Di kolom PLACEHOLDER_TO_VALUE, masukkan informasi yang menggantikan variabel apa pun dalam petunjuk sistem. Informasi yang disertakan dalam tanda ini tidak dioptimalkan oleh pengoptimal berbasis data.
- Di kolom RESPONSE_MIME_TYPE, masukkan
jenis respons MIME
yang digunakan model target. Harus salah satu dari
text/plain
atauapplication/json
. Jika tidak disetel, defaultnya adalahtext/plain
. - Di kolom TARGET_LANGUAGE, masukkan bahasa petunjuk sistem. Jika tidak disetel, defaultnya adalah bahasa Inggris.
SDK
Jika Anda ingin menjalankan pengoptimal berbasis data melalui SDK, buat file JSON dengan parameter yang ingin Anda gunakan untuk mengoptimalkan perintah dengan melakukan hal berikut:
Buat file JSON dengan parameter yang ingin Anda gunakan untuk mengoptimalkan perintah. Setiap file konfigurasi memerlukan parameter berikut:
{ "project": "PROJECT_ID", "system_instruction": "SYSTEM_INSTRUCTION", "prompt_template": "PROMPT_TEMPLATE", "target_model": "TARGET_MODEL", "thinking_budget": "THINKING_BUDGET, EVALUATION_METRIC_PARAMETERS, "optimization_mode": "OPTIMIZATION_MODE", "input_data_path": "SAMPLE_PROMPT_URI", "output_path": "OUTPUT_URI" }
Ganti kode berikut:
PROJECT_ID
: project ID Anda.SYSTEM_INSTRUCTION
: petunjuk sistem yang ingin Anda optimalkan.PROMPT_TEMPLATE
: template perintah.TARGET_MODEL
: model yang ingin Anda optimalkan perintahnya.THINKING_BUDGET
: anggaran pemikiran untuk model target yang ingin Anda optimalkan perintahnya. Nilai defaultnya adalah -1, yang berarti tidak ada penalaran untuk model non-penalaran dan penalaran otomatis untuk model penalaran seperti Gemini-2.5. Lihat Pertimbangan untuk mempelajari setelan anggaran manual.EVALUATION_METRIC_PARAMETERS
: parameter yang Anda tentukan bergantung pada jumlah metrik evaluasi yang Anda gunakan, dan apakah metrik Anda standar atau kustom:Metrik standar tunggal
Jika Anda menggunakan satu metrik evaluasi standar, gunakan parameter berikut:
"eval_metric": "EVALUATION_METRIC",
Ganti
EVALUATION_METRIC
dengan metrik yang ingin Anda optimalkan perintahnya.Metrik kustom tunggal
Jika Anda menggunakan satu metrik evaluasi kustom, gunakan parameter berikut:
"eval_metric": "custom_metric", "custom_metric_name": "CUSTOM_METRIC_NAME", "custom_metric_cloud_function_name": "FUNCTION_NAME",
Ganti kode berikut:
CUSTOM_METRIC_NAME
: nama metrik, seperti yang ditentukan oleh kunci yang sesuai denganfinal_score
. Contohnya,custom_accuracy
.FUNCTION_NAME
: nama fungsi Cloud Run yang sebelumnya Anda deploy.
Beberapa metrik standar
Jika Anda menggunakan beberapa metrik evaluasi standar, gunakan parameter berikut:
"eval_metrics_types": [EVALUATION_METRIC_LIST], "eval_metrics_weights": [EVAL_METRICS_WEIGHTS], "aggregation_type": "METRIC_AGGREGATION_TYPE",
Ganti kode berikut:
EVALUATION_METRIC_LIST
: daftar metrik evaluasi. Harus berupa array. Contoh,"bleu", "summarization_quality"
.EVAL_METRICS_WEIGHTS
: bobot untuk setiap metrik. Harus berupa array dan memiliki panjang yang sama denganEVALUATION_METRIC_LIST
.METRIC_AGGREGATION_TYPE
: jenis agregasi yang digunakan untuk metrik evaluasi. Harus salah satu dariweighted_sum
atauweighted_average
. Jika tidak disetel, defaultnya adalahweighted_sum
.
Beberapa metrik standar & kustom
Jika Anda menggunakan beberapa metrik evaluasi yang mencakup campuran dari satu metrik kustom dan satu atau beberapa metrik standar, gunakan parameter berikut:
"eval_metrics_types": ["custom_metric", EVALUATION_METRIC_LIST], "eval_metrics_weights": [EVAL_METRICS_WEIGHTS], "aggregation_type": "METRIC_AGGREGATION_TYPE", "custom_metric_name": "CUSTOM_METRIC_NAME", "custom_metric_cloud_function_name": "FUNCTION_NAME",
Ganti kode berikut:
EVALUATION_METRIC_LIST
: daftar metrik evaluasi standar. Harus berupa array. Contoh,"bleu", "summarization_quality"
.EVAL_METRICS_WEIGHTS
: bobot untuk setiap metrik. Harus berupa array.METRIC_AGGREGATION_TYPE
: jenis agregasi yang digunakan untuk metrik evaluasi. Harus salah satu dariweighted_sum
atauweighted_average
. Jika tidak disetel, defaultnya adalahweighted_sum
.CUSTOM_METRIC_NAME
: nama metrik, seperti yang ditentukan oleh kunci yang sesuai denganfinal_score
. Misalnya,custom_accuracy
.FUNCTION_NAME
: nama fungsi Cloud Run yang sebelumnya Anda deploy.
OPTIMIZATION_MODE
: mode pengoptimalan. Harus salah satu dariinstruction
,demonstration
, atauinstruction_and_demo
.SAMPLE_PROMPT_URI
: URI untuk contoh perintah di bucket Cloud Storage Anda. Contoh,gs://bucket-name/sample-prompts.jsonl
.OUTPUT_URI
: URI untuk bucket Cloud Storage tempat Anda ingin pengoptimal berbasis data menulis petunjuk sistem yang dioptimalkan dan/atau contoh sedikit cuplikan. Contoh,gs://bucket-name/output-path
.
Selain itu, Anda dapat menambahkan parameter opsional ke file konfigurasi.
Parameter opsional dibagi menjadi 5 kategori:
- Parameter proses pengoptimalan. Parameter ini mengontrol keseluruhan proses pengoptimalan, termasuk durasinya dan jumlah iterasi pengoptimalan yang dijalankannya, yang secara langsung memengaruhi kualitas pengoptimalan.
- Pemilihan model dan parameter lokasi. Parameter ini menentukan model mana yang digunakan pengoptimal berbasis data dan lokasi tempat model tersebut digunakan.
- Parameter latensi (QPS). Parameter ini mengontrol QPS, yang memengaruhi kecepatan proses pengoptimalan.
- Lainnya. Parameter lain yang mengontrol struktur dan konten perintah.
Melihat parameter opsional
"num_steps": NUM_INST_OPTIMIZATION_STEPS, "num_demo_set_candidates": "NUM_DEMO_OPTIMIZATION_STEPS, "demo_set_size": NUM_DEMO_PER_PROMPT, "target_model_location": "TARGET_MODEL_LOCATION", "source_model": "SOURCE_MODEL", "source_model_location": "SOURCE_MODEL_LOCATION", "target_model_qps": TARGET_MODEL_QPS, "eval_qps": EVAL_QPS, "source_model_qps": SOURCE_MODEL_QPS, "response_mime_type": "RESPONSE_MIME_TYPE", "language": "TARGET_LANGUAGE", "placeholder_to_content": "PLACEHOLDER_TO_CONTENT", "data_limit": DATA_LIMIT
Ganti kode berikut:
Parameter proses pengoptimalan:
NUM_INST_OPTIMIZATION_STEPS
: jumlah iterasi yang digunakan pengoptimal berbasis data dalam mode pengoptimalan perintah. Durasi meningkat secara linear saat Anda menaikkan nilai ini. Harus berupa bilangan bulat antara10
dan20
. Jika dibiarkan tidak disetel, defaultnya adalah10
.NUM_DEMO_OPTIMIZATION_STEPS
: jumlah demonstrasi yang dievaluasi pengoptimal berbasis data. Digunakan dengan mode pengoptimalandemonstration
daninstruction_and_demo
. Harus berupa bilangan bulat antara2
dan jumlah total perintah contoh - 1. Jika tidak disetel, defaultnya adalah10
.NUM_DEMO_PER_PROMPT
: jumlah demonstrasi yang dihasilkan per perintah. Harus berupa bilangan bulat antara3
dan6
. Jika tidak disetel, defaultnya adalah3
.
Pemilihan model dan parameter lokasi:
TARGET_MODEL_LOCATION
: lokasi tempat Anda ingin menjalankan model target. Jika tidak disetel, defaultnya adalahus-central1
.SOURCE_MODEL
: model Google yang sebelumnya digunakan dengan petunjuk dan perintah sistem. Jika parametersource_model
ditetapkan, pengoptimal berbasis data akan menjalankan perintah sampel pada model sumber untuk menghasilkan respons kebenaran dasar bagi Anda, untuk metrik evaluasi yang memerlukan respons kebenaran dasar. Jika sebelumnya Anda tidak menjalankan perintah dengan model Google atau Anda tidak mencapai hasil target, tambahkan respons kebenaran dasar ke perintah Anda. Untuk mengetahui informasi selengkapnya, lihat bagian Membuat perintah dan petunjuk sistem dalam dokumen ini.SOURCE_MODEL_LOCATION
: lokasi tempat Anda ingin menjalankan model sumber. Jika tidak disetel, defaultnya adalahus-central1
.
Parameter latensi (QPS):
TARGET_MODEL_QPS
: kueri per detik (QPS) yang dikirim pengoptimal berbasis data ke model target. Waktu proses menurun secara linear saat Anda meningkatkan nilai ini. Harus berupa float yang3.0
atau lebih besar, tetapi kurang dari kuota QPS yang Anda miliki pada model target. Jika tidak disetel, defaultnya adalah3.0
.EVAL_QPS
: kueri per detik (QPS) yang dikirim pengoptimal berbasis data ke layanan evaluasi AI Generatif atau fungsi Cloud Run.- Untuk metrik berbasis model, harus berupa float yang
3.0
atau lebih besar. Jika tidak disetel, defaultnya adalah3.0
. - Untuk metrik kustom, harus berupa float yang
3.0
atau lebih besar. Hal ini menentukan kecepatan pemanggilan fungsi Cloud Run metrik kustom Anda oleh pengoptimal berbasis data.
- Untuk metrik berbasis model, harus berupa float yang
SOURCE_MODEL_QPS
: kueri per detik (QPS) yang dikirim pengoptimal berbasis data ke model sumber. Harus berupa float yang3.0
atau lebih besar, tetapi kurang dari kuota QPS yang Anda miliki pada model sumber. Jika tidak disetel, defaultnya adalah3.0
.
Parameter lainnya:
RESPONSE_MIME_TYPE
: jenis respons MIME yang digunakan model target. Harus salah satu daritext/plain
atauapplication/json
. Jika tidak disetel, defaultnya adalahtext/plain
.TARGET_LANGUAGE
: bahasa petunjuk sistem. Jika tidak disetel, defaultnya adalah bahasa Inggris.PLACEHOLDER_TO_CONTENT
: informasi yang menggantikan variabel apa pun dalam petunjuk sistem. Informasi yang disertakan dalam tanda ini tidak dioptimalkan oleh pengoptimal perintah berbasis data.DATA_LIMIT
: jumlah data yang digunakan untuk validasi. Waktu proses meningkat secara linear dengan nilai ini. Harus berupa bilangan bulat antara5
dan100
. Jika tidak disetel, defaultnya adalah100
.
Menjalankan pengoptimal perintah
Jalankan pengoptimal berbasis data menggunakan salah satu opsi berikut:
Notebook
Jalankan pengoptimal berbasis data melalui notebook dengan melakukan hal berikut:
Di Colab Enterprise, buka notebook pengoptimal perintah Vertex AI.
Di bagian Run prompt optimizer, klik play_circle Run cell.
Pengoptimal berbasis data berjalan.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- LOCATION: lokasi tempat Anda ingin menjalankan pengoptimal prompt Vertex AI.
- PROJECT_ID: Project ID Anda.
- JOB_NAME: nama untuk tugas pengoptimal perintah Vertex AI.
- PATH_TO_CONFIG: URI file konfigurasi di bucket Cloud Storage Anda.
Contoh,
gs://bucket-name/configuration.json
.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/customJobs
Isi JSON permintaan:
{ "displayName": "JOB_NAME", "jobSpec": { "workerPoolSpecs": [ { "machineSpec": { "machineType": "n1-standard-4" }, "replicaCount": 1, "containerSpec": { "imageUri": "us-docker.pkg.dev/vertex-ai-restricted/builtin-algorithm/apd:preview_v1_0", "args": ["--config=PATH_TO_CONFIG""] } } ] } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/customJobs"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/customJobs" | Select-Object -Expand Content
Responsnya akan terlihat mirip dengan berikut ini:
SDK
Jalankan pengoptimal berbasis data melalui SDK, dengan menambahkan bagian kode berikut ke Colab atau Notebook Anda.
Lakukan penggantian berikut:
- LOCATION: lokasi tempat Anda ingin menjalankan pengoptimal berbasis data.
- PROJECT_ID: ID project Anda.
- PROJECT_NUMBER: nomor project Anda, tersedia di Konsol Cloud.
- PATH_TO_CONFIG: URI file konfigurasi di Cloud Storage. Misalnya,
gs://bucket-name/configuration.json
.
# Authenticate
from google.colab import auth
auth.authenticate_user(project_id=PROJECT_ID)
# Set the Service Account
SERVICE_ACCOUNT = f"{PROJECT_NUMBER}-compute@developer.gserviceaccount.com"
# Import Vertex AI SDK and Setup
import vertexai
vertexai.init(project=PROJECT_ID, location=LOCATION)
#Create the Vertex AI Client
client = vertexai.Client(project=PROJECT_ID, location=LOCATION)
# Setup the job dictionary
vapo_config = {
'config_path': PATH_TO_CONFIG,
'service_account': SERVICE_ACCOUNT,
'wait_for_completion': True,
}
#Start the Vertex AI Prompt Optimizer
client = client.prompt_optimizer.optimize(method="vapo", config=vapo_config)
Setelah pengoptimalan selesai, periksa artefak output di lokasi output yang ditentukan dalam konfigurasi.
Menganalisis hasil dan melakukan iterasi
Setelah Anda menjalankan pengoptimal berbasis data, tinjau progres tugas menggunakan salah satu opsi berikut:
Notebook
Jika Anda ingin melihat hasil pengoptimal berbasis data melalui notebook, lakukan hal berikut:
Di bagian Periksa hasil, lakukan hal berikut:
Di kolom RESULT_PATH, tambahkan URI bucket Cloud Storage yang Anda konfigurasi untuk pengoptimal berbasis data agar menulis hasil ke bucket tersebut. Contoh,
gs://bucket-name/output-path
.Klik play_circle Run cell.
Konsol
Di konsol Google Cloud , di bagian Vertex AI, buka halaman Training pipelines.
Klik tab Custom jobs. Tugas pelatihan kustom pengoptimalan berbasis data akan muncul dalam daftar beserta statusnya.
Setelah tugas selesai, tinjau pengoptimalan dengan melakukan hal berikut:
Di Google Cloud konsol, buka halaman Bucket Cloud Storage:
Klik nama bucket Cloud Storage Anda.
Buka folder yang memiliki nama yang sama dengan mode pengoptimalan yang Anda gunakan untuk mengevaluasi perintah, yaitu
instruction
ataudemonstration
. Jika Anda menggunakan modeinstruction_and_demo
, kedua folder akan muncul. Folderinstruction
berisi hasil dari pengoptimalan instruksi sistem, sedangkan folderdemonstration
berisi hasil dari pengoptimalandemonstration
dan instruksi sistem yang dioptimalkan.Folder ini berisi file berikut:
config.json
: konfigurasi lengkap yang digunakan pengoptimal prompt Vertex AI.templates.json
: setiap set petunjuk sistem dan/atau contoh beberapa shot yang dihasilkan pengoptimal berbasis data dan skor evaluasinya.eval_results.json
: respons model target untuk setiap perintah contoh untuk setiap set petunjuk sistem yang dibuat dan/atau contoh beberapa cuplikan dan skor evaluasinya.optimized_results.json
: petunjuk sistem dan/atau contoh beberapa shot yang berperforma terbaik serta skor evaluasinya.
Untuk melihat petunjuk sistem yang dioptimalkan, lihat file
optimized_results.json
.
Praktik terbaik
Model pratinjau hanya didukung melalui region
global
dan Vertex Custom Job tidak mendukungglobal
sebagai region. Oleh karena itu, jangan gunakan VAPO untuk mengoptimalkan model pratinjau sebagai model target.Untuk model GA, pengguna dapat memilih lokasi spesifik per region, seperti
us-central1
ataueurope-central2
, bukanglobal
, untuk mematuhi persyaratan residensi data mereka.
Langkah berikutnya
- Coba notebook SDK pengoptimal perintah Vertex AI.
- Pelajari praktik terbaik responsible AI dan filter keamanan Vertex AI.
- Pelajari lebih lanjut strategi perintah.
- Pelajari contoh perintah di Galeri prompt.