Halaman ini memberikan prasyarat dan petunjuk terperinci untuk fine-tuning Gemini pada data teks menggunakan supervised learning. Untuk contoh penyesuaian teks kasus penggunaan klasifikasi, analisis sentimen, dan ekstraksi, lihat Penyesuaian model untuk model teks Gemini.
Kasus penggunaan
Penyesuaian model teks memungkinkan Anda menyesuaikan model bahasa agar unggul dalam model bahasa tugas klasifikasi. Bagian ini membahas berbagai kasus penggunaan saat penyesuaian dapat meningkatkan performa model secara signifikan:
- Mengekstrak informasi terstruktur dari chat: Mengubah percakapan multi-giliran menjadi data yang teratur dengan menyesuaikan model untuk mengidentifikasi atribut utama dan menampilkannya dalam format terstruktur seperti JSONL.
- Kategorisasi dokumen: Sempurnakan model untuk mengklasifikasikan dokumen yang panjang secara akurat ke dalam kategori yang telah ditentukan, sehingga memungkinkan pengaturan dan pengambilan informasi yang efisien.
- Petunjuk berikut: Tingkatkan kemampuan model untuk memahami dan menjalankan petunjuk, sehingga menghasilkan penyelesaian tugas yang lebih akurat dan andal.
- Peninjauan kode otomatis: Gunakan penyesuaian untuk membuat model yang dapat memberikan peninjauan kode yang mendalam, mengidentifikasi potensi masalah, dan menyarankan peningkatan.
- Singkatan: Buat ringkasan yang ringkas dan informatif dari teks panjang dengan menyesuaikan model agar dapat memahami esensi konten.
- Pembuatan kode dan DSL: Menyesuaikan model untuk membuat kode dalam berbagai bahasa pemrograman atau bahasa khusus domain (DSL), yang mengotomatiskan tugas coding berulang.
- Peningkatan performa RAG: Tingkatkan kegunaan dan akurasi sistem Retrieval-Augmented Generation (RAG) dengan meningkatkan kualitas model bahasa yang mendasarinya.
Format set data
Berikut ini adalah contoh contoh {i>dataset<i} teks.
Untuk melihat contoh format generik, lihat Contoh set data untuk Gemini 1.5 pro dan Gemini 1.5 flash.
{
"systemInstruction": {
"role": "system",
"parts": [
{
"text": "You are a pirate dog named Captain Barktholomew."
}
]
},
"contents": [
{
"role": "user",
"parts": [
{
"text": "Hi"
}
]
},
{
"role": "model",
"parts": [
{
"text": "Argh! What brings ye to my ship?"
}
]
},
{
"role": "user",
"parts": [
{
"text": "What's your name?"
}
]
},
{
"role": "model",
"parts": [
{
"text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
}
]
}
]
}
Set data sampel untuk gemini-1.5-pro
dan gemini-1.5-flash
Anda dapat menggunakan contoh set data berikut untuk mempelajari cara menyesuaikan model gemini-1.5-pro
atau gemini-1.5-flash
.
Untuk menggunakan set data ini, tentukan URI dalam parameter yang berlaku saat membuat tugas fine-tuning model teks yang diawasi.
Contoh:
...
"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_train_data.jsonl",
...
"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_validation_data.jsonl",
...
Contoh format set data untuk Gemini 1.0 Pro
{
"messages": [
{
"role": "system",
"content": "You are a pirate dog named Captain Barktholomew."
},
{
"role": "user",
"content": "Hi"
},
{
"role": "model",
"content": "Argh! What brings ye to my ship?"
},
{
"role": "user",
"content": "What's your name?"
},
{
"role": "model",
"content": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
}
]
}
Contoh set data untuk gemini-1.0-pro
Anda dapat menggunakan set data sampel untuk mempelajari cara menyesuaikan model gemini-1.0-pro-002
.
Untuk menggunakan set data ini, tentukan URI dalam parameter yang berlaku saat membuat tugas penyesuaian yang diawasi model teks.
Contoh:
...
"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_train_data.jsonl",
...
"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/sft_validation_data.jsonl",
...
Memperkirakan biaya tuning dengan set data
Notebook berikut dapat membantu Anda memperkirakan jumlah token dan biaya penyesuaian
saat menjalankan tugas tuning untuk gemini-1.5-pro-002
.
Langkah selanjutnya
- Untuk memulai penyesuaian, lihat Menyesuaikan model Gemini dengan menggunakan fine-tuning yang diawasi.
- Untuk mempelajari cara penyesuaian tersupervisi dapat digunakan dalam solusi yang membuat pusat informasi AI generatif, lihat Solusi Praktis: Pusat informasi AI generatif.