Penyesuaian yang diawasi adalah opsi yang baik jika Anda memiliki tugas terjemahan dengan data teks berlabel yang tersedia. Hal ini sangat efektif untuk aplikasi khusus domain dengan terjemahan yang sangat berbeda dari data umum yang digunakan untuk melatih model besar.
Penyesuaian yang diawasi menyesuaikan perilaku model dengan set data berlabel. Proses ini menyesuaikan bobot model untuk meminimalkan perbedaan antara prediksinya dan label sebenarnya.
Model yang didukung
Model LLM Terjemahan berikut mendukung penyesuaian yang diawasi:
translation-llm-002
(Dalam Pratinjau Publik, hanya mendukung teks)
Batasan
- Token input dan output maksimum:
- Penayangan: 1.000 (~4.000 karakter)
- Ukuran set data validasi: 1.024 contoh
- Ukuran file set data pelatihan: Hingga 1 GB untuk JSONL
- Panjang contoh pelatihan: 1.000 (~4.000 karakter)
- Ukuran adaptor:
Translation LLM V2
: Nilai yang didukung hanya 4. Menggunakan nilai lain (mis., 1 atau 8) akan mengakibatkan kegagalan.
Kasus penggunaan untuk menggunakan penyesuaian yang diawasi
Model terjemahan terlatih umum berfungsi dengan baik jika teks yang akan diterjemahkan didasarkan pada struktur teks umum umum yang dipelajari model. Jika Anda ingin model mempelajari sesuatu yang khusus atau spesifik per domain yang menyimpang dari terjemahan umum, sebaiknya pertimbangkan untuk menyesuaikan model tersebut. Misalnya, Anda dapat menggunakan penyesuaian model untuk mengajarkan model hal berikut ini:
- Konten spesifik dari domain industri dengan jargon atau gaya
- Struktur atau format spesifik untuk menghasilkan output.
- Perilaku spesifik seperti kapan harus memberikan output yang singkat atau panjang.
- Output yang disesuaikan dan spesifik untuk jenis input tertentu.
Mengonfigurasi region tugas penyesuaian
Data pengguna, seperti set data yang ditransformasi dan model yang dioptimalkan, disimpan di
region tugas penyesuaian. Satu-satunya region yang didukung adalah us-central1
.
Jika menggunakan Vertex AI SDK, Anda dapat menentukan region saat inisialisasi. Contoh:
import vertexai vertexai.init(project='myproject', location='us-central1')
Jika Anda membuat tugas penyesuaian terpantau dengan mengirimkan permintaan POST menggunakan metode
tuningJobs.create
, Anda akan menggunakan URL untuk menentukan region tempat tugas penyesuaian berjalan. Misalnya, di URL berikut, Anda menentukan region dengan mengganti kedua instanceTUNING_JOB_REGION
dengan region tempat tugas dijalankan.https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
Jika menggunakan konsol Google Cloud, Anda dapat memilih nama region di kolom drop-down Region di halaman Detail model. Ini adalah halaman yang sama tempat Anda memilih model dasar dan nama model yang disesuaikan.
Kuota
Kuota diterapkan pada jumlah tugas penyesuaian serentak. Setiap project dilengkapi dengan kuota default untuk menjalankan setidaknya satu tugas penyesuaian. Ini adalah kuota global,
yang dibagikan di semua region yang tersedia dan model yang didukung. Jika ingin menjalankan lebih banyak tugas secara serentak, Anda harus meminta kuota tambahan untuk Global concurrent tuning jobs
.
Harga
Penyesuaian yang diawasi untuk translation-llm-002
sedang dalam Pratinjau. Saat penyesuaian dalam Pratinjau,
tidak ada biaya untuk menyesuaikan model atau menggunakannya untuk inferensi.
Token pelatihan dihitung dengan total jumlah token dalam set data pelatihan, dikalikan dengan jumlah epoch.
Langkah selanjutnya
- Siapkan set data fine-tuning terpantau.