Ringkasan model bahasa

Anda dapat mengakses, menyesuaikan, dan men-deploy model bahasa AI generatif Google menggunakan Vertex AI PaLM API dan Vertex AI Codey API. Gunakan model bahasa untuk menjalankan berbagai alur kerja dari Vertex AI, seperti menggunakan API untuk berinteraksi dengan model dan men-deploy model ke notebook Jupyter. Anda juga dapat menyesuaikan model bahasa untuk kasus penggunaan tertentu dengan melakukan penyesuaian model. Halaman ini menyajikan ringkasan tentang model bahasa yang tersedia, API yang Anda gunakan untuk berinteraksi dengan model, dan cara menyesuaikan perilakunya.

Skema penamaan model

Nama model dasar memiliki dua komponen: kasus penggunaan dan ukuran model. Konvensi penamaan berada dalam format <use case>-<model size>. Misalnya, text-bisonmerepresentasikan model teks Bison.

Ukuran model adalah:

  • Unicorn: Model terbesar dalam kelompok PaLM. Model Unicorn unggul dalam tugas yang kompleks, seperti coding dan chain-of-thinkt (CoT), karena pengetahuan luas yang tertanam dalam model dan kemampuan penalarannya.
  • Bison: Model PaLM nilai terbaik yang menangani berbagai tugas bahasa, seperti klasifikasi dan ringkasan. Dioptimalkan untuk akurasi dan latensi dengan biaya yang wajar. Antarmuka teks, chat, kode, dan codechat menyederhanakan deployment dan integrasi ke dalam aplikasi Anda.
  • Gecko: Model biaya terkecil dan terendah untuk tugas sederhana.

Anda dapat menggunakan model versi stabil atau terbaru. Untuk mengetahui informasi selengkapnya, lihat Versi dan siklus proses model.

Vertex AI PaLM API

PaLM API Vertex AI memberi Anda akses ke kelompok model PaLM 2, yang mendukung pembuatan teks bahasa natural, embedding teks, dan kode (sebaiknya gunakan Vertex AI Codey API untuk pembuatan kode). PaLM 2 adalah generasi kedua Model Bahasa Pathways yang dikembangkan oleh Google Labs. Dengan menggunakan Vertex AI PaLM API, Anda dapat memanfaatkan alat MLOps, keamanan tingkat perusahaan, keselamatan, privasi, dan skalabilitas yang ditawarkan oleh Vertex AI.

PaLM API Vertex AI mengekspos model PaLM 2 dengan menggunakan endpoint penayang global yang unik untuk setiap project Google Cloud. Berikut adalah contoh endpoint model penayang:

https://us-central1-aiplatform.googleapis.com/v1/projects/your_project_id/locations/us-central1/publishers/google/models/text-bison:predict

PaLM API Vertex AI memiliki endpoint penayang untuk model PaLM 2 berikut:

  • text-bison: Dioptimalkan untuk melakukan tugas bahasa natural, seperti klasifikasi, ringkasan, ekstraksi, pembuatan konten, dan proses memunculkan ide.
  • chat-bison: Dioptimalkan untuk chat multi-giliran, yaitu model melacak pesan sebelumnya dalam chat dan menggunakannya sebagai konteks untuk menghasilkan respons baru.
  • textembedding-gecko: Menghasilkan embedding teks untuk teks tertentu. Anda dapat menggunakan embedding untuk tugas seperti penelusuran semantik, rekomendasi, klasifikasi, dan deteksi pencilan.

Untuk mempelajari model ini lebih lanjut, lihat Model yang tersedia.

Codey API Vertex AI

Codey API Vertex AI dioptimalkan untuk mendukung pembuatan kode, chat kode, dan penyelesaian kode untuk beberapa bahasa pemrograman. Codey API Vertex AI didasarkan pada kelompok model PaLM 2. Untuk mengetahui informasi lebih lanjut, baca Ringkasan model kode.

Desain Perintah

Untuk berinteraksi dengan model dasar seperti PaLM 2, Anda perlu mengirim petunjuk bahasa natural, yang juga disebut perintah, yang memberi tahu model apa yang ingin Anda hasilkan. Namun, LLM terkadang dapat berperilaku dengan cara yang tidak dapat diprediksi. Desain perintah adalah proses iteratif uji coba yang membutuhkan waktu dan praktik untuk menguasainya. Untuk mempelajari strategi desain perintah umum, lihat Pengantar desain perintah. Untuk panduan desain perintah khusus tugas untuk teks, lihat Mendesain perintah teks.

Penyesuaian model

Jika perlu menyesuaikan model PaLM 2 untuk kasus penggunaan tertentu, Anda dapat menyesuaikan model tersebut menggunakan set data contoh input dan output. Model yang disesuaikan akan otomatis di-deploy ke endpoint baru di project Anda untuk menyajikan permintaan. Untuk mempelajari penyesuaian model lebih lanjut, lihat Menyesuaikan model dasar.

Langkah selanjutnya