Ringkasan AI Generatif di Vertex AI

AI Generatif di Vertex AI (juga dikenal sebagai genAI atau AI generatif) memberi Anda akses ke model AI generatif besar Google sehingga Anda dapat menguji, menyesuaikan, dan men-deploy model tersebut untuk digunakan dalam aplikasi Anda yang didukung AI. Halaman ini menyajikan ringkasan alur kerja AI generatif di Vertex AI, fitur dan model yang tersedia, serta mengarahkan Anda ke referensi untuk memulai.

Alur kerja AI Generatif

Diagram berikut menunjukkan ringkasan lengkap alur kerja AI generatif.

Diagram alur kerja AI Generatif

Prompt

Prompt

Alur kerja AI generatif biasanya dimulai dengan prompt. Prompt adalah permintaan bahasa alami yang dikirim ke model bahasa untuk mendapatkan respons. Menulis prompt untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain prompt. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat digunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan.

Model dasar

Model dasar

Perintah dikirim ke model untuk pembuatan respons. Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API, termasuk hal berikut:

  • Gemini API: Penalaran lanjutan, chat multigiliran, pembuatan kode, dan prompt multimodal.
  • PaLM API: Tugas bahasa natural, embedding teks, dan chat multigiliran.
  • Codey API: Pembuatan kode, pelengkapan kode, dan chat kode.
  • Imagen API: Pembuatan gambar, pengeditan gambar, dan pemberian teks visual.
  • MedLM: Menjawab pertanyaan dan ringkasan pertanyaan medis. (GA Pribadi)

Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Anda dapat menjelajahi model OSS dan model eksklusif Google di Model Garden.

Penyesuaian model

Penyesuaian model

Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan prompt yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan prompt Anda.

Vertex AI juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar.

Layanan Grounding Vertex AI

Grounding

Jika Anda menginginkan respons model didasarkan pada sumber kebenaran, seperti korpus data Anda sendiri, Anda dapat menggunakan landasan di Vertex AI. Grounding membantu mengurangi halusinasi model, terutama pada topik yang tidak diketahui, dan juga memberi model akses ke informasi baru.

Pemeriksaan kutipan

Pemeriksaan kutipan

Setelah respons dibuat, Vertex AI akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons.

Responsible AI dan keamanan

Responsible AI dan keamanan

Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Vertex AI memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Vertex AI akan menampilkan respons penggantian.

Respons

Respons

Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming.

API dan model AI Generatif

Model AI generatif yang tersedia di Vertex AI, juga disebut model dasar, dikategorikan berdasarkan jenis konten yang dirancang untuk dihasilkannya. Konten ini mencakup teks, chat, gambar, kode, video, data multimodal, dan embedding. Setiap model diekspos melalui endpoint penayang yang khusus untuk project Google Cloud Anda, sehingga tidak perlu men-deploy model dasar tersebut, kecuali jika Anda perlu menyesuaikannya untuk kasus penggunaan tertentu.

Penawaran Gemini API

Vertex AI Gemini API berisi endpoint penayang untuk model Gemini yang dikembangkan oleh Google DeepMind.

  • Gemini 1.0 Pro dirancang untuk menangani tugas natural language, chat teks dan kode multiturn, serta pembuatan kode.
  • Gemini 1.0 Pro Vision mendukung prompt multimodal. Anda dapat menyertakan teks, gambar, dan video dalam permintaan perintah dan mendapatkan respons teks atau kode.

Penawaran PaLM API

Vertex AI PaLM API berisi endpoint penayang untuk Pathways Language Model 2 (PaLM 2) Google, yang merupakan model bahasa besar (LLM) yang menghasilkan teks dan kode sebagai respons terhadap prompt natural language.

  • PaLM API untuk teks disesuaikan untuk tugas bahasa seperti klasifikasi, ringkasan, dan ekstraksi entity.
  • PaLM API untuk chat telah disesuaikan untuk chat multi-giliran, yakni model melacak pesan sebelumnya dalam chat dan menggunakannya sebagai konteks untuk menghasilkan respons baru.

Penawaran AI Generatif lainnya

  • Codey API menghasilkan kode. Codey API menyertakan tiga model yang membuat kode, menyarankan kode untuk penyelesaian kode, dan memungkinkan developer melakukan chat untuk mendapatkan bantuan dengan pertanyaan terkait kode. Untuk mengetahui informasi lebih lanjut, baca Ringkasan model kode.

  • Text Embedding API menghasilkan embedding vektor untuk teks input. Anda dapat menggunakan embedding untuk tugas seperti penelusuran semantik, rekomendasi, klasifikasi, dan deteksi pencilan.

  • Embedding multimodal menghasilkan vektor embedding berdasarkan input gambar dan teks. Embedding ini nantinya dapat digunakan untuk tugas-tugas berikutnya seperti klasifikasi gambar atau rekomendasi konten. Untuk informasi selengkapnya, lihat halaman embedding multimodal.

  • Imagen, model dasar teks ke gambar, memungkinkan organisasi membuat dan menyesuaikan gambar tingkat studio dalam skala besar untuk kebutuhan bisnis apa pun. Untuk informasi selengkapnya, lihat ringkasan Imagen di Vertex AI.

  • MedLM adalah model dasar yang disesuaikan untuk industri perawatan kesehatan. Untuk mengetahui informasi selengkapnya, lihat Ringkasan model MedLM.

Vertex AI Studio

Vertex AI Studio adalah alat konsol Google Cloud untuk membuat prototipe dan menguji model AI generatif dengan cepat. Anda dapat menguji contoh perintah, mendesain perintah Anda sendiri, dan menyesuaikan model dasar untuk menangani tugas yang memenuhi kebutuhan aplikasi Anda. Halaman ini memperkenalkan berbagai tugas yang dapat Anda lakukan di Vertex AI Studio, termasuk hal berikut:

  • Menguji model menggunakan contoh perintah.
  • Merancang dan menyimpan perintah Anda sendiri.
  • Menyesuaikan model dasar.
  • Melakukan konversi antara ucapan dan teks.

Menguji model menggunakan contoh perintah

Prompt Gallery, di bagian Language di Vertex AI Studio, berisi berbagai contoh perintah yang telah didesain sebelumnya untuk membantu menunjukkan kemampuan model. Contoh perintah dikategorikan berdasarkan jenis tugas, seperti ringkasan, klasifikasi, dan ekstraksi. Setiap perintah dikonfigurasi dengan model dan parameter value yang ditentukan, sehingga Anda cukup membuka contoh perintah dan mengklik Submit agar model dapat menghasilkan respons.

prompt-ui

Mendesain dan menyimpan perintah Anda sendiri

Prompt design adalah proses pembuatan perintah secara manual yang mendapatkan respons yang diinginkan dari model bahasa. Dengan menyusun perintah secara cermat, Anda dapat mendorong model untuk memberikan hasil yang diinginkan. Prompt design dapat menjadi cara yang efisien untuk bereksperimen, yaitu mengadaptasi model bahasa untuk kasus penggunaan tertentu.

Anda dapat membuat dan menyimpan prompt Anda sendiri di Vertex AI Studio. Saat membuat perintah baru, Anda memasukkan teks perintah, menentukan model yang akan digunakan, mengonfigurasi parameter value, dan menguji perintah dengan membuat respons. Anda dapat melakukan iterasi perintah dan konfigurasinya hingga mendapatkan hasil yang diinginkan. Setelah selesai mendesain prompt, Anda dapat menyimpannya di Vertex AI Studio.

Kutipan respons

Jika menggunakan model teks di Vertex AI Studio seperti text-bison, Anda akan menerima respons teks berdasarkan input. Fitur kami ditujukan untuk menghasilkan konten asli dan tidak mereplikasi konten yang sudah ada. Jika Vertex AI Studio mengutip secara mendetail suatu halaman web, Vertex AI Studio akan mengutip halaman tersebut dalam output.

text-citation

Anda dapat mengubah kualitas respons dengan menyesuaikan suhu (keacakan output), dan bereksperimen dengan parameter respons lainnya di Vertex AI Studio.

Kutipan tersedia di Vertex AI Studio dan tersedia di API. Untuk mempelajari Responsible AI dan kutipan lebih lanjut, lihat Metadata kutipan.

Mempelajari model AI generatif di Model Garden

Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model dan aset OSS tertentu serta eksklusif Google. Untuk mempelajari model dan API AI generatif yang tersedia di Vertex AI, buka Model Garden di Konsol Google Cloud.

Buka Model Garden

Untuk mempelajari lebih lanjut Model Garden, termasuk model dan kemampuan yang tersedia, lihat Mempelajari model AI di Model Garden.

Menyesuaikan model dasar

Meskipun prompt design sangat cocok untuk eksperimen cepat, jika data pelatihan tersedia, kualitas yang lebih tinggi dapat dicapai dengan menyesuaikan model itu sendiri. Dengan menyesuaikan model, Anda dapat menyesuaikan respons model berdasarkan contoh tugas yang Anda inginkan untuk dilakukan oleh model.

Untuk mempelajari cara menyesuaikan model dasar, lihat Menyesuaikan model dasar.

Mengonversi antara ucapan dan teks

Dalam alat ucapan Vertex AI Studio, Anda dapat mengambil cuplikan teks dan mengonversinya menjadi file audio ucapan yang dapat diputar dan didownload. Anda dapat memilih dari beberapa suara dan menyesuaikan kecepatan ucapan.

Sebaliknya, jika memiliki file audio ucapan, Anda juga dapat menguploadnya ke Vertex AI Studio dan mentranskripsikannya menjadi teks.

Untuk mempelajari lebih lanjut, lihat halaman berikut:

Coba Vertex AI Studio

Vertex AI Studio berada di halaman Vertex AI pada konsol Google Cloud.

Buka Vertex AI Studio

Sertifikasi dan kontrol keamanan

Vertex AI mendukung CMEK, Kontrol Layanan VPC, Residensi Data, dan Transparansi Akses. Ada beberapa batasan untuk fitur AI Generatif. Untuk mengetahui informasi selengkapnya, baca Kontrol keamanan AI generatif.

Mulai