Ringkasan AI Generatif di Vertex AI

AI generatif di Vertex AI (juga dikenal sebagai genAI atau AI generatif) memberi Anda akses ke banyak model AI generatif besar sehingga Anda dapat mengevaluasi, menyesuaikan, dan men-deploy-nya untuk digunakan dalam aplikasi yang didukung AI. Halaman ini menyajikan ringkasan alur kerja AI generatif di Vertex AI, fitur dan model yang tersedia, serta mengarahkan Anda ke referensi untuk memulai.

Alur kerja AI Generatif

Diagram berikut menunjukkan ringkasan lengkap alur kerja AI generatif.

Diagram alur kerja AI Generatif

Prompt

Prompt

Alur kerja AI generatif biasanya dimulai dengan prompt. Prompt adalah permintaan yang dikirim ke model AI generatif untuk memicu respons kembali. Bergantung pada modelnya, prompt dapat berisi teks, gambar, video, audio, dokumen, dan modalitas lainnya atau bahkan beberapa modalitas (multimodal).

Membuat prompt untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain prompt. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat digunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan. Vertex AI Studio menawarkan alat pengelolaan prompt untuk membantu Anda mengelola prompt.

Foundation models

Foundation models

Perintah dikirim ke model AI generatif untuk pembuatan respons. Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API terkelola, termasuk yang berikut:

  • Gemini API: Penalaran lanjutan, chat multigiliran, pembuatan kode, dan prompt multimodal.
  • Imagen API: Pembuatan gambar, pengeditan gambar, dan pemberian teks visual.
  • MedLM: Menjawab pertanyaan dan ringkasan pertanyaan medis. (GA Pribadi)

Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Anda dapat menjelajahi model Google, serta model dan model terbuka dari partner Google, di Model Garden.

Penyesuaian model

Penyesuaian model

Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan prompt yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan prompt Anda.

Vertex AI juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar.

Minta augmentasi

Augmentasi

Vertex AI menawarkan beberapa metode augmentasi permintaan yang memberi model akses ke API eksternal dan informasi real-time.

  • Grounding: Menghubungkan respons model ke sumber kebenaran, seperti data Anda sendiri atau penelusuran web, untuk membantu mengurangi halusinasi.
  • RAG: Menghubungkan model ke sumber pengetahuan eksternal, seperti dokumen dan database, untuk menghasilkan respons yang lebih akurat dan informatif.
  • Panggilan fungsi: Memungkinkan model berinteraksi dengan API eksternal untuk mendapatkan informasi real-time dan melakukan tugas dunia nyata.

Pemeriksaan kutipan

Pemeriksaan kutipan

Setelah respons dibuat, Vertex AI akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons.

Responsible AI dan keamanan

Responsible AI dan keamanan

Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Vertex AI memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Vertex AI akan menampilkan respons penggantian.

Respons

Respons

Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming.

API dan model AI Generatif

Model AI generatif yang tersedia di Vertex AI, juga disebut model dasar, dikategorikan berdasarkan jenis konten yang dirancang untuk dihasilkannya. Konten ini mencakup teks, chat, gambar, kode, video, data multimodal, dan embedding. Setiap model diekspos melalui endpoint penayang yang khusus untuk project Google Cloud Anda, sehingga tidak perlu men-deploy model dasar tersebut, kecuali jika Anda perlu menyesuaikannya untuk kasus penggunaan tertentu.

Penawaran Gemini API

Vertex AI Gemini API berisi endpoint penayang untuk model Gemini yang dikembangkan oleh Google DeepMind.

  • Gemini 1.5 Pro (Pratinjau) mendukung perintah multimodal. Anda dapat menyertakan file teks, gambar, audio, video, dan PDF dalam permintaan perintah dan mendapatkan respons teks atau kode. Gemini 1.5 Pro (Pratinjau) dapat memproses koleksi gambar yang lebih besar, dokumen teks yang lebih besar, dan video yang lebih panjang daripada Gemini 1.0 Pro Vision.
  • Gemini 1.0 Pro dirancang untuk menangani tugas natural language, chat teks dan kode multiturn, serta pembuatan kode.
  • Gemini 1.0 Pro Vision mendukung prompt multimodal. Anda dapat menyertakan teks, gambar, video, dan PDF dalam permintaan prompt dan mendapatkan respons teks atau kode.

Tabel berikut menunjukkan beberapa perbedaan antara model Gemini yang dapat membantu Anda memilih mana yang terbaik untuk Anda:

Model Gemini Modalities Jendela konteks
Gemini 1.0 Pro / Gemini 1.0 Pro Vision
  • Teks, kode, PDF (Gemini 1.0 Pro Vision)
  • Hingga 16 gambar
  • Video berdurasi hingga 2 menit
  • 8.192 token dalam
  • 2.048 token keluar
Gemini 1.5 Pro (Pratinjau)
  • Teks, kode, gambar, audio, video, PDF
  • Hingga 3.000 gambar
  • Audio hingga 8,4 jam
  • Video dengan audio hingga 1 jam
  • 1 juta token masuk
  • 8.192 token keluar

Penawaran PaLM API

Vertex AI PaLM API berisi endpoint penayang untuk Pathways Language Model 2 (PaLM 2) Google, yang merupakan model bahasa besar (LLM) yang menghasilkan teks dan kode sebagai respons terhadap prompt natural language.

  • PaLM API untuk teks disesuaikan untuk tugas bahasa seperti klasifikasi, ringkasan, dan ekstraksi entity.
  • PaLM API untuk chat telah disesuaikan untuk chat multi-giliran, yakni model melacak pesan sebelumnya dalam chat dan menggunakannya sebagai konteks untuk menghasilkan respons baru.

Penawaran AI Generatif lainnya

  • Penyematan teks menghasilkan embedding vektor untuk teks input. Anda dapat menggunakan embeddings untuk tugas-tugas seperti penelusuran semantik, rekomendasi, klasifikasi, dan deteksi pencilan.

  • Penyematan multimodal menghasilkan embedding vektor berdasarkan input gambar dan teks. Embeddings ini nanti dapat digunakan untuk tugas berikutnya seperti klasifikasi gambar atau rekomendasi konten.

  • Imagen, model dasar teks ke gambar kami, memungkinkan Anda membuat dan menyesuaikan gambar tingkat studio dalam skala besar.

  • Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh perusahaan partner Google. Model AI generatif ini ditawarkan sebagai API terkelola. Misalnya, Anthropic menyediakan model Claude-nya sebagai layanan di Vertex AI.

  • Model terbuka, seperti Llama, tersedia untuk Anda deploy di Vertex AI atau platform lainnya.

  • MedLM adalah model dasar yang cocok untuk industri layanan kesehatan.

Sertifikasi dan kontrol keamanan

Vertex AI mendukung CMEK, Kontrol Layanan VPC, Residensi Data, dan Transparansi Akses. Ada beberapa batasan untuk fitur AI Generatif. Untuk mengetahui informasi selengkapnya, baca Kontrol keamanan AI generatif.

Mulai