Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Panduan pemula AI generatif

Panduan pemula ini memperkenalkan teknologi inti AI generatif kepada Anda dan menjelaskan cara teknologi tersebut cocok untuk mendukung chatbot dan aplikasi. AI generatif (juga dikenal sebagai genAI atau gen AI) adalah bidang machine learning (ML) yang mengembangkan dan menggunakan model ML untuk menghasilkan konten baru.

Model AI generatif sering disebut model bahasa besar (LLM) karena ukuran dan kemampuannya yang besar untuk memahami dan menghasilkan bahasa alami. Namun, bergantung pada data yang digunakan untuk melatih model, model ini dapat memahami dan menghasilkan konten dari berbagai modalitas, termasuk teks, gambar, video, dan audio. Model yang berfungsi dengan beberapa modalitas data disebut model multimodal.

Google menyediakan rangkaian model AI generatif Gemini yang dirancang untuk kasus penggunaan multimodal; mampu memproses informasi dari beberapa modalitas, termasuk gambar, video, dan teks.

Pembuatan konten

Agar model AI generatif dapat menghasilkan konten yang berguna dalam aplikasi dunia nyata, model tersebut harus memiliki kemampuan berikut:

Pelajari cara melakukan tugas baru:

Model AI generatif dirancang untuk melakukan tugas umum. Jika ingin model melakukan tugas yang unik untuk kasus penggunaan Anda, Anda harus dapat menyesuaikan model. Di Vertex AI, Anda dapat menyesuaikan model melalui penyesuaian model.
Mengakses informasi eksternal:

Model AI generatif dilatih menggunakan data dalam jumlah besar. Namun, agar model ini berguna, model tersebut harus dapat mengakses informasi di luar data pelatihannya. Misalnya, jika Anda ingin membuat chatbot layanan pelanggan yang didukung oleh model AI generatif, model tersebut harus memiliki akses ke informasi tentang produk dan layanan yang Anda tawarkan. Di Vertex AI, Anda menggunakan fitur grounding dan panggilan fungsi untuk membantu model mengakses informasi eksternal.
Memblokir konten berbahaya:

Model AI generatif mungkin menghasilkan output yang tidak Anda harapkan, termasuk teks yang menyinggung atau tidak sensitif. Untuk menjaga keamanan dan mencegah penyalahgunaan, model memerlukan filter keamanan untuk memblokir perintah dan respons yang ditentukan berpotensi berbahaya. Vertex AI memiliki fitur keamanan bawaan yang mendorong penggunaan layanan AI generatif kami secara bertanggung jawab.

Diagram berikut menunjukkan cara kerja berbagai kemampuan ini bersama-sama untuk membuat konten yang Anda inginkan:

Diagram alur kerja AI Generatif

Prompt

Alur kerja AI generatif biasanya dimulai dengan prompt. Perintah adalah permintaan bahasa alami yang dikirim ke model AI generatif untuk mendapatkan respons. Bergantung pada modelnya, perintah dapat berisi teks, gambar, video, audio, dokumen, dan modalitas lainnya atau bahkan beberapa modalitas (multimodal).

Membuat perintah untuk mendapatkan respons yang diinginkan dari model adalah praktik yang disebut desain perintah. Meskipun desain prompt merupakan proses uji coba, ada prinsip dan strategi desain prompt yang dapat digunakan untuk mendorong model agar berperilaku dengan cara yang diinginkan. Vertex AI Studio menawarkan alat pengelolaan perintah untuk membantu Anda mengelola perintah.

Model dasar

Perintah dikirim ke model AI generatif untuk pembuatan respons. Vertex AI memiliki berbagai model dasar AI generatif yang dapat diakses melalui API terkelola, termasuk:

Gemini API: Penalaran lanjutan, chat multi-giliran, pembuatan kode, dan perintah multimodal.
Imagen API: Pembuatan gambar, pengeditan gambar, dan pemberian teks visual.
MedLM: Peringkasan dan jawaban pertanyaan medis. (Tidak digunakan lagi)

Model tersebut memiliki ukuran, modalitas, dan biaya yang berbeda. Anda dapat menjelajahi model Google, serta model terbuka dan model dari partner Google, di Model Garden.

Penyesuaian model

Anda dapat menyesuaikan perilaku default model dasar Google agar dapat secara konsisten memberikan hasil yang diinginkan tanpa menggunakan prompt yang kompleks. Proses penyesuaian ini disebut penyesuaian model. Penyesuaian model membantu Anda mengurangi biaya dan latensi permintaan dengan memungkinkan Anda menyederhanakan prompt Anda.

Vertex AI juga menawarkan alat evaluasi model untuk membantu Anda mengevaluasi performa model yang disesuaikan. Setelah model yang disesuaikan siap produksi, Anda dapat men-deploy-nya ke endpoint dan memantau performa seperti dalam alur kerja MLOps standar.

Mengakses informasi eksternal

Vertex AI menawarkan beberapa cara untuk memberi model akses ke API eksternal dan informasi real-time.

Grounding: Menghubungkan respons model ke sumber tepercaya, seperti data Anda sendiri atau penelusuran web, yang membantu mengurangi halusinasi.
RAG: Menghubungkan model ke sumber pengetahuan eksternal, seperti dokumen dan database, untuk menghasilkan respons yang lebih akurat dan informatif.
Panggilan fungsi: Memungkinkan model berinteraksi dengan API eksternal untuk mendapatkan informasi real-time dan melakukan tugas dunia nyata.

Pemeriksaan kutipan

Setelah respons dibuat, Vertex AI akan memeriksa apakah kutipan perlu disertakan dalam respons atau tidak. Jika sejumlah besar teks dalam respons berasal dari sumber tertentu, sumber tersebut akan ditambahkan ke metadata kutipan dalam respons.

Responsible AI dan keamanan

Lapisan pemeriksaan terakhir yang melewati prompt dan respons sebelum ditampilkan adalah filter keamanan. Vertex AI memeriksa prompt dan respons untuk mengetahui seberapa banyak prompt atau respons yang termasuk dalam kategori keamanan. Jika nilai minimum untuk satu atau beberapa kategori terlampaui, respons akan diblokir dan Vertex AI akan menampilkan respons penggantian.

Respons

Jika prompt dan respons lulus pemeriksaan filter keamanan, respons akan ditampilkan. Biasanya, respons ditampilkan sekaligus. Namun, dengan Vertex AI, Anda juga dapat menerima respons secara bertahap karena peristiwa tersebut dihasilkan dengan mengaktifkan streaming.