Apa yang dimaksud dengan model dasar?

Model dasar, yang terkadang disebut sebagai model induk, adalah model kecerdasan buatan (AI) yang canggih dan dilatih dengan sejumlah besar data serta dapat diadaptasi untuk berbagai tugas. Istilah "model dasar" diciptakan oleh Stanford Institute for Human-Centered Artificial Intelligence (HAI) pada tahun 2021.

Teknologi ini menawarkan berbagai kemungkinan baru di berbagai industri, mulai dari menyederhanakan pengembangan software hingga meningkatkan interaksi layanan pelanggan.

Pengantar model dasar di Google Cloud

Definisi model dasar

Model dasar adalah bentuk model AI yang menjalani pelatihan awal dengan sejumlah besar data untuk melakukan berbagai tugas. Proses pelatihan ini, yang sering kali menggunakan self-supervised learning, memungkinkan model mempelajari pola dan hubungan yang kompleks dalam data, sehingga membantu mereka melakukan berbagai tugas dengan akurasi yang lebih baik. Yang terpenting, skala besar ini dapat menghasilkan kemampuan yang memungkinkan model menyelesaikan tugas yang tidak dilatih secara eksplisit untuk dilakukan. Pergeseran dari alat khusus ke model serbaguna yang adaptif ini adalah ciri khas paradigma model dasar. 

Apa perbedaan antara model dasar dan LLM?

Istilah "model dasar" dan "model bahasa besar" (LLM) sering digunakan secara bergantian, tetapi ada perbedaan penting di antara keduanya. LLM adalah jenis model dasar yang utama, tetapi bukan satu-satunya jenis model dasar. Anggap saja seperti hubungan induk-turunan: semua LLM adalah model dasar, tetapi tidak semua model dasar adalah LLM.

Perbedaan utamanya adalah jenis data yang digunakan untuk membangunnya. LLM, seperti namanya, dilatih secara khusus dengan teks dan kode dalam jumlah besar. Kategori 'model dasar' yang lebih luas juga mencakup model yang dilatih dengan jenis data lain, seperti gambar, audio, dan video, atau kombinasi dari semuanya (multimodal).

Apa perbedaan antara AI generatif dan model dasar?

AI generatif dan model dasar berbeda tetapi saling terkait erat. Cara paling mudah untuk memahami perbedaannya adalah dengan menganggapnya sebagai 'mesin' vs. 'fungsi':

  • Model dasar adalah mesin terlatih yang canggih. Model ini adalah teknologi dasar yang dibangun berdasarkan data besar, dan dirancang untuk adaptasi
  • AI generatif adalah fungsi utama yang dapat dilakukan oleh mesin ini, yaitu kemampuan untuk membuat konten baru seperti teks, gambar, atau kode

Meskipun sebagian besar model dasar yang populer digunakan untuk tugas generatif, model dasar dapat diadaptasi untuk tujuan non-generatif seperti klasifikasi atau analisis yang kompleks. Oleh karena itu, tidak semua model dasar bersifat generatif, tetapi model dasar adalah teknologi utama yang mendukung gelombang aplikasi AI generatif saat ini.

Apa saja jenis model dasar?

Model dasar mencakup berbagai arsitektur, yang masing-masing dirancang dengan keunggulan dan aplikasi yang unik. Berikut beberapa jenis yang patut diperhatikan:

  • Model bahasa besar (LLM): Model ini berspesialisasi dalam memahami dan menghasilkan bahasa manusia, unggul dalam tugas seperti penerjemahan, ringkasan teks, dan interaksi chatbot.
  • Model multimodal: Dilatih dengan berbagai jenis data, termasuk teks, gambar, dan audio, model ini dapat menganalisis dan membuat konten di berbagai modalitas.
  • Jaringan saraf generatif berlawanan (GAN): GAN adalah jenis model dasar yang melibatkan dua jaringan neural yang saling bersaing dalam permainan tanpa pemenang. Salah satu jaringan, yaitu generator, membuat instance data baru, sementara jaringan lainnya, yaitu diskriminator, menilai keasliannya. Proses adversarial ini menghasilkan konten yang semakin realistis dan kompleks.
  • Model computer vision: Model ini dilatih pada set data gambar untuk melakukan tugas seperti klasifikasi gambar, deteksi objek, dan pembuatan gambar. Model ini dapat disesuaikan untuk aplikasi tertentu, seperti analisis gambar medis atau pengenalan objek pada kendaraan otonom.

Bagaimana cara kerja model dasar?

Model dasar dilatih pada set data yang luas menggunakan self-supervised learning, yang merupakan pendekatan dalam machine learning yang memanfaatkan teknik unsupervised learning untuk tugas yang secara tradisional memerlukan supervised learning (misalnya, melabeli data dengan input manusia). Hal ini membantu melatih model untuk memprediksi bagian data input yang disamarkan atau hilang. Saat model membuat prediksi, model tersebut belajar mengidentifikasi pola, hubungan, dan struktur dasar dalam data.

Proses pelatihan model dasar mirip dengan pelatihan model machine learning, dan biasanya melibatkan beberapa langkah penting:

Pengumpulan dan persiapan data

  • Set data yang besar dan beragam dikumpulkan untuk mewakili distribusi data dunia nyata yang akan ditemui oleh model selama deployment
  • Data diproses terlebih dahulu untuk menghilangkan derau, anomali, dan inkonsistensi. Hal ini dapat mencakup teknik seperti pembersihan data, normalisasi, dan rekayasa fitur

Pemilihan arsitektur model

  • Arsitektur model yang sesuai dipilih berdasarkan beberapa faktor, termasuk kompleksitas tugas, jenis dan volume data, serta resource komputasi yang tersedia
  • Arsitektur model umum yang digunakan untuk pembelajaran mandiri mencakup jaringan neural konvolusional (CNN), jaringan neural berulang (RNN), dan transformer

Pelatihan mandiri

  • Model ini dilatih menggunakan teknik self-supervised learning, yang melibatkan pembuatan label semu untuk data dan melatih model untuk memprediksi label ini
  • Hal ini dapat dilakukan menggunakan berbagai metode, seperti pembelajaran kontras, pemodelan bahasa samaran, dan teka-teki jigsaw
  • Pelatihan mandiri memungkinkan model mempelajari representasi data yang berguna tanpa bergantung pada label yang dianotasi secara manual, yang mungkin mahal dan memakan waktu untuk diperoleh

Fine tuning

  • Setelah model dilatih sebelumnya menggunakan self-supervised learning, model tersebut dapat disesuaikan pada kumpulan data yang lebih spesifik dan khusus tugas
  • Hal ini melibatkan penyesuaian parameter model untuk mengoptimalkan performa pada tugas target
  • Penyesuaian membantu model beradaptasi dengan persyaratan spesifik tugas dan meningkatkan performa secara keseluruhan

Pelatihan keselarasan dan keselamatan

  • Setelah mengalami pra-pelatihan dan penyesuaian, sebagian besar model canggih menjalani fase penyelarasan untuk memastikan outputnya bermanfaat, tidak berbahaya, dan selaras dengan intent manusia
  • Langkah penting ini sering kali menggunakan teknik seperti Reinforcement Learning from Human Feedback (RLHF) dan Direct Preference Optimization (DPO), yang mana petugas peninjau menilai respons model guna mengarahkannya ke perilaku yang lebih diinginkan

Evaluasi dan deployment

  • Setelah model dilatih dan disesuaikan, model akan dinilai pada set pengujian yang ditahan untuk mengevaluasi performanya
  • Jika model memenuhi kriteria performa yang diinginkan, model tersebut dapat di-deploy ke produksi, yang dapat digunakan untuk mengatasi masalah di dunia nyata

Manfaat menggunakan model dasar

Model dasar menawarkan beberapa potensi keuntungan bagi bisnis dan developer:

Keserbagunaan

Model dasar dapat diadaptasi untuk berbagai tugas, sehingga tidak perlu melatih model terpisah untuk setiap aplikasi tertentu. Kemampuan beradaptasi ini menjadikan LLM berharga di berbagai industri dan kasus penggunaan.

Efisiensi

Menggunakan model dasar yang telah dilatih sebelumnya dapat secara signifikan mengurangi waktu dan resource yang diperlukan untuk mengembangkan aplikasi AI baru. Penyesuaian model terlatih sering kali lebih cepat dan efisien daripada melatih model dari awal.

Akurasi

Karena pelatihan ekstensif pada set data yang besar, model dasar dapat mencapai akurasi tinggi pada berbagai tugas, sehingga mengungguli model yang dilatih pada set data yang lebih kecil.

Hemat biaya

Dengan mengurangi kebutuhan akan data pelatihan dan resource komputasi yang ekstensif, model dasar dapat menawarkan solusi hemat biaya untuk mengembangkan aplikasi AI.

Inovasi

Model dasar membantu mendorong inovasi di bidang AI, sehingga memungkinkan pengembangan aplikasi AI baru yang lebih canggih.

Skalabilitas

Model dasar dapat diskalakan untuk menangani set data besar dan tugas kompleks, sehingga cocok untuk aplikasi yang menuntut.

Apa saja tantangan dan risiko model dasar?

Meskipun memiliki manfaat yang signifikan, model dasar menghadirkan tantangan besar yang harus dihadapi pengguna dan developer:

  • Bias dan keadilan: Model dasar dapat mewarisi dan memperkuat bias sosial yang ada dalam data pelatihan yang luas, sehingga menghasilkan output yang tidak adil atau penuh prasangka
  • Halusinasi: Model dapat menghasilkan informasi yang terdengar meyakinkan tetapi faktanya salah atau tidak masuk akal, sebuah fenomena yang dikenal sebagai "halusinasi"
  • Biaya komputasi yang tinggi: Pelatihan model ini memerlukan daya komputasi dan energi yang sangat besar, sehingga menimbulkan kekhawatiran lingkungan dan finansial

Contoh model dasar

Ekosistem model dasar sangat dinamis dan kompetitif. Berikut beberapa contoh paling berpengaruh dari pemain industri utama:

  • Google: Dikenal dengan rangkaian model Gemini, serangkaian model multimodal yang canggih (Gemini 2.5 Pro adalah contoh utamanya), dan Gemma, rangkaian model ringan dan terbuka untuk developer. Google juga telah mengembangkan model khusus seperti Imagen untuk pembuatan teks ke gambar dan Veo untuk pembuatan video
  • OpenAI: Developer seri GPT (Generative Pre-trained Transformer) yang sangat berpengaruh, termasuk GPT-4 yang banyak digunakan
  • Anthropic: Berfokus pada keamanan AI dan telah mengembangkan rangkaian model Claude. Seri Claude 3 (termasuk Opus, Sonnet, dan Haiku) dikenal dengan jendela konteksnya yang besar dan kemampuan penalaran yang kuat
  • Meta: Sebagai pendukung utama AI open source, Meta mengembangkan seri Llama. Llama 3 adalah model terbuka yang telah mempercepat inovasi di seluruh komunitas
  • Mistral AI: Perusahaan Eropa yang mendapatkan daya tarik signifikan dengan model terbuka dan komersial berperforma tinggi, seperti Mistral Large dan model Mixtral open source yang menggunakan arsitektur Mixture-of-Experts (MoE) untuk efisiensi yang lebih baik

Bagaimana cara Google Cloud menggunakan model dasar?

Google Cloud menyediakan platform perusahaan end-to-end, yakni Vertex AI, yang dirancang untuk membantu organisasi mengakses, menyesuaikan, dan men-deploy model dasar untuk aplikasi dunia nyata. Strategi ini dibangun dengan memberikan pilihan, alat canggih, dan infrastruktur terintegrasi.

Berikut cara Google Cloud menggunakan model dasar:

  • Ekosistem model yang beragam dan terbuka: Melalui Vertex AI Model Garden, Google Cloud menawarkan akses ke library komprehensif yang berisi lebih dari 130 model dasar. Model dasar ini mencakup model canggih milik Google seperti rangkaian model Gemini (untuk tugas multimodal) dan Gemma (untuk pengembangan open source yang ringan), serta model pihak ketiga dan open source populer dari partner seperti Anthropic (Claude), Meta (Llama), dan Mistral. Hal ini memungkinkan developer memilih model terbaik sesuai dengan kebutuhan biaya dan performa spesifik mereka.
  • Alat untuk penyesuaian dan grounding: Vertex AI menyediakan serangkaian alat lengkap untuk melampaui perintah sederhana. Dengan Generative AI Studio, tim dapat menguji dan menyesuaikan model. Fitur utamanya adalah kemampuan untuk melakukan grounding model pada data perusahaan milik organisasi. Hal ini menghubungkan kemampuan penalaran model dengan sumber data spesifik perusahaan, sehingga secara signifikan mengurangi halusinasi dan membuat respons menjadi faktual, konsisten, dan relevan.
  • Membangun agen dan aplikasi AI: Google Cloud berfokus membantu developer membangun aplikasi AI yang canggih, bukan hanya chatbot. Dengan Vertex AI Agent Builder, organisasi dapat membuat dan men-deploy agen AI percakapan untuk layanan pelanggan, helpdesk internal, dan proses bisnis lainnya.
  • Menyematkan AI generatif ke dalam alur kerja: Model dasar diintegrasikan langsung ke dalam layanan Google Cloud yang sudah digunakan oleh para pelaku bisnis. Misalnya, Gemini Code Assist bertindak sebagai asisten berteknologi AI yang digunakan oleh developer untuk menulis, menjelaskan, dan menguji kode dengan lebih cepat, sementara fitur di BigQuery memungkinkan analisis data berbasis AI langsung di dalam data warehouse.

Langkah selanjutnya

Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.