Supervised learning adalah kategori machine learning yang menggunakan set data berlabel untuk melatih algoritma guna memprediksi hasil dan mengenali pola. Tidak seperti unsupervised learning, algoritma supervised learning diberi set data pelatihan berlabel untuk mempelajari hubungan antara input dan output.
Algoritma supervised machine learning memudahkan organisasi membuat model kompleks yang dapat membuat prediksi akurat. Oleh karena itu, model ini banyak digunakan di berbagai industri dan bidang, termasuk layanan kesehatan, pemasaran, jasa keuangan, dan lainnya.
Artikel ini akan membahas dasar-dasar supervised learning dalam AI, cara kerja algoritma supervised learning, dan beberapa kasus penggunaannya yang paling umum.
Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk mencoba Vertex AI dan produk Google Cloud lainnya.
Data yang digunakan dalam supervised learning diberi label. Artinya, data tersebut berisi contoh input (yang disebut fitur) dan output yang benar (label). Algoritma menganalisis set data dalam jumlah besar dari kedua komponen pelatihan ini untuk membuat inferensi tentang nilai output yang diinginkan ketika model diminta untuk membuat prediksi pada data baru.
Misalnya, katakanlah Anda ingin mengajari model untuk mengidentifikasi gambar pohon. Anda memberikan dataset berlabel yang berisi berbagai contoh jenis pohon dan nama setiap spesiesnya. Anda membiarkan algoritma mencoba menentukan serangkaian karakteristik yang dimiliki setiap pohon berdasarkan output berlabel. Kemudian, Anda dapat menguji model tersebut dengan menampilkan gambar pohon dan memintanya untuk menebak spesies pohon tersebut. Jika model memberikan jawaban yang salah, Anda dapat terus melatihnya dan menyesuaikan parameternya dengan memberikan lebih banyak contoh untuk meningkatkan akurasinya dan meminimalkan error.
Setelah model dilatih dan diuji, Anda dapat menggunakannya untuk membuat prediksi pada data baru berdasarkan pengetahuan sebelumnya yang telah dipelajari model.
Data yang digunakan dalam supervised learning diberi label. Artinya, data tersebut berisi contoh input (yang disebut fitur) dan output yang benar (label). Algoritma menganalisis set data dalam jumlah besar dari kedua komponen pelatihan ini untuk membuat inferensi tentang nilai output yang diinginkan ketika model diminta untuk membuat prediksi pada data baru.
Misalnya, katakanlah Anda ingin mengajari model untuk mengidentifikasi gambar pohon. Anda memberikan dataset berlabel yang berisi berbagai contoh jenis pohon dan nama setiap spesiesnya. Anda membiarkan algoritma mencoba menentukan serangkaian karakteristik yang dimiliki setiap pohon berdasarkan output berlabel. Kemudian, Anda dapat menguji model tersebut dengan menampilkan gambar pohon dan memintanya untuk menebak spesies pohon tersebut. Jika model memberikan jawaban yang salah, Anda dapat terus melatihnya dan menyesuaikan parameternya dengan memberikan lebih banyak contoh untuk meningkatkan akurasinya dan meminimalkan error.
Setelah model dilatih dan diuji, Anda dapat menggunakannya untuk membuat prediksi pada data baru berdasarkan pengetahuan sebelumnya yang telah dipelajari model.
Supervised learning dalam machine learning umumnya dibagi menjadi dua kategori: klasifikasi dan regresi.
Algoritma klasifikasi digunakan untuk mengelompokkan data dengan memprediksi label berkategori atau variabel output berdasarkan data input. Klasifikasi digunakan ketika variabel output bersifat kategoris, artinya memiliki dua kelas atau lebih.
Salah satu contoh paling umum penggunaan algoritma klasifikasi adalah filter spam di kotak masuk email Anda. Dalam kasus ini, model supervised learning dilatih untuk memprediksi apakah suatu email termasuk spam atau bukan dengan set data yang berisi contoh email spam dan email yang sah. Algoritma mengekstrak informasi tentang setiap email, termasuk pengirim, baris subjek, teks email, dan lainnya. Algoritma kemudian menggunakan semua informasi tersebut dan label output yang sesuai untuk mempelajari pola dan menetapkan skor yang menunjukkan apakah suatu email dianggap sah atau spam.
Algoritma regresi digunakan untuk memprediksi nilai nyata atau kontinu, yang berarti algoritma mendeteksi hubungan antara dua variabel atau lebih.
Contoh umum dari tugas regresi adalah memprediksi gaji berdasarkan pengalaman kerja. Misalnya, algoritma supervised learning akan diberi input terkait pengalaman kerja (misalnya, lama bekerja, industri atau bidang, lokasi, dll.) dan jumlah gaji yang sesuai. Setelah dilatih, model tersebut dapat digunakan untuk memprediksi gaji rata-rata berdasarkan pengalaman kerja.
Model supervised learning dapat digunakan untuk berbagai kasus penggunaan bisnis, yang dapat membantu mengatasi berbagai masalah. Berikut contoh penggunaan umum supervised learning:
Sistem rekomendasi: Algoritma supervised learning digunakan oleh platform online dan layanan streaming untuk mendukung pemberian rekomendasi berdasarkan perilaku sebelumnya atau histori belanja dari pelanggan. Model ini mengekstrak informasi penting tentang perilaku pengguna dan menyarankan produk serta konten serupa.
Perbedaan utama antara supervised learning dan unsupervised learning terletak pada jenis data input yang digunakan untuk melatih model. Supervised learning menggunakan set data pelatihan berlabel untuk mencoba dan mengajarkan tujuan spesifik yang telah ditentukan sebelumnya pada model.
Sebagai perbandingan, unsupervised learning menggunakan data tidak berlabel dan beroperasi secara mandiri untuk mencoba dan mempelajari struktur data tanpa diberi instruksi eksplisit.
Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.