Apa yang Dimaksud dengan Supervised Learning?

Supervised learning adalah kategori machine learning yang menggunakan set data berlabel untuk melatih algoritma guna memprediksi hasil dan mengenali pola. Tidak seperti unsupervised learning, algoritma supervised learning diberi set data pelatihan berlabel untuk mempelajari hubungan antara input dan output. 

Algoritma supervised machine learning memudahkan organisasi membuat model kompleks yang dapat membuat prediksi akurat. Oleh karena itu, model ini banyak digunakan di berbagai industri dan bidang, termasuk layanan kesehatan, pemasaran, jasa keuangan, dan lainnya. 

Artikel ini akan membahas dasar-dasar supervised learning dalam AI, cara kerja algoritma supervised learning, dan beberapa kasus penggunaannya yang paling umum.

Pelanggan baru mendapatkan kredit gratis senilai hingga $300 untuk mencoba Vertex AI dan produk Google Cloud lainnya. 

Bagaimana cara kerja supervised learning?

Data yang digunakan dalam supervised learning diberi label. Artinya, data tersebut berisi contoh input (yang disebut fitur) dan output yang benar (label). Algoritma menganalisis set data dalam jumlah besar dari kedua komponen pelatihan ini untuk membuat inferensi tentang nilai output yang diinginkan ketika model diminta untuk membuat prediksi pada data baru.

Misalnya, katakanlah Anda ingin mengajari model untuk mengidentifikasi gambar pohon. Anda memberikan dataset berlabel yang berisi berbagai contoh jenis pohon dan nama setiap spesiesnya. Anda membiarkan algoritma mencoba menentukan serangkaian karakteristik yang dimiliki setiap pohon berdasarkan output berlabel. Kemudian, Anda dapat menguji model tersebut dengan menampilkan gambar pohon dan memintanya untuk menebak spesies pohon tersebut. Jika model memberikan jawaban yang salah, Anda dapat terus melatihnya dan menyesuaikan parameternya dengan memberikan lebih banyak contoh untuk meningkatkan akurasinya dan meminimalkan error. 

Setelah model dilatih dan diuji, Anda dapat menggunakannya untuk membuat prediksi pada data baru berdasarkan pengetahuan sebelumnya yang telah dipelajari model.

Bagaimana cara kerja supervised learning?

Data yang digunakan dalam supervised learning diberi label. Artinya, data tersebut berisi contoh input (yang disebut fitur) dan output yang benar (label). Algoritma menganalisis set data dalam jumlah besar dari kedua komponen pelatihan ini untuk membuat inferensi tentang nilai output yang diinginkan ketika model diminta untuk membuat prediksi pada data baru.

Misalnya, katakanlah Anda ingin mengajari model untuk mengidentifikasi gambar pohon. Anda memberikan dataset berlabel yang berisi berbagai contoh jenis pohon dan nama setiap spesiesnya. Anda membiarkan algoritma mencoba menentukan serangkaian karakteristik yang dimiliki setiap pohon berdasarkan output berlabel. Kemudian, Anda dapat menguji model tersebut dengan menampilkan gambar pohon dan memintanya untuk menebak spesies pohon tersebut. Jika model memberikan jawaban yang salah, Anda dapat terus melatihnya dan menyesuaikan parameternya dengan memberikan lebih banyak contoh untuk meningkatkan akurasinya dan meminimalkan error. 

Setelah model dilatih dan diuji, Anda dapat menggunakannya untuk membuat prediksi pada data baru berdasarkan pengetahuan sebelumnya yang telah dipelajari model.

Jenis-jenis supervised learning

Supervised learning dalam machine learning umumnya dibagi menjadi dua kategori: klasifikasi dan regresi. 

Klasifikasi

Algoritma klasifikasi digunakan untuk mengelompokkan data dengan memprediksi label berkategori atau variabel output berdasarkan data input. Klasifikasi digunakan ketika variabel output bersifat kategoris, artinya memiliki dua kelas atau lebih.

Salah satu contoh paling umum penggunaan algoritma klasifikasi adalah filter spam di kotak masuk email Anda. Dalam kasus ini, model supervised learning dilatih untuk memprediksi apakah suatu email termasuk spam atau bukan dengan set data yang berisi contoh email spam dan email yang sah. Algoritma mengekstrak informasi tentang setiap email, termasuk pengirim, baris subjek, teks email, dan lainnya. Algoritma kemudian menggunakan semua informasi tersebut dan label output yang sesuai untuk mempelajari pola dan menetapkan skor yang menunjukkan apakah suatu email dianggap sah atau spam.

Regresi

Algoritma regresi digunakan untuk memprediksi nilai nyata atau kontinu, yang berarti algoritma mendeteksi hubungan antara dua variabel atau lebih. 

Contoh umum dari tugas regresi adalah memprediksi gaji berdasarkan pengalaman kerja. Misalnya, algoritma supervised learning akan diberi input terkait pengalaman kerja (misalnya, lama bekerja, industri atau bidang, lokasi, dll.) dan jumlah gaji yang sesuai. Setelah dilatih, model tersebut dapat digunakan untuk memprediksi gaji rata-rata berdasarkan pengalaman kerja.

Supervised learning vs. unsupervised learning

Model supervised learning dapat digunakan untuk berbagai kasus penggunaan bisnis, yang dapat membantu mengatasi berbagai masalah. Berikut contoh penggunaan umum supervised learning: 

  • Penilaian risiko: Model supervised machine learning dapat membantu bank dan perusahaan jasa keuangan lainnya menentukan apakah pelanggan cenderung akan memberikan pinjaman secara default, sehingga membantu meminimalkan risiko dalam portofolio mereka. 
  • Klasifikasi gambar: Algoritma supervised machine learning sering dilatih untuk mengklasifikasikan objek dalam gambar dan video. Misalnya, algoritma dapat digunakan untuk mengenali seseorang dalam gambar dan secara otomatis memberinya tag di platform media sosial. 
  • Deteksi penipuan: Supervised learning mendukung banyak sistem deteksi penipuan sehingga perusahaan dapat mengenali aktivitas penipuan. Model ini dilatih pada set data yang berisi aktivitas penipuan dan bukan penipuan sehingga dapat digunakan untuk menandai aktivitas mencurigakan secara real time.

Sistem rekomendasi: Algoritma supervised learning digunakan oleh platform online dan layanan streaming untuk mendukung pemberian rekomendasi berdasarkan perilaku sebelumnya atau histori belanja dari pelanggan. Model ini mengekstrak informasi penting tentang perilaku pengguna dan menyarankan produk serta konten serupa. 

Supervised learning vs. unsupervised learning

Perbedaan utama antara supervised learning dan unsupervised learning terletak pada jenis data input yang digunakan untuk melatih model. Supervised learning menggunakan set data pelatihan berlabel untuk mencoba dan mengajarkan tujuan spesifik yang telah ditentukan sebelumnya pada model.  

Sebagai perbandingan, unsupervised learning menggunakan data tidak berlabel dan beroperasi secara mandiri untuk mencoba dan mempelajari struktur data tanpa diberi instruksi eksplisit.

Mengatasi tantangan bisnis Anda dengan Google Cloud

Pelanggan baru mendapatkan kredit gratis senilai $300 untuk dibelanjakan di Google Cloud.
Hubungi spesialis penjualan Google Cloud untuk membahas tantangan unik Anda secara lebih mendetail.

Langkah selanjutnya

Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Konsol
Google Cloud