Ringkasan rekomendasi

Sistem rekomendasi adalah salah satu penerapan teknologi machine learning yang paling sukses dan luas untuk bisnis. Anda dapat menggunakan sistem rekomendasi untuk membantu pengguna menemukan konten menarik dalam banyak konten. Misalnya, Google Play Store menawarkan jutaan aplikasi, sedangkan YouTube menawarkan miliaran video, dengan lebih banyak aplikasi dan video yang ditambahkan setiap hari. Pengguna dapat menggunakan penelusuran untuk menemukan konten baru, tetapi hal ini dibatasi oleh istilah penelusuran yang mereka gunakan. Sistem rekomendasi dapat menyarankan konten yang mungkin tidak terpikirkan oleh pengguna untuk ditelusuri sendiri. Untuk informasi selengkapnya, lihat Ringkasan Sistem Rekomendasi.

Algoritma machine learning dalam sistem rekomendasi biasanya diklasifikasikan ke dalam kategori berikut:

  • Penyaringan berbasis konten: menggunakan kesamaan antar-item untuk memberikan rekomendasi. Misalnya, jika pengguna menonton dua video kucing lucu, sistem rekomendasi dapat merekomendasikan lebih banyak video hewan lucu kepada pengguna tersebut.
  • Penyaringan kolaboratif: menggunakan kesamaan antar-pengguna (berdasarkan kueri pengguna) untuk memberikan rekomendasi. Misalnya, jika pengguna A menelusuri hal yang serupa dengan pengguna B, dan pengguna B menyukai video 1, sistem rekomendasi dapat merekomendasikan video 1 kepada pengguna A, meskipun pengguna A belum menonton video yang serupa dengan video 1.

Model faktorisasi matriks

Model faktorisasi matriks banyak digunakan sebagai metode pemfilteran kolaboratif untuk sistem rekomendasi.

Dalam model faktorisasi matriks, pasangan pengguna-item dipetakan ke matriks dua dimensi, dengan pengguna unik di satu sumbu dan item unik di sumbu lainnya. Rating yang diberikan pengguna untuk item berada di sel matriks. Matriks ini tidak perlu sepenuhnya penuh; sebagian besar waktu, pengguna tidak akan memiliki nilai untuk setiap item. Tujuan model faktorisasi matriks adalah membuat dua matriks bobot yang lebih kecil dan padat yang jika dikalikan, akan mendekati nilai sel matriks asli dan memberikan prediksi rating untuk sel matriks kosong.

Salah satu matriks yang lebih kecil berisi pengguna unik pada satu sumbu dan jumlah faktor laten pada sumbu lainnya, seperti yang ditentukan oleh opsi NUM_FACTORS pernyataan CREATE MODEL. Matriks lain yang lebih kecil berisi item unik di satu sumbu dan jumlah faktor laten di sumbu lainnya. Dalam matriks ini, bobot faktor laten dihasilkan oleh algoritma yang digunakan untuk melatih model, berdasarkan kombinasi item pengguna dari matriks input.

Untuk mengetahui informasi selengkapnya, lihat Faktorisasi Matriks.

Anda dapat menggunakan model faktorisasi matriks dengan fungsi ML.RECOMMEND untuk membuat rekomendasi.

Model lain untuk rekomendasi

Untuk memperluas sistem rekomendasi berbasis pemfilteran kolaboratif di luar yang mungkin dilakukan dengan model faktorisasi matriks, Anda dapat menggunakan model jaringan neural dalam (DNN) dan Wide-and-Deep dengan fungsi ML.PREDICT untuk membuat rekomendasi. Model ini dapat menggabungkan fitur kueri dan item untuk meningkatkan relevansi rekomendasi. Untuk informasi selengkapnya, lihat referensi berikut:

Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model rekomendasi bahkan tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML, dan model rekomendasi secara khusus, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pengetahuan tentang teknik dan proses ML: