Pembuatan Model Content-Based Filtering Dengan Algoritma K-Nearest Neighbor Pada Artikel Bahasa Indonesia Untuk Sistem Rekomendasi Situs Berita
Sistem rekomendasi merupakan alat untuk memberikan saran atau pilihan artikel yang relevan kepada pengguna ketika mengakses artikel dalam sebuah situs. Dalam penelitian ini, penulis akan merancang sistem rekomendasi otomatis untuk artikel di sebuah situs Internet. Situs yang digunakan dalam studi ini merupakan salah satu perusahaan media dan jasa hukum yang menyajikan berita dan konsultasi hukum secara online, yang didalamnya terdapat konten dengan berbagai bahasan mengenai hukum, dimana setiap konten saling berkaitan antara satu dengan lainnya. Saat ini, situs tersebut memanfaatkan sistem rekomendasi manual oleh tim konten yang dilakukan secara rutin setiap hari untuk mengaplikasikan fitur sistem rekomendasi pada halaman situs.
Content-based filtering (CBF) merupakan metode yang digunakan penulis dalam merancang sistem rekomendasi untuk merekomendasikan artikel dalam bahasa Indonesia kepada pengguna. Untuk menemukan ketegori artikel rekomendasi yang dikunjungi oleh pengguna, penulis menggunakan algoritma K-Nearest Neighbor (KNN). Pada proses identifikasi artikel yang mewakili isi dari artikel, penulis menggunakan metode Vector Space Model (VSM) sebagai representasi dari kumpulan dataset artikel teks dan kata kunci. Selanjutnya, pada proses pendekatan kesamaan artikel, penulis menggunakan metode Cosine Similarity untuk menghitung kesamaan (level of similarity) antara dua objek.
Content-based filtering (CBF) yang digunakan pada sistem rekomendasi sangat bergantung kepada preprocessing terhadap item dan klasifikasi yang dilakukan. Penulis menggunakan dataset artikel bahasa Indonesia milik situs Hukumonline dengan total 3.700 artikel yang tersebar dalam 15 kategori. Pada hasil perbandingan klasifikasi untuk pembuatan model CBF, K-Nearest Neighbor (KNN) memiliki performance yang lebih baik daripada Support Vector Macine (SVM) dan Naive Bayes (NB) dengan menggunakan dataset yang sama. Bedasarkan pelatihan dan pengujian model mengunakan klasifikasi KNN dengan K = 17 maka dihasilkan Akurasi = 0.7516214, Precision = 0.7601733, Recall = 0.7691859 , F-Measure = 0.7482909, perhitungan ini dilakukan dengan metode Confusion Matrix dan evaluasi menggunakan metode 10-Fold Cross Validation.
Kata kunci : Sistem Rekomendasi, Penyaringan Berbasis Konten, Klasifikasi, K-Nearest Neighbor
Content-based filtering (CBF) merupakan metode yang digunakan penulis dalam merancang sistem rekomendasi untuk merekomendasikan artikel dalam bahasa Indonesia kepada pengguna. Untuk menemukan ketegori artikel rekomendasi yang dikunjungi oleh pengguna, penulis menggunakan algoritma K-Nearest Neighbor (KNN). Pada proses identifikasi artikel yang mewakili isi dari artikel, penulis menggunakan metode Vector Space Model (VSM) sebagai representasi dari kumpulan dataset artikel teks dan kata kunci. Selanjutnya, pada proses pendekatan kesamaan artikel, penulis menggunakan metode Cosine Similarity untuk menghitung kesamaan (level of similarity) antara dua objek.
Content-based filtering (CBF) yang digunakan pada sistem rekomendasi sangat bergantung kepada preprocessing terhadap item dan klasifikasi yang dilakukan. Penulis menggunakan dataset artikel bahasa Indonesia milik situs Hukumonline dengan total 3.700 artikel yang tersebar dalam 15 kategori. Pada hasil perbandingan klasifikasi untuk pembuatan model CBF, K-Nearest Neighbor (KNN) memiliki performance yang lebih baik daripada Support Vector Macine (SVM) dan Naive Bayes (NB) dengan menggunakan dataset yang sama. Bedasarkan pelatihan dan pengujian model mengunakan klasifikasi KNN dengan K = 17 maka dihasilkan Akurasi = 0.7516214, Precision = 0.7601733, Recall = 0.7691859 , F-Measure = 0.7482909, perhitungan ini dilakukan dengan metode Confusion Matrix dan evaluasi menggunakan metode 10-Fold Cross Validation.
Kata kunci : Sistem Rekomendasi, Penyaringan Berbasis Konten, Klasifikasi, K-Nearest Neighbor
Moh Singgih Prastio - Personal Name
115103012 - Moh Singgih Prastio
Skripsi PTI
Indonesia
Universitas Paramadina
2019
Jakarta
LOADING LIST...
LOADING LIST...