A Comparative Study of Autoencoder Approaches to the Data Sparsity Problem in Recommender Systems

dc.contributor.authorBölük, Ecem
dc.contributor.authorCingiz, Mustafa Özgür
dc.date.accessioned2026-02-08T15:03:02Z
dc.date.available2026-02-08T15:03:02Z
dc.date.issued2022
dc.departmentBursa Teknik Üniversitesi
dc.description.abstractRecommendation systems are systems that predict future preferences of users based on their past preferences. However, users may not always indicate their preferences to the systems. This causes data sparseness, which is one of the biggest problems when designing recommender systems. Autoencoders from deep learning algorithms solve the data sparsity problem by re-populating the sparse user matrix based on insights learned from the data. In this study, performances of deep learning algorithms were compared against data sparsity by using four different autoencoder models, namely Vanilla Autoencoder, Denoising Autoencoder, Sparse Autoencoder and Variational Autoencoder. The MovieLens-100K dataset, which contains 93.6% sparse data, was used as the data set. It has been observed that automatic encoder models provide more successful results in item-based recommendation systems than user based recommendation systems. It has been observed that Vanilla Autoencoder provides better performance in item-based recommendation systems, while Vanilla Autoencoder and Sparse Autoencoder provide very close performance in user-based recommendation systems.
dc.description.abstractÖneri sistemleri kullanıcıların geçmişteki tercihlerinden hareketle gelecekteki tercihlerini tahmin eden sistemlerdir. Fakat kullanıcılar her zaman tercihlerini sistemlere belirtmeyebilir. Bu durum, öneri sistemleri tasarlanırken karşılaşılan en büyük sorunlardan biri olan veri seyrekliğine neden olur. Derin öğrenme algoritmalarından otomatik kodlayıcılar, seyrek kullanıcı matrisini verilerden öğrendiği iç görülerden hareketle yeniden doldurarak veri seyrekliği probleminin çözülmesini sağlar. Bu çalışmada derin öğrenme algoritmalarından Temel Otomatik Kodlayıcı, Gürültü Giderici Otomatik Kodlayıcı, Seyrek Otomatik Kodlayıcı ve Varyasyonel Otomatik Kodlayıcı olmak üzere dört farklı otomatik kodlayıcı modeli kullanılarak veri seyrekliğine karşı performansları karşılaştırılmıştır. Veri seti olarak %93,6 oranında seyrek veri içeren MovieLens-100K veri seti kullanılmıştır. Otomatik kodlayıcı modelleri öğe tabanlı öneri sistemlerinde kullanıcı tabanlı öneri sistemlerine göre daha başarılı sonuçlar sağladığı gözlemlenmiştir. Öğe tabanlı öneri sistemlerde Temel Otomatik Kodlayıcı daha iyi performans sağlarken, kullanıcı tabanlı öneri sistemlerinde ise Temel Otomatik Kodlayıcı ve Seyrek Otomatik Kodlayıcı birbirlerine çok yakın bir performans sağladıkları gözlemlenmiştir.
dc.identifier.doi10.53070/bbd.1173564
dc.identifier.endpage184
dc.identifier.issn2548-1304
dc.identifier.issn2548-1304
dc.identifier.startpage177
dc.identifier.urihttps://doi.org/10.53070/bbd.1173564
dc.identifier.urihttps://hdl.handle.net/20.500.12885/3818
dc.identifier.volumeIDAP-2022 : International Artificial Intelligence and Data Processing Symposium
dc.language.isotr
dc.publisherAli KARCI
dc.relation.ispartofBilgisayar Bilimleri
dc.relation.ispartofComputer Science
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_DergiPark_20260207
dc.subjectArtificial Intelligence
dc.subjectYapay Zeka
dc.titleA Comparative Study of Autoencoder Approaches to the Data Sparsity Problem in Recommender Systems
dc.title.alternativeÖneri Sistemlerinde Veri Seyrekliği Problemine Otomatik Kodlayıcı Yaklaşımlarının Karşılaştırmalı Bir Çalışması
dc.typeArticle

Dosyalar