Tez No İndirme Tez Künye Durumu
668247
Adopting several models to alleviate sparsity and cold-start problems using data mining techniques for recommendation systems / Tavsiye sistemi için veri madenciliği tekniklerini kullanarak veri seyrekliğini ve soğuk başlatma sorunlarını hafifletmek için çeşitli modeller
Yazar:ALI MOHSIN AHMED AL-SABAAWI
Danışman: DR. ÖĞR. ÜYESİ YUSUF ERKAN YENİCE ; DOÇ. DR. HACER KARACAN
Yer Bilgisi: Aksaray Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2021
203 s.
Web 2.0'ın geliştirilmesi ve elde edilebilir verilerin hızlı artışı bilgi aşırı yüklemesinin üstesinden gelebilen çoklu sistemlerin ve onlar arasında da Tavsiye Sistemleri'nin evrilmesine yol açmıştır. Tavsiye Sistemleri'nin performansının büyük ölçüde seyreklik ve soğuk-başlatma problemleri tarafından sınırlandırılmış olması nedeniyle, mevcut araştırma bu problemlerin hafifletilmesini temel bir amaç olarak benimsemiştir. Bu amacın gerçekleştirilmesi için, şu dört veri madenciliği tekniği önerilmiştir: çok-aşamalı kaynak ayırma - tekil değer ayrışması (MSRA-SVD), MSRA-SVD++, kümelenen topluluk tespiti ve örtüşen topluluk tespiti. İlk iki model veri seyrekliği probleminin üstesinden gelme amacına adanmışken, kalan modeller ise soğuk-başlatma kullanıcılarının problemlerinin hafifletilmesi amacıyla benimsenmektedir. İlk iki modelin temel stratejisi sosyal ağdaki gizli ilişkilerin belirlenmesi için (MSRA) yönteminin kullanılmasıdır. MSRA yöntemi ilişki olasılığının belirlenmesi amacıyla uygulanır. Eğer olasılık bir eşik düzeyini aşarsa, bu durumda yeni bir ilişki kurulmuş olacaktır. İkinci model için (MSRA-SVD++), derecelendirme bilgileri yoluyla elde edilebilecek olan örtük geribildirim kaynağı ek bir bilgi kaynağı olarak kullanılır. Buna ek olarak, ve örtüşme modelleri de soğuk-başlatma kullanıcılarının problemlerinin hafifletilmesi amacıyla benimsenmektedir. Bu modellerin ardında yatan kümelenme temel düşünce kullanıcıların çeşitli topluluklar halinde kümelenmesi için bir kümeleme tekniğinin uygulanmasıdır. Bunun elde edilebilmesi için de, güven değerine sahip olan açık ve örtük sosyal ilişkiler entegre edilerek uzaklık değerleri hesaplanır. Buna ek olarak, medoidler etrafındaki bölüntülenme ile ilgili olarak da kümelenme algoritması benimsenir. Daha sonra, son model için tüm kümelerin ortalama uzaklıkları hesaplanır. Tüm kullanıcılar için, kullanıcılar ve belli bir kümenin merkez düğümü arasındaki mesafe hesaplanır. Eğer bu mesafe söz konusu kümenin ortalamasından daha azsa, o küme için yeni bir kullanıcı eklenecektir. Dahası, tahmin değerinin hesaplanması amacıyla her bir küme için SVD++ yöntemi kullanılır. Önerilen modeller üç adet gerçek-dünya veri kümesi kullanılarak değerlendirilir. Sonuç olarak, bulgular önerilen modellerin çeşitli en yeni çalışmaları tahmin doğruluğu bakımından nasıl geride bıraktıklarına dair kayda değer bir anlayışı sergilemiştir.
The development of Web 2.0 and the rapid growth of available data have led to the evolution of multiple systems among them the Recommendation Systems (RSs) which can handle the information overload. Due to the fact that, RSs performance is substantially limited by sparsity and cold-start problems; this research study takes the route for a major objective to attenuate these problems. To realize this objective, four data mining techniques are proposed namely: multi-steps resource allocation- singular value decomposition (MSRA-SVD), MSRA-SVD++, clustering community detection, and overlapping community detection. The first two models are dedicated to tackle the data sparsity problem whereas the rest models are adopted to alleviate cold-start users' problem. The core strategy of the first two models is to use the (MSRA) method to identify hidden relations in social network. the MSRA method is applied to determine the probability of their relation. If the probability exceeds a threshold, a new relationship will be established. For the second model (MSRA-SVD++), an implicit feedback source is exploited as an additional source of information, which can be extracted via rating information. Additionally, clustering and overlapping models are adopted to overcome cold-start user problem. The main idea of these models is to apply a clustering technique to group users into several communities. In order to attain that, explicit and implicit social relations with the confidence values are integrated to compute distance values. Additionally, the partitioning around medoids (PAM) clustering algorithm is adopted. Later, for the last model, the average distances of all clusters are computed. For all users, the distance between users and the center node of a particular cluster is computed. If the distance is less than the average of this cluster, a new user for this cluster will be added. Moreover, the SVD++ method is employed for each cluster to compute the prediction value. The proposed models are evaluated through the usage of three real-world datasets. Ultimately, findings exhibited a great deal of insights on how the proposed models outperformed a number of the state-of-the-art studies in terms of prediction accuracy.