Tez No İndirme Tez Künye Durumu
446720
Developing techniques for robustness of privacy-preserving distributed collaborative filtering / Gizliliği koruyan dağıtık veri tabanlı ortak filtreleme metotlarının gürbüzlüğü için teknikler geliştirilmesi
Yazar:BURCU YILMAZEL
Danışman: DOÇ. DR. CİHAN KALELİ
Yer Bilgisi: Anadolu Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Dağıtık sistemler = Distributed systems ; Gizlilik = Privacy ; İş birliği = Cooperation
Onaylandı
Doktora
İngilizce
2016
170 s.
Ortak filtreleme sistemlerinde başarıya ulaşabilmek için yeterli ve uygun veriye sahip olmak gerekir. Internet alışverişlerindeki kullanıcı tercihleri ve e-ticaret firmalarındaki çeşitlilikten dolayı, analiz için kullanılabilecek veri birçok farklı kaynağa dağılmış durumdadır. Nitelikli verinin azlığı, özellikle yeni kurulan firmalar için, öneri hizmetlerinin sağlanmasında önemli bir sorun teşkil eder. Bu sorunun çözümü için dağıtık veri üzerinde işbirliği yapılması, bu işbirliği esnasında da gizliliğin korunması önemli bir araştırma konusu haline gelmiştir. Dağıtık ortak filtreleme üzerine yapılmış birçok çalışma bulunmaktadır. Bu çalışmalar ile online sağlayıcıların gizlilik ilkelerini ihlal etmeden işbirliğinde bulunmaları sağlanmıştır. Fakat bu çalışmalar, ataklara karşı gürbüzlük açısından değerlendirilmemiştir. Sahte profil enjeksiyonu ile gizlilik koruyan, dağıtık ortak filtreleme algoritmalarının sonuçlarına müdahale edilebilirse, shilling ataklar işbirliğine engel oluşturabilir. Shilling ataklarına karşı sistemine güven duymayan bir online sağlayıcı, daha iyi öneri hizmeti sunabilme fırsatına karşın işbirliğinden kaçınabilir. Bu tezde, gizlilik koruyan dağıtık ortak filtreleme yöntemlerinin, gelişigüzel dağıtılmış veride shilling ataklara karşı gürbüzlüğü incelenmiştir. Gelişigüzel dağıtılmış veri üzerine uygulanabilecek yeni bir atak stratejisi belirlenmiş ve bu strateji daha önceki atak modellerinin dağıtık uyarlamalarının oluşturulmasında kullanılmıştır. Deneysel çalışmalar, öne sürülen strateji ile oluşturulan atakların tahmin edilen sonuçları değiştirmede etkili olduğunu, dolayısıyla da bu sistemlerin gizliliğe rağmen saldırılara açık olduğunu göstermiştir. Mevcut shilling atak tespit yöntemlerinin, gelişigüzel dağıtık veride uygulanamamasının nedenleri açıklanmıştır. Bu algoritmaları ataklardan korumak için, çok iyi bilinen sınıflandırma tabanlı bir tespit yönteminin dağıtık versiyonu öne sürülmüştür. Gerçek veri kullanılarak yapılan deneyler, öne sürülen yöntemin atak profillerini gizlilik kuralları çerçevesinde tespit edebildiğini göstermiştir. Ayrıca, dağıtık atakların tespiti için tarafların işbirliğinin gerekliliği deneysel analizlerle kanıtlanmıştır.
Success of collaborative filtering systems strongly depend on having adequate data. Due to customers' shopping habits and increasing number of e-commerce sites, data collected for referral purposes might be distributed among various sites. Therefore, especially for newly established companies, offering recommendation services might turn out to be a trouble, due to lack of qualified data. To overcome this challenge, collaboration of online vendors on distributed data while preserving privacy has become an important topic. Researchers have proposed several privacy-preserving distributed collaborative filtering schemes, which enable collaboration of online vendors, even the competing ones, on distributed data without jeopardizing privacy. However, such schemes have not been evaluated in terms of robustness against attacks. If manipulating the outcomes of privacy-preserving distributed collaborative filtering algorithms by injecting fake profiles is possible, shilling attacks might be an obstacle for collaboration. Online vendors, who are unsure of being subject to shilling attacks, might refrain from cooperation, even if they need it for offering more useful recommendation services to their customers. In this dissertation, robustness of state-of-the-art privacy-preserving distributed collaborative filtering schemes proposed for arbitrarily distributed data are analyzed against shilling attacks. A new attack strategy that can be applied on arbitrarily distributed data, and used in generation of distributed adaptations of formerly proposed attack models is outlined. Empirical studies show that attacks generated by the proposed strategy are effective in manipulating predicted outcomes, hence, despite privacy, these schemes are not resistant to attacks. The reasons of why existing shilling attack detection methods cannot be directly employed on arbitrarily distributed data are discussed. To protect these algorithms against attacks, distributed version of a well-known classification-based attack detection method is proposed, which can operate on arbitrarily distributed data. Real data-based experiments demonstrate that the proposed detection method is able to identify distributed attack profiles on arbitrary data with privacy. Moreover, the need for collaboration in detection of distributed attacks is exposed with experimental analyzes.