Tez No İndirme Tez Künye Durumu
515118
Dynamic itemset hiding under multiple support thresholds / Çoklu destek eşiklerinde dinamik sık kümeler gizlemesi
Yazar:AHMET CUMHUR ÖZTÜRK
Danışman: DOÇ. DR. BELGİN ERGENÇ BOSTANOĞLU
Yer Bilgisi: İzmir Yüksek Teknoloji Enstitüsü / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2018
99 s.
Veri paylaşımı, ortak yararlar için kuruluşlar arasında yaygın olarak yapılmaktadır. Ancak, gizli bilgi, veriler yayınlanmadan önce gizlenmez ise güvenlik ve gizlilik için tehdit oluşturabilir. Gizliliği koruyan sık kümeler madenciliği hassas kümelerin herhangi bir sık küme madencilik algoritması ile ortaya çıkarılmasını önleme işlemidir. Sık kümelerin gizlenmesindeki kısıtlama hassas eşiktir. Belirli bir hassas kümenin desteği hassas eşiğin altında ise bu hassas küme ilgi çekmez ve gizli olarak kabul edilir. Önceden tanımlanmış hassas eşik altındaki hassas kümelerin desteğini azaltmanın olası bir yolu, bir dizi kayıtdan öğeleri silmektir. Bu tür temizleme işlemi bozma esaslı sık küme gizlemesi olarak adlandırılır. Bu tezin ana odak noktası, hassas kümeleri hem statik hem de dinamik ortamlarda çoklu hassas destek eşiklerini dikkate alarak korumaktır. Üç farklı bozma esaslı sık küme gizleme algoritması; Pseodo Graph Based Sanitization (PGBS), Itemset Oriented Pseudo Graph Based Sanitization (IPGBS) ve DynamicPGBS önerilmiştir. Hem PGBS hem de IPGBS algoritmaları statik ortam için tasarlanmıştır ve DynamicPGBS algoritması dinamik ortam için tasarlanmıştır. Bu üç algoritmanın temel amacı, temizlenmiş veri tabanında tüm hassas kümelerin saklanması, hassas olmayan bilgi ve verilerde ise en az bozulma oluşturmaktır.
Data sharing is commonly performed between organizations for mutual benefits. However, if confidential knowledge is not hidden before the data is published it may pose threat to security and privacy. The privacy preserving frequent itemset mining is the process of hiding sensitive itemsets from being discovered with any frequent itemset mining algorithm. The privacy constraint of sensitive itemset hiding is sensitive threshold. If support of a given sensitive itemset is under the sensitive threshold, then this sensitive itemset is considered as non-interesting and hidden. One possible way of decreasing support of sensitive itemsets under predefined sensitive threshold is deleting items from a set of transaction. This type of frequent itemset sanitization is called distortion based frequent itemset hiding. The main focus of this thesis is to preserve sensitive itemsets with considering the multiple sensitive thresholds on both static and dynamic environments. Three different distortion based frequent itemset hiding algorithms proposed; Pseodo Graph Based Sanitization (PGBS), Itemset Oriented Pseudo Graph Based Sanitization (IPGBS) and DynamicPGBS are proposed. Both PGBS and IPGBS algorithms are designed for static environment and the DynamicPGBS algorithm is designed for the dynamic environment. The main objective of these three algorithms is to hide all sensitive itemsets with giving minimum distortion on non-sensitive knowledge and data in the resulting sanitized database.