Tez No |
İndirme |
Tez Künye |
Durumu |
478487
|
|
p-kazanım: Mahremiyet korumalı fayda temelli veri yayınlama modeli / p-gain: Privacy preserving utility-based data publishing model
Yazar:YILMAZ VURAL
Danışman: YRD. DOÇ. DR. MURAT AYDOS
Yer Bilgisi: Hacettepe Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
Türkçe
2017
136 s.
|
|
Veri mahremiyeti, veri sahiplerinin mahremiyet riskleri ile veri paylaşımının taraflara sağlayacağı fayda arasındaki en iyi dengeyi bulmaya çalışan zor bir problemdir. Mahremiyet korumalı yaklaşımlar veri mahremiyeti probleminin çözümünde yaygın olarak kullanılır. Mahremiyet korumalı yaklaşımların uygulanmasında anonimleştirme tekniklerinden yararlanılır. Anonimleştirme veri detaylarını azaltarak mahremiyeti koruyan fayda temelli dönüştürme tekniğidir. Anonimleştirilen veriler benzerliklerine göre eşlenik sınıf adı verilen gruplar içerisinde toplanır. Eşlenik sınıflar veri faydasına göre, fayda sağlayan (Utility Equivalence Class-UEC) ve aykırı (Outlier Equivalence Class-OEC) olmak üzere iki sınıfa ayrılır. Faydalı eşlenik sınıflar mahremiyet gereksinimlerini sağlayarak veri alıcılarına fayda sunan kayıtları içerir. Aykırı eşlenik sınıf, mahremiyet gereksinimlerini sağlayamadığı için tamamen baskılanan veri faydası olmayan kayıtları içerir. Bu çalışmada, eşlenik sınıf ayrımının veri faydası ve mahremiyet riskleri üzerindeki etkisi incelenmiş, aykırı eşlenik sınıf içerisinde yer alan kayıtların veri faydası açısından geri kazanımı konusu araştırılmıştır. Bu kapsamda mahremiyetten ödün vermeden eşlenik sınıf ayrımı yaparak veri faydasını arttıran fayda temelli ρ-Kazanım modeli önerilmiştir. Önerilen model k-Anonimlik, ℓ-Çeşitlilik ve t-Yakınlık modellerinin makul kombinasyonlarına uygulanarak test edilmiştir. Test sonuçlarının veri faydası açısından değerlendirilmesinde eşlenik sınıfları dikkate alan metrikler kullanılmıştır. Elde edilen bulgulara göre, ρ-Kazanım modeli, veri faydasında iyileşmeyi sağlarken, mahremiyet risk tahminlerinde olumsuz bir değişime yol açmamıştır. Veri mahremiyeti risklerini arttırmadan veri faydasını iyileştiren, fayda temelli ρ-Kazanım modelinin veri mahremiyeti probleminin çözümünde etkin bir rol oynayacağı gözlemlenmiştir.
|
|
Data privacy is a difficult problem that tries to find the best balance between the privacy risks of data owners and the utility of data sharing to the third parties. Anonymization is the most commonly applied technique to overcome data privacy problems. The equivalence classes, the natural outcome of anonymization process, are classified according to the data utility in two main categories: Utility and Outlier Equivalence Classes (UEC, OEC). The utility equivalence class contains records that have been suppressed by anonymization techniques for privacy concerns. Meanwhile, the outlier equivalence class contains records that have been fully suppressed by anonymization techniques resulting in no data utility. In this study, ρ-Gain model, which focus on the effect of outlier equivalence class for increasing data utility, was proposed. In the proposed model, k-Anonymity, ℓ-Diversity and t-Closeness privacy models were used together with ρ-iterations to reduce the privacy risks. The Average Equivalence Class metric was used to measure data utility. According to the findings obtained from the study, the ρ-Gain model improved the data utility, but did not cause a significant negative impact on privacy risk estimates. With the use of the proposed ρ-Gain model as an anonymization technique, we have shown that the data utility has improved while keeping the data privacy risk with no significant change. |