Tez No İndirme Tez Künye Durumu
693935
Etkin gizlilik koruması için rasgele sayı üreticine dayalı veri anonimizasyon modelinin geliştirilmesi / Development of data anonymization model based on random number generator for efficient privacy preserving
Yazar:MERVE KANMAZ
Danışman: PROF. DR. AHMET SERTBAŞ ; DOÇ. DR. MUHAMMED ALİ AYDIN
Yer Bilgisi: İstanbul Üniversitesi-Cerrahpaşa / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
96 s.
Teknolojinin hızlı gelişimi ve hayatımızın her alanına girmesi sonucunda verinin hacmi ve değeri oldukça önemli bir çalışma alanı olmuştur. Verinin bu denli kıymetlenmesi kişilerin bilgileri açısından bazı sonuçlar doğurmuştur. Veri kimliksizleştirme, kişisel verilerin güvenliği açısından bu konulardan en önemlisidir. Bu alanda birçok çalışma yapılmıştır ve yapılmaya devam edilmektedir. Bu çalışmada ise hassas niteliklerin kimliksizleştirilmesi için RSUGP isimli bir yöntem önerilmiştir. Geometrik veri pertürbasyonunda klasik olarak kullanılan gauss gürültüsü ya da rasgele gürültü yöntemlerinin yerine rasgele sayı üreteçlerine bağlı yeni bir gürültü modeli önerilmiştir. Önerilen RSUGP yöntemi Hadoop dosya sistemi HDFS üzerinde tutulan veri setlerinin Apache Spark ile işlenmesi sonrasında sınıflandırma doğruluğu, F- ölçütü, atak dayanıklılığı açısından 6 farklı veri tabanı ve 4 farklı sınıflandırma yöntemi ile test edilmiş, bulgular sonuçlar kısmında paylaşılmıştır. Sonuçlar önerilen yöntemin sınıflandırma doğruluğu, atak dayanıklılığı ve çalışma zamanı açısından kıyaslanan diğer yöntemlere göre daha başarılı olduğunu ortaya koymuştur.
With the technology's rapid development and its involvement in all areas of our lives, the volume and value of data have become a significant field of study. Valuation of the data to this extent has produced some consequences in terms of people's knowledge. Data anonymization is the most important of these issues in terms of the security of personal data. Much work has been done in this area and continues to being done. In this study, we proposed a method called RSUGP for the anonymization of sensitive attributes. A new noise model based on random number generators has been proposed instead of the Gaussian noise or random noise methods, which are being used conventionally in geometric data perturbation. The proposed RSUGP method has been tested with 6 different databases and 4 different classification methods in terms of classification accuracy, F- score, attack resistance, execution time and Friedman rank test. After the data sets kept on the Hadoop file system HDFS are processed with Apache Spark, and the findings are shared in the results section. Experiments show that the proposed method was more successful than the other two classification accuracy, attack resistance, and runtime