Tez No İndirme Tez Künye Durumu
472898
Privacy-preserving collaborative analytics of location data / Konum verisinin gizliliğinin korunarak ortaklaşa analizi
Yazar:EMRE YILMAZ
Danışman: YRD. DOÇ. DR. ERMAN AYDAY ; PROF. DR. HAKAN FERHATOSMANOĞLU
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Konumsal veri tabanı = Spatial database ; Veri güvenliği = Data security ; Veri şifreleme = Data encryption
Onaylandı
Doktora
İngilizce
2017
114 s.
Konum verilerinden anlamlı çıkarımlar yapmak işletmelerin daha iyi kararlar vermelerine yardımcı olmaktadır. Konum analizi yapabilmek için işletmelerin müşterilerinin konumlarını bilmeleri gerekmesine rağmen çoğunlukla işletmeler bu değerli veriye sahip değillerdir. Konum verileri genellikle mobil telekomünikasyon operatörleri ve konum tabanlı servis sağlayıcılar tarafından toplanmaktadır. Bu tezde, konum verisinin ortaklaşa analiz edilebilmesi için ölçeklenebilir ve gizliliği koruyan çözümler geliştirilmiştir. İşletmelerin müşterilerinin konum bilgilerine sahip olmadıklarında kullanabilecekleri iki farklı yaklaşım türü önerilmektedir. Önerilen yaklaşımlar şirketlerin yeni şubeleri için en iyi yeri bulması problemi bağlamında açıklanmaktadır. İlk yaklaşım türü, gizliliği koruyan sorgular aracılığıyla konum verisi sahibinden müşteri konumları hakkında toplu bilgiler elde etmektir. Bu amaçla en iyi yer seçiminde kullanılabilecek toplu sorgular tanımlanmış ve bu sorguları cevaplayabilmek için güvenli iki taraflı protokoller geliştirilmiştir. Önerilen protokoller kısmi homomorfik şifreleme kullanılarak geliştirilmiştir ve ayrımsal gizliliği sağlamaktadır. İkinci yaklaşım ise bireylerin gizliliğini ihlal etmeden analiz yapmak için sentetik konum verisi yaratılmasıdır. İşletmelerin müşterilerinin konumları hakkında kısmi bilgiye sahip olduklarında en iyi yeri tahmin etmek için kullanabilecekleri komşuluk tabanlı veri üretimi yöntemi önerilmiştir. Ayrıca, konum verisi sahiplerinin, gizliliği koruyan sentetik konum verisi paylaşımında kullanabilecekleri karelere bölme ve kümeleme tabanlı veri üretim yöntemleri de önerilmiştir. Önerilen yaklaşımlar işletmelerin müşterilerinin konumlarını bilmeden en iyi yer seçimi yapmalarına yardımcı olacaktır.
Deriving meaningful insights from location data helps businesses make better decisions. While businesses must know the locations of their customers to perform location analytics, most businesses do not have this valuable data. Location data is typically collected by other services such as mobile telecommunication operators and location-based service providers. We develop scalable privacy-preserving solutions for collaborative analytics of location data. We propose two classes of approaches for location analytics when businesses do not have the location data of the customers. We illustrate both of our approaches in the context of optimal location selection for the new branches of businesses. The first type of approach is retrieving the aggregate information about the customer locations from location data owners via privacy-preserving queries. We define aggregate queries that can be used in optimal location selection and we propose secure two-party protocols for processing these queries. The proposed protocols utilize partially homomorphic encryption as a building block and satisfy differential privacy. Our second approach is to generate synthetic location data in order to perform analytics without violating privacy of individuals. We propose a neighborhood-based data generation method which can be used by businesses for predicting the optimal location when they have partial information about customer locations. We also propose grid-based and clustering-based data generation methods which can be used by location data owners for publishing privacy-preserving synthetic location data. Proposed approaches facilitate running optimal location queries by businesses without knowing their customers' locations.