Tez No İndirme Tez Künye Durumu
389478
Privacy-Preserving Ranked Search over Encrypted Cloud Data / Şifrelenmiş Bulut Verisi Üzerinde Mahremiyet Korumalı ve Sıralamalı Keime Arama
Yazar:CENGİZ ÖRENCİK
Danışman: DOÇ. DR. ERKAY SAVAŞ
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bulut bilişim = Cloud computing ; Kriptografi = Cryptography ; Mahremiyet = Privacy ; Şifreleme sistemleri = Encryption systems
Onaylandı
Doktora
İngilizce
2014
160 s.
Hem akademik hem de endüstri çevrelerinde, hassas bilgi içeren verilerin bulut hizmeti veren firmalara aktarılması akımının başlamasıyla, şifrelenmiş veri üzerinde arama yapmak çok kritik ve önemli bir işlem haline geldi. Bulut yapısının, çok yüksek depolama ve hesaplama kapasitesini uygun fiyatlarla kullanıcılara sunuyor olması, bu akımın temel çıkış noktasıdır. Problemin öneminden dolayı, şifrelenmiş veri üzerinde mahremiyet korumalı arama yapmak, literatürde farklı modeller altında geniş çaplı bir şekilde incelenmiştir. Bulut yapısının faydaları kabul edilmekle birlikte, aktarılan verilerin mahremiyeti konusu hala çözülmesi gereken bir problemdir. Sorgu sırasında gönderilen anahtar terimlerin içeriği, sorgu terimlerinin kullanım sıklığı, geri dönen verilerin içeriği, bu verilerin sorgu ile ne oranda örtüştüğü gibi bilgilerin tamamı kullanıcılarla ilgili hassas bilgiler olarak nitelendirilebilir. Mahremiyet korumalı arama metotları, bu hassas bilgilerin korunmasını hedeflemektedir. Bu çalışmada iki farklı mahremiyet korumalı anahtar kelime arama yöntemi öneriyoruz. Her iki yöntem de, hem başka kullanıcılara karşı, hem de bulut sunucusunun kendisine karşı verilerin mahremiyetini sağlıyor. Mahremiyeti sağlamak için, kriptografik yöntemlerin yanı sıra, sorguları ve dönen cevapları rastgele hale getirme yöntemlerinden de faydalanıyoruz. Güvenlik parametrelerinin doğru bir şekilde ayarlanması sağlandığı taktirde, önerdiğimiz yöntemler hem sorguların hem de buluta aktarılan verilerin mahremiyetini koruyacak niteliktedir. Önerdiğimiz yöntemler arama yapmanın dışında, eşleşen verileri sorgu ile alakalarına göre sıralama özelliğine de sahiptir. Bu özellik sayesinde sadece sorgu ile en alakalı eşleşmeler döndürülebilmektedir. Hem gerçek, hem de sentetik olarak yaratılmış veri kümeleri üzerinde yaptığımız detaylı analizler, önerdiğimiz yöntemlerin mahremiyeti koruyan ve yüksek oranda doğru sonuçları doğru bir şekilde döndürebilen yapılar olduğunu göstermektedir.
Search over encrypted data recently became a critical operation that raised a considerable amount of interest in both academia and industry, especially as outsourcing sensitive data to cloud proves to be a strong trend to benefit from the unmatched storage and computing capacities thereof. Indeed, privacy-preserving search over encrypted data, an apt term to address privacy related issues concomitant in outsourcing sensitive data, has been widely investigated in the literature under different models and assumptions. Although its benefits are welcomed, privacy is still a remaining concern that needs to be addressed. Some of those privacy issues can be summarized as: submitted search terms and their frequencies, returned responses and their relevancy to the query, and retrieved data items may all contain sensitive information about the users. In this thesis, we propose two different multi-keyword search schemes that ensure users' privacy against both external adversaries including other authorized users and cloud server itself. The proposed schemes use cryptographic techniques as well as query and response randomization. Provided that the security and randomization parameters are appropriately chosen, both search terms in queries and returned responses are protected against privacy violations. The scheme implements strict security and privacy requirements that essentially can hide similarities between queries that include same keywords. One of the main advantages of all the proposed methods in this work is the capability of multi-keyword search in a single query. We also incorporate effective ranking capabilities in the proposed schemes that enable user to retrieve only the top matching results. Our comprehensive analytical study and extensive experiments using both real and synthetic data sets demonstrate that the proposed schemes are privacy-preserving, effective, and highly efficient.