Tez No İndirme Tez Künye Durumu
485227
Privacy preserving search and data retrieval from data clouds / Veri bulutlarında mahremiyet korumalı arama ve veri getirme yontemi
Yazar:MOHANAD DAWOUD
Danışman: DOÇ. DR. DENİZ TURGAY ALTILAR
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgi ve Belge Yönetimi = Information and Records Management ; Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2017
134 s.
Son zamanlarda, bulut bilişim sistemleri, Bilgi Teknolojisi (BT) uygulamaları alanındaki en önemli gelişmelerden biri olarak görülüyor. Bulut sistemlerinde saklanan ve işlenen veriler, her geçen gün büyük bir hızla artmakta. Verilerin her noktadan erişilebilir olması, merkezi veri depolama ve merkezi işlem kapasitesi sayesinde verimliliği artırması, bir çok uygulamayı yüksek altyapı maliyetlerinden kurtarması, esnek ve ölçeklenebilir çözümler sunması nedeniyle, kullanımı yaygınlaşıyor. Bununla birlikte, güvenlik ve mahremiyet endişeleri, veri üzerinde yüksek seviyede gizlilik ve güvenlik gerektiren, özel kişisel bilgiler içeren veya güvenlik açıklarının maddi kayıplara yol açabileceği hassas uygulamalarda bulut bilişim sistemlerinin daha hızlı yaygınlaşmasına ve daha fazla alanda kullanılmasına engel olmaktadır. Özellikle mahrem bilgilerin yoğun şekilde bulunduğu, kamu, bankacılık ve finans, telekomünikasyon ve sağlık sektörlerinde bulut sistemleri kullanımının yaygınlaşması, güvenlik endişeleri nedeniyle, diğer alanlara kıyasla önemli ölçüde yavaş gerçekleşmekte. Bulut bilişim sistemleri, verileri her zaman internet erişimine açık, merkezi veri depolama alanlarında saklamayı gerektirir. Model gereği, çoğunlukla bulut üzerinde veri depolama servisi, üçüncü taraf sağlayıcılar aracılığı ile gerçekleştirilir. Üçüncü taraf sağlayıcının veriyi hangi fiziksel konum veya konumlarda sakladığı genellikle bir bilinmezdir. Çoğunlukla, kesintisiz erişim, yedekleme, ve yerkürenin her noktasına aynı hızda veriyi ulaştırma, doğal afet ve kazalara karşı verileri koruma gibi nedenlerle, veriler dünyanın birçok noktasındaki farklı fiziksel konumlarda aynı anda saklanır. Verileri bulut bilişim sistemleri üzerinde, fiziksel olarak bilinmeyen konumlarda veya üçüncü taraf sağlayıcılar aracılığı ile saklamak , bu verilerin şifrelenerek güvence altına alınmasını gerektirir. Öte yandan, bu verilerin veya bir bölümünün bulut systemi üzerinden çağırılması, hassas verilerin, üçüncü partilere açıklanmasına, üçüncü taraflar tarafından erişilebilir hale gelmesine neden olabilir. Bu da çeşitli mahremiyet ve güvenlik sorunlarına yol açar. Bulut bilişim sistemleri üzerindeki güvenlik endişelerini ortadan kaldırmak için, halihazırda birçok güvenlik ve şifrele çözümü geliştirilmiştir. Literatürde bulunan bütün bu çözümler, farklı noktalardan güvenlik açıklarını ve muhtemel tehditleri engellerken, performans, verimlilik ve tutarlılık noktasında geriye gidişe neden olmaktadır. Halihazırda bulut üzerinde çalışan birçok gizlilik ve very güvenliği çözümü olmasına rağmen, halihazırda kurulu olan birçok ticari ve kamu uygulamalarında halen geleneksel veri şifreleme ve gizlilik yöntemleri ve tanımlamaları kullanılmaya devam etmektedir. Geleneksel yöntemlerin kullanılmaya devam etmesinde birkaç neden sıralanabilir. Yöntemlerin basit ve yüksek performanslı olması, hizmet sağlayıcıların ve kamu kurumlarının veriler üzerinde kontrolü devam ettirebilmesi, teknoloji ve deneyim eksikliği gibi nedenleri bunlara örnek gösterebiliriz. Ancak aynı şekilde, geleneksel yöntemlerin kullanılması, kritik veriler üzerinde çalışan kamu kurumları, finans kurumları, telekomünikasyon ve sağlık sektöründe hizmet gösteren ticari veya kamu kuruluşlarının bulut sistemlerinin verimliliğinden mahrum kalmasına neden olmaktadır. Yüksek perfomanslı, gerekli noktalarda en üst seviye güvenliği sağlayan veri gizliliği ve mahremiyeti teknikleri yukarıda sıralanan uygulama alanlarının da, bulut teknolojilerinin sağlayacağı verimlilik ve performans artışlarından faydalanmalarını sağlayacaktır. Dolayısıyla, bu sorunların üstesinden gelmek için, Gizliliği Koruyarak Veri Çağırma (PPDR – Privacy Preserving Data Retrieval) olarak bilinen birçok teknik halihazırda önerilmektedir. Bu teknikler, üçüncü taraflarca okunur hale gelen verilerin güvenliği ve mahremiyetini sağlamayı amaçlar. Ancak bütün Gizliliği Koruyarak Veri Çağırma teknikleri, belirli ölçülerde güvenliği ve mahremiyeti sağlarken, veri kalitesi ve veri çağırma işinin verimliliği, performansı, tutarlılığı ve doğruluğu üzerinde bir takım negatif etkilere sahiptir. Bu teknikler veri çağırma işleminin güvenliğini sağlarken, olumsuz etkileri de en aza indirmeyi amaçlar. Bu tez çalışmasında, literatürde bildirilen teknikler temel alınarak, bir PPDR sisteminde yüksek seviyede güvenlik ve gizliliği sağlamak için 9 güvenlik noktası tanımlanmıştır. 9 güvenlik noktası, literatürde bildirilen tekniklerin güvenlik ve mahremiyet sağlamayı amaçladığı kritik noktalar üzerinden belirlenmiştir. 9 güvenlik noktasının eksiksiz olarak güvenliğinin ve mahremiyetinin sağlanması, en yüksek güvenlik ve mahremiyet seviyesinin gerçekleşmesi anlamına gelmektedir. Bu 9 güvenlik noktası ile birlikte, çağırılan verilerin doğruluğunu ve tutarlılığını yüksek tutmak için bir çağırma verimliliği ve performans kriteri tanımlanmaktadır. Bu nedenle, bu 9 güvenlik ve 1 verimlilik gereksinimini karşılamak için yeni bir teknik önerilmektedir (bu tezde 9 + 1 kriteri olarak belirtilmiştir). 9+1 kriteri hem güvenli, hem yüksek performanslı bir çözüm gerçekleştirmenin kriteridir. Veri çağırma işleminin güvenlik ve mahremiyetini 9+1 kriterini sağlayarak gerçekleştirmek için önerilen teknik, HEADA isimli henüz geliştirilen bir Radio Frekansı ile Tanımlama (RFID) gizliliği sisteminden türetilmiş, çoklu sunucu yapısı ile gerçekleştirilmiştir. Önerilen teknik, TF-IDF vektörlerinin kosinüs benzerliklerini kullanarak verimliliği yüksek, etkin ve gizliliği koruyan bir sıralı veri çağırma işlemi gerçekleştiriyor. Tekniğin verimliliği ve veri cağırma işleminin derecesi, üç farklı veri kümesi ile test edilmiştir. Bu testler, önerilen tekniğin diğer gizlilik hedefleyen şifrelenmiş tekniklerden, hatta şifrel enmemiş tekniklerden daha yüksek sonuçlar aldığını göstermektedir. Önerilen tekniğin analizi, tekniğin literatürde bildirilen tekniklerden hiç birinin aynı anda gerçekleştiremediği, 9 kriterin bir arada sağlandığını gösterir. Önerilen Teknik, belirlenen 9 güvenlik kriterine tam uyum gerçekleştirirken, yüksek performans sunmaktadır. Bu nedenle, halihazırda geleneksel yöntemleri kullanarak, yüksek güvenliği çok yüksek altyapı maliyetleri ile, veya, yüksek verimliliği çok ciddi güvenlik ve mahremiyet problemleri ile gerçekleştirebilen, bankacılık, finans, telekomünikasyon, sağlık ve kamu sektörlerinde geniş kullanım alanları bulabilir.
Recently, cloud computing systems are considered as one of the most important advances in the field of Information Technology (IT) applications. However, security and privacy still form the main concern that slower the widespread use of these systems in the sensitive applications that need high level of privacy and security on their data. Outsourcing the data to unknown locations in the cloud needs securing these data by encrypting them. On the other hand, retrieving these data (or part of them) may need revealing sensitive data to unauthorized parties. Therefore, many techniques are proposed to handle this problem, which is known as Privacy-Preserving Data Retrieval (PPDR). These techniques tried to minimize the sensitive data that need to be revealed, which negatively affects the security and privacy of the data and/or the quality (or accuracy) of data retrieval. In this thesis, 9 security requirements are defined to satisfy a high level of security and privacy in a PPDR system based on the reported techniques in the literature. Together with these 9 security requirements, a retrieval efficiency requirement is defined to keep the retrieval efficiency high. Therefore, a new technique is proposed to satisfy these 9 security and 1 efficiency requirements (which are noted as 9+1 requirements in this thesis). The proposed technique utilizes Query Anonymous Authentication -which is derived from another newly proposed Radio Frequency Identification (RFID) anonymous authentication technique called HEADA- together with a multi-server setting to satisfy these requirements. The technique provides an efficient ranking-based data retrieval by using the cosine similarity of the TF-IDF vectors. The accuracy and ranking of the data retrieval is tested on three different datasets and shown to be high compared to other techniques as well as to the un-encrypted indexes and data. The analysis of the proposed technique also shows that the technique is able to satisfy all the 9 security requirements, which are unsatisfied completely in the techniques reported in the literature.