Tez No İndirme Tez Künye Durumu
716934
Derin öğrenme temelli yeni nesil güvenlik duvarının tasarlanması / Designing a deep learning based next generation firewall
Yazar:KENAN BAYSAL
Danışman: DR. ÖĞR. ÜYESİ DENİZ TAŞKIN
Yer Bilgisi: Trakya Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Ağ güvenliği = Network security ; Derin öğrenme = Deep learning ; Evrişimli sinir ağları = Convolutional neural networks
Onaylandı
Doktora
Türkçe
2022
146 s.
İnternet kullanımının yaygınlaşması ile insan hayatında kalıcı değişimler meydana gelmiştir. Bu değişimler hem iyi hem kötü anlamda değerlendirilebilir. Web üzerindeki sınırsız bilgi akışında faydalı içeriklerin yanı sıra, zararlı içeriklere de isteyerek veya istemeyerek maruz kalınabilmektedir. Özellikle çocuk ve gençlerin üzerinde zararlı içeriklerin, telafisi zor hasarlara yol açtığı bilinmektedir. İçerik yönünden zararsız kabul edilebilecek web sayfalarının içeriğinde bile, reklam veya kişisel gönderi olarak zararlı içeriğe rastlanabilmektedir. Bu ödev, oyun ve sosyal medya sayfalarında sıkça görülebilen bir durumdur. Bu tür web sayfalarını tümden engellemek ise farklı sorunlara yol açabilmektedir. Ayrıca geleneksel yöntemler ile web sayfalarının içeriğinin düzenli olarak takip edilmesi ve değerlendirilmesi mümkün değildir. Çalışmanın amacı, web sitelerinin bütünüyle engellenmesinden ziyade, gelen trafik üzerindeki içeriğin tespit edilip, içeriğin zararlı veya zararsız olarak sınıflandırılarak, sadece o içerik üzerinde engelleme yapılmasını sağlayacak bir yeni nesil güvenlik duvarı filtreleme algoritması geliştirmektir. Web sayfalarında görsellerin yoğunluğu ve etkisi daha fazla olduğundan, çalışma kapsamında değerlendirilen içerik sadece görseller olarak ele alınmıştır. Görsel içeriğinin yorumlanmasında, günümüzde en güçlü yöntem olan derin öğrenme yöntemi kullanılmıştır. Zararlı içerik olarak değerlendirilen görseller sadece alkollü içecekler ile sınırlandırılmıştır. Lmdb veri tabanı ile toplamda 4,6 milyon görselden oluşan bir veri seti ile CAFFE ortamında GoogLeNet ağı kullanılarak eğitim gerçekleştirilmiştir. Eniyileyici yöntemi olarak Adam algoritması kullanılmıştır. Eğitim sonucunda %97,6469 doğruluk değerine ulaşılmıştır. Karışıklık matrisi hesaplamalarında F1 skoru %87,75526188 olarak hesaplanmıştır. Güvenlik duvarı mitmproxy vekil sunucusu ile uygulanmış ve web sayfalarında görsellerin başarıyla filtrelenmesi sağlanmıştır.
Permanent changes have occurred in human life with the widespread use of the Internet. These changes may both be considered as good and bad. Along with useful contents within this unlimited flow of information through the web, people may also be willingly or unwillingly exposed to harmful contents. It is well known that these harmful contents cause irrecoverable damages particularly on the young and the children. Harmful contents can even be seen in websites, which may content-wise be considered harmless, in the form of advertisements or personal posts. This can be commonly seen in homework, gaming, or social media pages. Completely blocking these websites may cause other problems. In addition, it is impossible to regularly track and review the contents of the websites through traditional methods. The purpose of this study is to develop a next-generation firewall filtering algorithm, which would detect the contents from the inbound traffic, and categorize them as harmless or harmful, and perform a content-wise blocking process, rather than completely blocking the websites. Since the visual images on the websites are more intense and have higher impact, the contents reviewed within the scope of this study were only discussed as visual images. Today's most powerful method, deep-learning method, was used in interpretation of the contents of the visual images. The visual images, which were considered as harmful, were limited to alcoholic beverages. The training was performed by using GoogLeNet network within Caffe environment with a data set containing 4.6 million images with Lmdb database. Adam algorithm was used as optimization method. At the end of this training, 97.6469% of accuracy value was reached. F1 score was calculated as 87.75526188% in confusion matrix calculations. The firewall was implemented through mitmproxy proxy server, and the visual images on the websites were successfully filtered.