Tez No İndirme Tez Künye Durumu
704108
Büyük veri log yönetiminde siber ataklara karşın saldırı tespit sistem tasarımı / Design of an intrusion detection system against cyber attacks in big data log management
Yazar:MURAT KOCA
Danışman: DOÇ. DR. MUHAMMED ALİ AYDIN
Yer Bilgisi: İstanbul Üniversitesi-Cerrahpaşa / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgi güvenliği = Information security ; Büyük veri = Big data ; Derin öğrenme = Deep learning ; Siber güvenlik = Cyber security ; Yapay sinir ağları = Artificial neural networks ; Yapay zeka = Artificial intelligence
Onaylandı
Doktora
Türkçe
2021
142 s.
Günümüzde verilerin hızla artmasıyla birlikte büyük verinin güvenliği, yöneticiler için her zamankinden daha önemli hale gelmiştir. Bununla birlikte, geleneksel altyapı sistemleri çığ gibi artarak büyük verilerle baş edilemez hale gelmiştir. Ek olarak; mevcut veri tabanı sistemleri, işlem başına lisans maliyetlerinin artmasıyla bilgi teknolojilerini kullanan kuruluşları ücretsiz ve açık kaynaklı çözümlere yöneltmiştir. Bu sebeplerle, kuruluşların maliyetlerini düşürmek, ağ trafiğinde oluşan büyük veri analizi başarımı ile öne çıkan Apache Hadoop Dağıtık Dosya Sistemi (HDFS) ve analizde hız performansı ile öne çıkan Apache Spark üzerinde bir anomali saldırı tespit modeli önerilmiştir. Bu model dört aşamadan oluşur: birincisi ağ trafiğinde otomatik olarak topladığımız log verilerini, HDFS'de dağıtık bir şekilde depolanmıştır. İkinci aşamada, bu verileri HDFS'den Apache Spark üzerine alınmıştır. Üçüncü aşamada, veri ön işleme aşaması ve Tensorflow kütüphanesindeki GPU'ların paralel hesaplama desteği sunan CUDA ile derin öğrenme (cuDNN) yöntemimiz olan dağıtık anomali saldırı tespit sistemi uygulanmıştır. Son aşamada ise, üretilen alarmlar tekrar HDFS'ye kaydedilmiştir. Derin öğrenmede kullanılan sınıflandırma yöntemleri ile log veri yönetiminde siber saldırı aykırılıklarını tespit etmek için önerdiğimiz yaklaşımla karşılaştırmalı deneyler yapılmıştır. Bu deneylerde elde edilen sonuçlar, diğer mevcut yöntemlere kıyasla performans değerlendirme ölçütlerinde umut verici bir kazanç sağladığı görülmüştür.
Nowadays, it has become more important than ever for managers of large data security with the rapid increase of data. However, traditional infrastructure systems cannot cope with increasingly big data that is created like an avalanche. In addition, as the existing database systems increase licensing costs per transaction, organizations using information technologies are shifting to free and open source solutions. For this reason, we propose an anomaly attack detection model on Apache Hadoop Distributed File System (HDFS), which stands out in open source big data analytics, and Apache Spark, which stands out with its speed performance in analysis to reduce the costs of organizations. This model consists of four stages: the first of which is to store instant data on HDFS in a distributed manner. In the second stage, the log data generated in the network traffic are analyzed by taking the data on Apache Spark and including the log data created by HDFS. In the third stage, the data pre-processing stage and with the CUDA parallel programming in the Tensorflow library, we apply our deep learning (cuDNN) method to the distributed anomaly detection with the computational support of GPUs. In the last stage, the generated alarms are recorded on HDFS again. We conducted comparative experiments with the approach we propose to detect cyberattack anomalies in log data management with the classification methods used in deep learning. The results obtained in these experiments appear to provide a promising gain in performance evaluation metrics compared to the other available methods.