Tez No İndirme Tez Künye Durumu
459230
Spam filtering using sender policy framework / Gönderici politikası çerçevesi ile istenmeyen elektronik postaların filtrelenmesi
Yazar:DEVRİM SİPAHİ
Danışman: YRD. DOÇ. DR. GÖKHAN DALKILIÇ
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Elektronik posta = Electronic mail
Onaylandı
Doktora
İngilizce
2017
95 s.
Spam postalar elektronik posta iletişimdeki en önemli sorunlardan biri haline gelmiştir. Spamlar gereksiz yere Internet trafiği oluşturur. Spam postalar insanların ve şirketlerin fazladan zaman ve para harcamalarına yol açar. Ayrıca spam postalar ağların performansını düşürür ve güvenlik sorununa yol açabilir. Çeşitli spam filtreleme yöntemleri geliştirilmiş olmasına rağmen, bunların hiçbiri mükemmel değildir. Çünkü spam gönderenler yaratıcı olduklarından yeni yöntemler geliştirmektedirler. Spam filtreleme teknikleri, içerik filtreleme ve ağ filtreleme olarak iki gruba ayrılabilir. İçerik filtreleme teknikleri çok fazla işlemci gücüne ihtiyaç duyar. Bu nedenle, daha az kaynak gerektiren ağ tabanlı filtreleme yöntemleri, önem kazanmaktadır. Gönderici Politikası Çerçevesi (SPF) bir alan ismi için yetkili sunucuları tanıtan bir ağ tabanlı filtreleme protokolüdür. Bu sayede spam postalar kolaylıkla filtrelenebilir. Ama SPF protokolü uygulamalarının iki eksiği bulunmaktadır. Birincisi, SPF kullanım oranı yetersizdir; ikincisi kötü niyetli kullanımı artmaktadır. İlk sorunun çözümü için "Gönderici Kimlik Doğrulama Ağı" adlı bir tahmin yöntemi önerdik. Bu yöntemde DNS sistemindeki A ve MX kayıtlarının IP adreslerini inceleyerek, SPF kaydındaki IP adresi ile ilişkisi incelenmiştir. Eğer SPF kaydı yoksa DNS sistemindeki A ve MX kayıtlarından tahmin edilerek yeni bir SPF kaydı oluşturulur. Kullanıcılardan aldığımız geri bildirimler, diğer popüler spam filtreleme yöntemleri ile karşılaştırıldığında, yöntemimiz düşük FP ve düşük FN değerleriyle hızlı çalışmaktadır. İkinci sorunun çözümü için, spam gönderen alan isimlerinin SPF kayıtlarındaki terimlerle, normal eposta gönderen alan isimlerindeki terimleri karşılaştırdık. SPF terimlerinin frekanslarını işleyen bir Yalın Bayes uygulaması geliştirdik. Bu yöntem içerik filtreleme işlem süresini azaltmaya yardımcı olmaktadır.
Spam has become one of the worst problems of email communication. Spam emails use Internet bandwidth redundantly. Spam emails cost people and companies extra money and time. Also, spam emails reduce the performance of networks and can lead to security problems. Although various spam filtering methods have been developed, none of them is perfect. Creative spammers are capable of developing novel methods. Spam filtering can be grouped into content filtering and network-based filtering. Content filtering techniques require a lot of processor power. Therefore, network-based filtering methods, which require less resources, are gaining in spam-filtering. Sender Policy Framework (SPF) is a network-based filtering protocol to identify authorized servers which are allowed to send emails on behalf of a domain name. This way, spam mails can be filtered easily. But there are two deficiencies of the SPF implementation. Firstly, the SPF usage ratio is insufficient. Secondly, malicious usage is increasing. As a solution to the first problem, we propose an estimation method called "Sender Authentication Network". By analyzing the Internet Protocol (IP) addresses in A and MX records of the DNS system, their relation with the IP address in the SPF record is investigated. If there is no SPF record, a new one is created by predicting the classical DNS records A and MX. Since we have taken feedbacks from volunteers. Our method runs faster with low false-positive (FP) and false-negative (FN) values compared to the popular spam filtering methods. To find a solution to the second problem, we have analyzed the term in the SPF records of the spam-sending domain names by comparing them with the legitimate domain names. We have developed a Naïve Bayes implementation the frequencies of SPF terms. This method helps to reduce the content-filtering processing time.