Tez No İndirme Tez Künye Durumu
715248
Sosyal medya makina öğrenme tekniklerini kullanarak yazar kimlik doğrulaması / Social media authorship verification using machine learning techniques
Yazar:SULEYMAN ALTERKAVI
Danışman: PROF. DR. HASAN ERBAY
Yer Bilgisi: Kırıkkale Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
86 s.
Sosyal medya ağlarının kullanımı giderek yaygınlaşmaktadır, bununla beraber kötü niyetli mesajlar yaymak amacıyla kullanıcı hesaplarının saldırganlar tarafından ele geçirildiği sosyal mühendislik saldırılarının yeni türleri ortaya çıkmaktadır. Bu saldırıların üstesinden gelmek için yazarlık doğrulaması bilinen bir metnin kullanıcıya ait olup olmadığını tespit eden sınıflandırma yöntemine ihtiyaç vardır. Ayrıca, bu doğrulama doğru ve hızlı olmalıdır. Burada, bir kişi tarafından ele geçirilen sosyal medya hesapları için yeni bir yazarlık doğrulama yöntemi önerilmektedir. Twitter tabanlı bir veri kümesinden önemli metinsel özellikler türetilmiştir. Twitter veri kümesi 280 karakterli ve yazarlık bilgileriyle manuel olarak açıklama eklenmiş 16124 tweet'ten oluşur. Daha sonra XGBoost algoritması veri kümesindeki her metinsel özelliğin önemini vurgulamak için kullanılmıştır. Ayrıca, özellik seçimi için üç MCDM yöntemini (ANP, VIKOR ve ELECTRE) sıralama sonuçları üçgenlenir ve özellik ağırlıklandırma için Sıra Üs ve Sıra Toplamı ağırlık yöntemleri uygulanır. Birçok sınıflandırıcı ile değerlendirilen azaltılmış veri kümesi ve elde edilen F1-skoru sonucu %94,5'tir.
Social media networks' usage is spreading but accompanied by a new shape of the social engineering attacks in which users' accounts are compromised by attackers to spread malicious messages for different purposes. To overcome these attacks, authorship verification, a classification problem for classifying a text, whether it belongs to a user or not, is needed. Moreover, the verification must be accurate and fast. Herein, a novel authorship verification framework for hijacked social media accounts, compromised by a human, is proposed. Significant textual-features are derived from a Twitter-based dataset. The dataset is composed of 16124 tweets with 280 characters crawled and manually annotated with the authorship information. XGBoost algorithm is used, then, to highlight the significance of each textual-features in the dataset. Furthermore, the ranking results of three MCDM approaches (ANP, VIKOR and ELECTRE) are triangulated for feature selection, and the Rank Exponent and Rank Sum weight methods are applied for feature weighting. The reduced dataset evaluated with many classifiers, and the achieved result of the F1-score is 94.5%.