Tez No İndirme Tez Künye Durumu
698734
Automatic detection of cyberbullying in social networks / Sosyal ağlarda sanal zorbalığın otomatik olarak tespit edilmesi
Yazar:ALİCAN BOZYİĞİT
Danışman: DOÇ. DR. SEMİH UTKU
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2021
76 s.
Son zamanlarda sanal zorbalık özellikle çocukları ve gençleri etkileyen önemli bir sorun haline gelmiştir. Bu tezde, sosyal ağlardaki sanal zorbalık içeriklerinin otomatik olarak tespit edilmesi amaçlanmıştır. Bu doğrultuda sosyal medya özelliklerini (örneğin paylaşım yapan kişinin takipçi sayısı) içeren kapsamlı bir sanal zorbalık veri seti sistematik olarak hazırlanmıştır. Daha sonra sanal zorbalık karakteristiklerini tespit etmek için hazırlanan veri seti üzerinde doğal dil işleme özellikleri (örneğin paylaşımdaki kelime sayısı) ve sosyal medya özellikleri analiz edilmiştir. Analiz çalışmasının sonuçları değerlendirildiğinde bazı sosyal medya özellikleri ve siber zorbalık aktiviteleri arasında kuvvetli bir ilişki olduğu görülmektedir. Ayrıca, sosyal ağlarda daha fazla takipçisi olan kullanıcıların çevrimiçi zorbalık içeriği paylaşmaktan kaçınması gibi bazı birliktelik kuralları çıkartılmıştır. Elde edilen sonuçlar, sosyal medya özelliklerinin sanal zorbalık içeriklerinin otomatik olarak tespit edilmesinde faydalı olabileceğini göstermiştir. Bu doğrultuda makine öğrenmesi algoritmaları, hazırlanan veri setinin iki farklı varyantı üzerinde denenmiştir. Birinci veri seti varyantı sadece metinsel özellikleri içerirken, ikinci varyant sosyal medya özellikleri ve metinsel özellikleri birlikte içermektedir. Uygulanan her makine öğrenmesi algoritmasının sosyal medya özelliklerini içeren varyant üzerinde daha başarılı sınıflandırma performansı verdiği gözlemlenmiştir. Sonrasında uygulanan makine öğrenimi algoritmalarının performansını artırmak için özellik çıkarmada kelime temsil yaklaşımları uygulanmıştır. Son olarak, programcıları makine öğrenimi sürecini çalışmadan sanal zorbalık alanında gerçek zamanlı uygulamalar geliştirmeye motive etmek için eğitilen makine öğrenimi modellerini kullanan açık bir web servis yayınlanmıştır.
Cyberbullying has become a major problem that affects children and youngsters especially. In this thesis, it is aimed to detect cyberbullying content in social networks automatically. In this direction, a comprehensive dataset, which includes social media features (e.g., number of the sender followers), was systematically prepared. Then, the characteristics of cyberbullying are inspected by analyzing the natural language processing features (e.g., the number of title words) and social media features on the prepared dataset. It is seen that some of the social media features are strongly related to cyberbullying. Additionally, some association rules between social media features and cyberbullying were captured, such as users that have more followers on social networks are disinclined to post online bullying content. The obtained results show that social media features would be promising in automatically detecting harmful content in social networks. Accordingly, machine learning algorithms experimented on two different variants of the prepared datasets. The first variant includes only textual features, whereas the second variant consists of the determined social media features and textual features. It is observed that each experimented machine learning algorithm gives more successful prediction performance on the variant containing social media features. Further experiments in machine learning were conducted by implementing word embedding approaches in the feature extraction to increase the performance of the applied machine learning algorithms. Lastly, an open web service that uses the trained machine learning models for cyberbullying detection was published to motivate programmers to develop real-time applications without studying or knowing the machine learning process.