Tez No İndirme Tez Künye Durumu
666630
Önleyici kolluk faaliyetleri kapsamında sosyal medyada veri madenciliği: Suçları önlemek için Twitter Analytic'i kullanma / Data mining in social media for preventive policing activities: Using Twitter Analytics for crime prevention
Yazar:EMRE CİHAN ATEŞ
Danışman: DOÇ. DR. GAZİ ERKAN BOSTANCI
Yer Bilgisi: Ankara Üniversitesi / Sağlık Bilimleri Enstitüsü / Disiplinlerarası Adli Bilimler Ana Bilim Dalı / Kriminalistik Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Adli bilimler = Forensic sciences ; Güvenlik önlemleri = Safety measures ; Makine öğrenmesi = Machine learning ; Siber zorbalık = Cyberbullying ; Sosyal medya = Social media ; Suç = Crime ; Twitter = Twitter ; Veri madenciliği = Data mining ; Yapay zeka = Artificial intelligence ; Önleyici müdahale = Preventive intervention
Onaylandı
Doktora
Türkçe
2021
399 s.
Sosyal ağların yaygın kullanımı ile birlikte, geçmişte fiziksel mekânlarda olan iletişim ortamlarının giderek sanal hale gelmeye başladığı bir dönemdeyiz. Sosyal ağ kullanımıyla yaşanan değişimler sadece iletişim alanında olmayıp, neredeyse hayatın her alanında mevcuttur. Söz konusu değişimlerin bazısı oldukça iyiyken, bazısı oldukça kötüdür. Suç kavramı, sosyal medya ile değişimden çoğunlukla olumsuz etkilenen alanlardan biri olup, yapılan çalışmalar sosyal medyadaki suçların giderek arttığını göstermektedir. Tez çalışması ile sosyal ağların, suç ve suçla mücadelede kullanımı bütüncül yaklaşımla ele alınmıştır. Bütüncül yaklaşım içerisinde, sosyal medyanın suçu önlemeye yönelik rolü ve suç oluşumu sonrası tespite dair çalışmalar bulunmaktadır. Çalışmadan elde edilen verilerin, farklı analiz yöntemleriyle birlikte ortaya konması amaçlanmıştır. Tez çalışmasında kullanılan veri madenciliği yöntemleriyle birlikte, elde edilen bilgilerin analiz edilmesi bakımından tanımlayıcı/keşfedici sınıfından bir yöntem kullanılmıştır. Çalışmada kullanılan veriler, Twitter üzerinden alınmıştır. Sınırlı zaman periyodundaki veriler üzerinden analiz yapılması, çalışmanın temel kısıtıdır. Verilerin elde edilmesi ve analizi aşamasında Python 3 programlama dili kullanılmıştır. Tez kapsamında; polarite analizi, keşifsel veri analizi, konu modelleme, makine öğrenmesi, ağ analizi, makine çevirisi, veri görselleştirme ve metin benzerliği çalışmaları yapılmıştır. Çalışmada elde edilen verilerden yola çıkarak, sonuçların ilki suçla mücadelede toplum destekli güvenlik hizmeti kapsamında kolluğun paylaşımlarının önemli olduğudur. Etki gücü yüksek mesajlar, sosyal medyada daha çok ilgi görmekte ve hızlıca yayılmaktadır. Sonuçların ikincisi sosyal medya üzerinden makine öğrenmesi yöntemleri kullanılarak oldukça başarılı şekilde siber zorbalık içeren mesajların sınıflandırabildiğidir. Çalışma kapsamında 19 farklı makine öğrenimi algoritması kullanılmış olup, en başarılı sonuç veren LGBM algoritması ile %90.2 F1 Skoru elde edilmiştir. LGBM algoritmasının denetimsiz öğrenme kapsamında suçla mücadelede kullanılması halinde, sosyal medyadaki suçların tespiti için gerekli işgücünü yaklaşık %98'e yakın azaltacağı belirlenmiştir. Sonuçların üçüncüsü ise denetimsiz öğrenme kapsamında büyük veri üzerinde keşifsel veri analizi yaparak, açık kaynak istihbaratı yapılabildiğidir. Veriler üzerinde anomali tespiti yapılarak, olağandışı hesap trafikleri analiz edilmiştir. Bunun yanı sıra sosyal medyanın açık kaynak istihbaratında oldukça nadir bilgileri içerebilmesi açısından önemli olduğu belirlenmiştir. Çalışma sonucu elde edilen verilerden yola çıkarak, sosyal ağların her yönüyle suç ve suçla mücadelede kullanılabileceği tespit edilmiştir. Yapılan bu tez çalışması ile sosyal ağdaki suç kavramı, adli bilişim, kriminoloji ve kriminalistik disiplinleri açısından incelenmiştir. Elde edilen sonuçların, sosyal ağda suç sorununun kökeninin belirlenmesi ile önleyici ve adli hizmetlerde alınacak tedbirler için fikir verdiği değerlendirilmektedir.
We are now in a period where communication media that were in physical spaces in the past are gradually becoming virtual with the widespread use of social networks. The changes experienced with the use of social networks do not only exist in the field of communication, but also in almost every aspect of life. Some of these changes in question are quite good, while some are quite bad. The concept of crime is one of the areas that are usually negatively affected by the change through social media, and studies conducted indicate that social media crimes are gradually increasing. Through this thesis study, the use of social networks both in crime and the fight against crime was discussed with a holistic approach. The holistic approach includes studies conducted on the role of social media in preventing crime and post-crime detection. It was aimed to reveal the data obtained from the study through different analysis methods. Besides the data mining methods used in the thesis study, a method from the descriptive/exploratory category was used in terms of analyzing the obtained information. The data used in the study were taken from Twitter. The main limitation of the study is performing analysis on the data, which are in a limited time period. Python 3 programming language was used during the data retrieval and analysis phase. Polarity analysis, exploratory data analysis, topic modeling, machine learning, network analysis, machine translation, data visualization, and text similarity studies were conducted within the scope of the thesis. The first result based on the data obtained in the study is that the posts shared by law enforcement within the scope of community-supported security service in the fight against crime are significant. Messages with a strong power of influence attract more attention on social media and spread rapidly. The second result is that messages containing cyberbullying can be classified quite successfully by using machine learning methods on social media. 19 different machine learning algorithms were used within the scope of the study, and a 90.2% F1 Score was obtained with the LGBM algorithm, which gave the most successful results. It was determined that the workforce required for the detection of social media crimes would decrease by approximately 98% if the LGBM algorithm was used in the fight against crime within the scope of unsupervised learning. The third result is that open-source intelligence can be performed by conducting exploratory data analysis on big data within the scope of unsupervised learning. Abnormal account traffic was analyzed by detecting anomalies in the data. In addition, it was determined that social media is of importance in open-source intelligence in terms of its ability to contain quite rare information. Based on the data obtained as a result of the study, it was determined that social networks can be used both in crime and the fight against crime in all aspects. The concept of crime in the social network was examined in terms of digital forensics, criminology, and criminalistic disciplines through this thesis study. It is considered that the obtained results provide insight for the determination of the origin of the crime problem in the social network and precautions to be taken in preventive and legal services.