Tez No İndirme Tez Künye Durumu
706635
Sosyal medyada kullanılan haber başlıklarının popülarite üzerindeki etkisinin veri madenciliği teknikleriyle analizi / Analysis of the effect of news headlines used in social media on popularity by data mining techniques
Yazar:MANSUR BEŞTAŞ
Danışman: PROF. DR. UĞUR YAVUZ
Yer Bilgisi: Atatürk Üniversitesi / Sosyal Bilimler Enstitüsü / Yönetim Bilişim Sistemleri Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Bilim ve Teknoloji = Science and Technology
Dizin:Veri madenciliği = Data mining
Onaylandı
Doktora
Türkçe
2021
196 s.
Geleneksel habercilik alanında haberlerin okunması, basılı medyanın satın alınmasında ise manşet ve haber başlıkların etkisi başroldedir. İletişimin ve haber alma etkinliklerinin sosyal medya alanına kayması ile okuyucu çekme kanallarında en etkili mecra olarak sosyal medya ön plana çıkmıştır. Bu nedenle sosyal medya da okuyucuların ilk karşısına çıkan haber başlığı bu alanın önemli bir öğesidir. Günümüzde bireyler her türlü bilgi elde etmek amacıyla ağırlıklı olarak sosyal medya platformlarını kullanmaktadır. Bu nedenle sosyal medya habercilik alanında faaliyet gösteren işletmeler için hedef kitlelerine ulaşmak yolunda en umut verici alanlardan biridir. Çevrim içi alanda verilerin toplanması, analiz için uygun olarak düzenlenmesi amacıyla veri madenciliği tekniklerinden faydalanılmıştır. Veri madenciliği tekniklerinin kullanımı, verinin toplanması sürecinde teknik nedenlerden kaynaklı oluşan eksik verinin neden olduğu sorunların giderilmesi ve veri içerisinde bulunan gürültünün azaltılmasına yardımcı olmuştur. Haber türündeki içeriklerin giriş kapısı olarak haberin başlığı kabul edilmektedir. Bu nedenle haber başlıkları bireylerin bir haberin içeriğini okuyup okumayacaklarına karar verme aşamasında en önemli adımdır. İyi bir başlık, ilgili haberin internet sayfasına gidilmesinde karar verilmesi için elzemdir. Sosyal medya platformlarında farklı çalışma modelleri bulunmaktadır. Twitter bireylerin istediği zaman ve herhangi bir takip gerektirmeden paylaşımlara ulaşma imkânı sağlaması yönüyle kullanıcılar açısından kolaylıklar barındırmaktadır. Araştırmacılar açısından, Twitter platformunun veri toplamak için API desteği sağlaması bilimsel çalışmaların önünü açmıştır. Bu yönüyle veri kazıma işlemleri kolaylıkla gerçekleştirilmektedir. Geri kalan verinin temizlenmesi süreçleri doğal işlemenin normal sürecinde gerçekleştirilmektedir. Haber başlıklarının kullanıcılar açısında hangi yönleri ile ilgiyi çektiğinin tespit edilmesi gerekmektedir. Bu amaçla habercilik alanında iyi bir haberin ne olduğunun tespiti yapılmalıdır. Tespit aracılığı ile elde edilen kıstaslar makine öğrenmesi teknikleri kullanılarak analiz sürecini oluşturmaktadır. Kısa metinlerin analizleri kendi içinde zorluklara sahip olmasına rağmen çalışmada elde edilen bulgular umut vericidir. Sınıflandırma analizlerinde %92 başarı oranına ulaşılmıştır. Regresyon analizlerinde 0,48 R-kare değerine ulaşılmıştır.
In the traditional journalism, the effect of news headlines plays a leading role in the reading of the news and the purchase of the printed media. Social media has become one of the most effective channel in attracting readers with the shift of communication and news activities to the social media field. Thus, the news headline that first appears to readers in social media is an important element of this area. These days, individuals mostly use social media platforms to obtain all kinds of information. For this reason, social media is one of the most promising areas for businesses operating in the field of journalism to reach their target audience. Data mining techniques are used to collect the data from the online resources and arrange them appropriately for analysis. Data collection and analysis process can produce noisy and redundant data. Data mining techniques are assisted to eliminate the missing, redundant, and noisy data. The title of the news is accepted as the entry point to news type of content. Consequently, news headlines are the most significant process in deciding whether the individuals will read the content of a news or not. A good title is essential for deciding to visit the website of the relevant news. There are different working models on social media platforms. Twitter provides convenient way to access to shared contents for users whenever users want and without the need for any follow other users. The API support module in the Twitter helps researchers to make researches easily on Twitter related contents. In this respect, data analysis processes are performed effectively. The rest of the data cleaning processes are performed in the normal process of natural language processing. It is necessary to determine which aspects of the news headlines attract the users' attention. For this purpose, it should be determined what a good news is in the field of journalism. The criteria obtained through the detection accelerate the analysis process by using machine learning techniques. Even though the analysis of short texts has its own difficulties, the findings obtained in the study are promising. The classification accuracy was measured as 92% while R-square value of 0.48 was obtained in the regression analysis, which are quite promising results that show the proposed method performance.