Tez No İndirme Tez Künye Durumu
682491
Heterojen veri kaynaklarında fikir madenciliği, otomatik özellik çıkarımı ve duygu analizi / Opinion mining in heterogeneous data sources, automatic aspect extraction and sentiment analysis
Yazar:BARIŞ ÖZYURT
Danışman: PROF. DR. MUHAMMET ALİ AKCAYOL
Yer Bilgisi: Gazi Üniversitesi / Bilişim Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
122 s.
Günümüzde sosyal ağların, blogların, forumların ve e-ticaret sitelerinin kullanımının yaygınlaşmasıyla, kullanıcılar tarafından üretilen metinlerin hacmi her geçen gün katlanarak artmaktadır. Ürün yorumlarındaki ve diğer metinlerdeki kullanıcı görüşleri ve fikirleri bu ürünlerin üreticileri, satıcıları ve pazarlayıcıları için hayati öneme sahiptir. Bu yüzden, duygu analizi ve fikir madenciliği önemli bir araştırma alanı haline gelmiştir. Kullanıcı yorumları üzerindeki fikir madenciliğinde konu modelleme tabanlı yaklaşımlar ve Latent Dirichlet Allocation (LDA) özellik tabanlı düzeydeki duygu analizinde özellik çıkarımında önemli yöntemler haline gelmişlerdir. Fakat LDA doğrudan kullanıcı yorumlarında ve kısa metinlerde metin seyrekliği sorunu yüzünden doğrudan kullanılamamaktadır. LDA'nın kısa metinlerde kullanılabilecek şekilde uyarlanması ile ilgili çok sayıda çalışma yapılmıştır. Bu çalışmada özellik tabanlı düzeyde duygu analizi ve özellik çıkarımı için özgün bir yöntem olan Sentence Segment LDA (SS-LDA) önerilmiştir. SS-LDA, kısa metinler ve yorumlardan özellik çıkarımı için geliştirilmiştir. Bu çalışmada veri seti olarak akıllı telefonlar hakkındaki müşteri yorumları kullanılmıştır. Yorumlar www.hepsiburada.com e-ticaret sitesinden alınmıştır. Deneysel sonuçlar SS-LDA'nın özellik tabanlı düzeydeki duygu analizinde ürün özellik çıkarımında başarılı olduğunu ortaya koymuştur.
Today while social networks, forums, e-commerce web sites and blogs are covering most of our lives, textual data generated by users is exponentially growing. User opinions in user reviews or in other textual data are very important for retailers, manufacturers and providers of these products and services. Therefore, opinion mining and sentiment analysis have emerged as important research areas recently. In mining user reviews, Latent Dirichlet Allocation (LDA) which is the most popular topic modeling algorithm is a significant method that is used in extracting product aspects in aspect based sentiment analysis. However, LDA algorithm is not so effective on short texts like user reviews or social media messages because of lack of co-occurrence patterns and data sparsity problem. Adaptation of LDA algorithm for short texts is an hot research area in literature. In this study, Sentence Segment LDA (SS-LDA), which is a novel method for aspect based sentiment analysis and aspect extraction is proposed. SS-LDA has been proposed for aspect extraction from short texts and product reviews. In this study, user reviews about smartphones are used as the dataset. The user reviews have been collected from www.hepsiburada.com, which is a popular e-commerce site in Turkey. Experimental results prove that SS-LDA is quite competetive in extracting products aspects.