Tez No İndirme Tez Künye Durumu
724632
Özellik tabanlı görüş madenciliğinde yapay zeka teknikleri kullanarak görüş hedefi çıkarımı ve kategori tespiti / Opinion target extraction and category detection using artificial intelligence techniques in aspect-based opinion mining
Yazar:KÜRŞAT MUSTAFA KARAOĞLAN
Danışman: PROF. DR. OĞUZ FINDIK
Yer Bilgisi: Karabük Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Doğal dil işleme = Natural language processing ; Fikir madenciliği = Opinion mining ; Metin madenciliği = Text mining ; Yapay zeka = Artificial intelligence
Onaylandı
Doktora
Türkçe
2022
102 s.
Son zamanlarda, çevrimiçi inceleme platformları kullanıcıların satın alma kararlarını destekleyen önemli bilgi kaynakları haline gelmiştir. Kullanıcılar bir ürünü ya da hizmeti satın almadan önce olası deneyimlere ulaşmada bu bilgi kaynaklarına başvurmaktadır. İşletmeler ise pazarladıkları ürünlerin kullanıcılar üzerindeki etkilerini keşfedebilmek için bu kaynakların potansiyel gücünden yararlanmayı hedeflemektedir. Ancak bu kaynakların hacimsel büyüklüğü düşünüldüğünde; kullanıcıların tüm incelemeleri okuyarak etkin bir şekilde değerlendirmesi neredeyse imkânsız hale gelmektedir. Diğer bir taraftan büyük kullanıcı popülasyonuyla karşı karşıya kalan işletmeler, verilerin işlenmesi ve analizi gibi süreçlerde otomatikleştirilmiş yaklaşımlara ihtiyaç duymaktadır. Bu sebeple araştırmacılar, yukarıda bahsedilen problemleri ele alarak daha etkin ve detaylı analizlere olanak sağlayan Özellik Tabanlı Görüş Madenciliği çalışmalarına ilgi göstermektedir. Bu tez çalışmasında ilk olarak, örüntü tabanlı metin ön işleme yöntemine, yardımcı bileşenlerle genişletilmiş sözdizilimsel tabanlı ilişki kuralları algoritmalarına ve model çıktılarında performans optimizasyonu sağlamak amacıyla uygulanan çoğunlukla seçim yöntemine sahip Görüş Hedefi Çıkarımı (Opinion Target Extraction, OTE) yaklaşımı önerilmiştir. Önerilen bu yaklaşımla, kullanıcılar tarafından öznel nitelikli görüş sözcükleriyle yorumlanan varlığa ilişkin ayırt edici özellikleri temsil eden açık ifadelerin (görüş hedefleri) çıkarılması sağlanmıştır. Önerilen OTE yaklaşımının etkinliğini test etmek amacıyla, restoran incelemeleri içeren veri seti üzerinde deneysel çalışmalar gerçekleştirilmiştir. Deneysel çalışmaların sonuçları analiz edildiğinde, önerilen yaklaşımın literatürdeki denetimli yaklaşımlarla karşılaştırılabilir sonuçlar ürettiği, denetimsiz diğer yaklaşımlara göre ise daha yüksek performans gösterdiği sonucuna ulaşılmıştır. İkinci olarak, belirli özellik kategorileriyle çoklu ve hiyerarşik yapıda etiketlenmiş inceleme cümlelerinin sınıflandırılması amacıyla derin öğrenme tabanlı Özellik Kategorisi Tespiti (Aspect Category Detection, ACD) yaklaşımları önerilmiştir. Önerilen ACD yaklaşımlarında, girdilerinde bağlamsal bilgiyi dikkate alarak zengin vektör temsilleri üretebilen önceden eğitilmiş Dönüştürücülerden Çift Yönlü Kodlayıcı Temsilleri (BERT) ve Anlamsal Katlama Teorisi (SFT) kelime temsil modellerinin (word embedding model, WEM) uygulandığı Evrişimsel Sinir Ağı ve Derin Sinir Ağı tabanlı çok etiketli metin sınıflandırma yaklaşımları geliştirilmiştir. Geliştirilen ACD yaklaşımlarının etkinliklerini ve uygulanan WEM'lerin sınıflandırma performanslarına olan katkılarını analiz etmek için, dizüstü bilgisayar ve restoran inceleme veri setleri üzerinde deneysel çalışmalar gerçekleştirilmiştir. Deneysel çalışmaların sonuçları analiz edildiğinde, önerilen yaklaşımlarla literatürdeki diğer yaklaşımlara göre daha yüksek veya rekabetçi performans sonuçları elde edilmiştir. Ayrıca bu çalışmada uygulanan WEM'lerin performanslarının birlikte değerlendirilmesi, literatürde ilkler arasında yer almaktadır.
Recently, online review platforms have become significant data sources that support users' purchasing decisions. Users refer to these information sources to reach possible experiences before purchasing a product or service. On the other hand, businesses aim to benefit from the potential power of these resources to investigate the effects of the products they market on users. However, considering the volumetric size of these resources, it becomes almost impossible for users to evaluate them effectively by reading all the reviews. On the other hand, businesses that face large user populations need automated approaches in processes such as data processing and analysis. For this reason, researchers are interested in Aspect-based Opinion Mining studies, which enable more effective and fine-grained analysis by addressing the problems mentioned above. In this thesis, firstly, the Opinion Target Extraction (OTE) approach, including the pattern-based text pre-processing method, algorithms of extended syntactic-based relation rules with auxiliary components, and the majority voting method applied to provide performance optimization in model outputs, is proposed. It was provided to extract explicit expressions (opinion targets) representing distinctive entity aspects interpreted by users with subjective opinion words with this proposed approach. In order to test the effectiveness of the proposed OTE approach, experimental studies were carried out on a data set containing restaurant reviews. When the results of experimental studies were analyzed, it was reached that the proposed approach produced results comparable to supervised approaches in the literature and performed higher than other unsupervised approaches. Secondly, deep learning-based Aspect Category Detection (ACD) approaches are proposed to classify multi-label and hierarchically tagged review sentences with specific aspect categories. In the proposed ACD approaches, Convolutional Neural Network (CNN) and Deep Neural Network (DNN) based in which pre-trained Bidirectional Encoder Representations from Transformers (BERT) and Semantic Folding Theory (SFT) word embedding models (WEMs) that generate rich vector representations by considering contextual information are applied in their inputs multi-label text classification approaches have been developed. In order to analyze the effectiveness of the developed ACD approaches and their contribution to the classification performance of the implemented WEMs, experimental studies were carried out on laptop and restaurant review datasets. When the results of experimental studies were analyzed, higher or competitive performance results were obtained with the proposed approaches compared to other approaches in the literature—in addition, evaluating the performances of applied WEMs together is among the firsts in the literature.