Tez No |
İndirme |
Tez Künye |
Durumu |
781583
|
|
Context- and sentiment-aware machine learning models for sentiment analysis / Duygu analizi için bağlam ve duyguya duyarlı makine öğrenmesi modelleri
Yazar:FİRDEVSİ AYÇA DENİZ KIZILÖZ
Danışman: DOÇ. DR. PELİN ANGIN ; DR. ÖĞR. ÜYESİ MERİH ANGIN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Doğal dil işleme = Natural language processing ; Duygu analizi = Sentiment analysis ; Lojistik regresyon modelleri = Logistic regression models ; Makine öğrenmesi = Machine learning
|
Onaylandı
Doktora
İngilizce
2023
144 s.
|
|
Bilişim teknolojilerindeki gelişmelerle birlikte insanların görüşlerini ifade ettikleri web kaynaklarındaki mevcut veri miktarı sürekli olarak artmaktadır. Duygu analizi, karar merciilerin büyük veri yığınlarından içgörüler elde etmelerini destekler. Kamuoyunun takip edilmesi de dahil olmak üzere çok çeşitli alanlarda pratik bir araç olduğunu kanıtladığı için son zamanlarda çok ilgi görmüştür. Buna rağmen, duygu analizi araştırması hala bazı zorluklarla karşı karşıyadır. Ana zorluklardan biri, verilerdeki ilgisiz ve gereksiz özelliklerdir. Bu tür özellikler, yalnızca arama alanını büyük ölçüde artırmakla kalmaz, aynı zamanda modelin bağlam farkındalığını da bozar. Diğer bir temel zorluk, duygu analizi görevleri için etki alanından bağımsız modellerin bulunmamasıdır, çünkü mevcut bir model bağlam açısından başka bir alan için uygun olmayabilir. Derin öğrenme modelleri yüksek performanslı sonuçlar sağlasa da çok büyük miktarda etiketlenmiş veri gerektirirler. Bununla birlikte, yeterli miktarda etiketlenmiş veri elde etmek genellikle kolay bir süreç değildir.
Bu tezde, yukarıda belirtilen dezavantajları gidermek için dört model öneriyoruz. İlk modelimiz, duygu analizi için verilerdeki en bilgilendirici özellikleri çıkarır. İkincisi, bağlamla rafine edilmiş bir kelime gömme modeli oluşturur. Üçüncü model, etiketlenmiş verilere ihtiyaç duymadan önceden eğitilmiş modellerdeki bilgiyi yeni bir alana aktarır. Sonuncusu, duygu analizi için çeşitli özelliklerden oluşan bir havuz oluşturan bir özellik topluluğu modelidir. Modellerimizin etkinliğini doğrulamak için üç adet tanınmış veri seti üzerinde kapsamlı deneyler yaptık. Ayrıca, binlerce cümle ve duygu sınıfı çiftinden oluşan iki yeni veri seti oluşturduk. Deney sonuçları, önerilen modellerin performans iyileştirmeleri sağladığını göstermiştir.
|
|
With the advances in information technologies, the amount of available data on web sources where people express their opinions increases continually. Sentiment analysis supports decision-makers in gaining insights from massive heaps of data. It has gained much attraction recently as it has proven to be a practical tool in a wide range of areas, including monitoring public opinion. Nevertheless, sentiment analysis research is still facing some challenges. One of the main challenges is the irrelevant and redundant features in the data. Such features not only increase the search space enormously but also disrupt the context awareness of the model. Another main challenge is the lack of domain-agnostic models for the sentiment analysis tasks as an existing model may not be the best fit for another domain in terms of context. Although deep learning models provide high-performance results, they require a massive amount of labeled data. However, obtaining a sufficient amount of labeled data is often impractical.
In this thesis, we propose four models to remedy the aforementioned drawbacks. Our first model extracts the most informative features in the data for sentiment analysis. The second one constructs a context-refined word embedding model. The third model transfers the knowledge in pre-trained models to a new domain without the necessity of labeled data. The last one is a feature ensemble model that builds a pool of varying features for sentiment analysis. To verify the effectiveness of our models, we held extensive experiments on three benchmark datasets. Moreover, we introduced two novel datasets consisting of thousands of sentence and sentiment class pairs. Experiment results demonstrated that the proposed models yield performance improvements. |