Fikir hedefi çıkarımı, metin verisinde duygu analizinin temel görevlerinden biridir. Son yıllarda, fikir hedefi çıkarımı için bağımlılık ayrıştırıcı tabanlı yaklaşımlar yaygın olarak incelenmiştir. Ancak, bağımlılık ayrıştırıcıları, dil ve dilbilgisi kısıtlamaları ile sınırlıdır. Bu yüzden, bu tez çalışmasında, bilinmeyen alanlardaki İngilizce ürün
yorumlarından alanlar arası fikir hedefi çıkarımı için, böyle kısıtları olmayan, sıralı desen temelli bir kural madenciliği modeli önerilmiştir. Böylece, fikir hedefleri çıkarılırken yorumların alanını bilmeye gerek kalmamaktadır. Önerilen model, literatürde sıklıkla karıştırılan fikir hedefi ve özellik kavramları arasındaki farkı da ortaya koymaktadır. Model, iki aşamadan oluşmaktadır. İlk aşamada, hedef alana ait yorum içerisindeki özellikler, kaynak alanlardan otomatik olarak üretilen kurallar kullanılarak çıkarılmaktadır. Ayrıca, kaynak alanlardaki özellikler hedef alana transfer edilmektedir. Bu aşamada ek olarak, özellik çıkarma performansını arttırmak için özellik budama
uygulanmaktadır. İkinci aşamada, fikir hedefi çıkarımı için otomatik olarak üretilen kurallar kullanılarak, ilk aşamada çıkarılan özellikler arasından fikir hedefleri çıkarılmaktadır. Önerilen model, farklı alanlardaki veri kümeleri üzerinde
değerlendirilmiş ve literatürdeki modellerle karşılaştırılmıştır. Deneysel sonuçlar, bilinmeyen alanlardaki yorumların fikir hedeflerinin, önceki çalışmalara kıyasla daha yüksek doğrulukla çıkarılabildiğini göstermiştir.
|
Opinion target extraction is one of the core tasks in sentiment analysis on text data. In recent years, dependency parser–based approaches have been commonly studied for opinion target extraction. However, dependency parsers are limited by language and grammatical constraints. Therefore, in this thesis, a sequential pattern-based rule mining model, which does not have such constraints, is proposed for cross-domain opinion target extraction from English product reviews in unknown domains. Thus, knowing the domain of reviews while extracting opinion targets becomes no longer a requirement. The
proposed model also reveals the difference between the concepts of opinion target and aspect, which are commonly confused in the literature. The model consists of two stages. In the first stage, the aspects of reviews are extracted from the target domain using the rules automatically generated from source domains. The aspects are also transferred from
the source domains to a target domain. Moreover, aspect pruning is applied to further improve the performance of aspect extraction. In the second stage, the opinion target is extracted among the aspects extracted at the former stage using the rules automatically generated for opinion target extraction. The proposed model was evaluated on several benchmark datasets in different domains and compared against the literature. The experimental results revealed that the opinion targets of the reviews in unknown domains can be extracted with higher accuracy than those of the previous works. |