Tez No İndirme Tez Künye Durumu
420255
Sentiment analysis in turkish: Resources and techniques / Türkçede duygu analizi: Kaynaklar ve teknikler
Yazar:RAHİM DEHKHARGHANİ
Danışman: DOÇ. DR. YÜCEL SAYGIN ; DOÇ. DR. AYŞE BERRİN YANIKOĞLU YEŞİLYURT
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2015
99 s.
Günlük hayattaki verilerin artış hızından dolay, bu verilerin üzerine manual olarak analiz yapmak yöntemleri kullanışsız olmaya başlıyorlar. Sosyal media (orneği Twitter) bu alanda bilgi depolaması ve insanlara kendi fikirlerinin paylaşması konusunda önemli bir rol oynuyamaktadır. İnsanların duüşüncelerini sosyal mediadan çıkarmak, şirketler için önemli bir amac sayılır. Duygu analizi metinlerin (veya diğer veri tiplerin) olumlu veya olumsuz oldukların çıkarmaya çaliışıyor. Bu işlem, ticari ve gayri-ticari bir çok alanda kullanışlı olabilir. Sirketler kendi urunleri ve servisleri hakknda musterilerin yorumlarn bilmek istiyorlar. Aynı zamanda müşterilerde diğer müşterilerin fikirlerini ürünlere göre öğrenmek isterler. Başka bir örnek verilecek olursa, siyasi partilerde insanların politik olaylara karşı fikir ve düşüncelerine önem gostermek zorundadırlar. Bunların otomatik veya yarı otomatik yöntemlerle yaplmaları gerekmektedir. Duygu analiz teknikleri her dilde o dilin yapsına göre farklılık gösterir. Diğer dillere oranla daha fazla araştırma kaynağına ve sözlüklere sahip olduğundan dolayı, bu alanda en zengin dil İngilizce olarak gösterilebilir. Yapılan araştrmaların coğu İngilizce üzerine olduğundan dolayı, diğer diller bu alandaki araştırma kaynakların eksikliğini hissediyorlar. Bu nedenden dolay Türkçe duygu analizi alannda daha fazla kaynak sunabilmek için bu doktora tezi bu konuda yapmaya karar verdik. Bu çalşmamda Türkçe duygu anlizi yapabilmek için kapsamlı bir sistem tasarlayıp ve geliştirdik. Bu sistemde bir kaç Türkçe sözlük üretip, bunları  duygu analizi yapmak icin kullandık. Bunun dışında, problemi kapsaml bir şekilde araştırıp, onu daha kuüçük problemlere böldük. Üzerine kuüçük değisiklikler yapılırsa tasarladığımız sistem, diğer diller için de kullanlabilir. Tüm problemleri bu çalışmamızda cçözülmemiş olsak bile, her problem için farklı bir cçözum yöntemi önerdik. Elde ettiğimiz sonuçlar, uyguladığımız yöntemlerin başarılı olduğunu kanıtlamaktadır.
Due to the ever-increasing amount of online information, manual processing of data is impractical. Social media such as Twitter play an important role in storing such information and helping people share their ideas. Extracting the attitude and opinion of people from user entered data is worthwhile for companies. Sentiment analysis attempts to extract the embedded polarity from a segment of text (or other data types) with many commercial and con-commercial applications. Companies are interested in opinions of their customers. On the other hand, customers are interested in opinions of other customers. Politicians and policy makers are also interested in public's feedback on political events. The above mentioned opinions can be (semi)automatically extracted from social media such as Twitter or Facebook by the help of sentiment analysis techniques. Sentiment analysis is a language (e.g. English) dependent task that relies on natural language processing techniques. The richest language in terms of resources and research in sentiment analysis is English, while many other languages such as Turkish su er from a lack of resources and techniques for sentiment analysis. In this thesis, we try to ll this gap by designing and implementing a framework for sentiment analysis in Turkish. This framework can also be adapted to other languages with some minor changes. In the scope of the framework, we have built a few Turkish polarity lexicons for the rst time in the literature. We also comprehensively investigated the problem of sentiment analysis in Turkish and suggested some solutions. Experimental evaluation shows the eff ectiveness of the proposed resources and techniques for Turkish.