Tez No |
İndirme |
Tez Künye |
Durumu |
420255
|
|
Sentiment analysis in turkish: Resources and techniques / Türkçede duygu analizi: Kaynaklar ve teknikler
Yazar:RAHİM DEHKHARGHANİ
Danışman: DOÇ. DR. YÜCEL SAYGIN ; DOÇ. DR. AYŞE BERRİN YANIKOĞLU YEŞİLYURT
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
İngilizce
2015
99 s.
|
|
Günlük hayattaki verilerin artış hızından dolay, bu verilerin üzerine manual olarak
analiz yapmak yöntemleri kullanışsız olmaya başlıyorlar. Sosyal media (orneği
Twitter) bu alanda bilgi depolaması ve insanlara kendi fikirlerinin paylaşması konusunda
önemli bir rol oynuyamaktadır. İnsanların duüşüncelerini sosyal mediadan çıkarmak,
şirketler için önemli bir amac sayılır. Duygu analizi metinlerin (veya diğer veri
tiplerin) olumlu veya olumsuz oldukların çıkarmaya çaliışıyor. Bu işlem, ticari ve
gayri-ticari bir çok alanda kullanışlı olabilir.
Sirketler kendi urunleri ve servisleri hakknda musterilerin yorumlarn bilmek istiyorlar.
Aynı zamanda müşterilerde diğer müşterilerin fikirlerini ürünlere göre
öğrenmek isterler. Başka bir örnek verilecek olursa, siyasi partilerde insanların
politik olaylara karşı fikir ve düşüncelerine önem gostermek zorundadırlar. Bunların otomatik veya yarı otomatik yöntemlerle yaplmaları gerekmektedir.
Duygu analiz teknikleri her dilde o dilin yapsına göre farklılık gösterir. Diğer
dillere oranla daha fazla araştırma kaynağına ve sözlüklere sahip olduğundan
dolayı, bu alanda en zengin dil İngilizce olarak gösterilebilir. Yapılan araştrmaların
coğu İngilizce üzerine olduğundan dolayı, diğer diller bu alandaki araştırma kaynakların eksikliğini hissediyorlar. Bu nedenden dolay Türkçe duygu analizi
alannda daha fazla kaynak sunabilmek için bu doktora tezi bu konuda yapmaya
karar verdik. Bu çalşmamda Türkçe duygu anlizi yapabilmek için kapsamlı bir
sistem tasarlayıp ve geliştirdik. Bu sistemde bir kaç Türkçe sözlük üretip, bunları
duygu analizi yapmak icin kullandık. Bunun dışında, problemi kapsaml bir
şekilde araştırıp, onu daha kuüçük problemlere böldük. Üzerine kuüçük değisiklikler
yapılırsa tasarladığımız sistem, diğer diller için de kullanlabilir. Tüm problemleri
bu çalışmamızda cçözülmemiş olsak bile, her problem için farklı bir cçözum yöntemi
önerdik. Elde ettiğimiz sonuçlar, uyguladığımız yöntemlerin başarılı olduğunu
kanıtlamaktadır.
|
|
Due to the ever-increasing amount of online information, manual processing of
data is impractical. Social media such as Twitter play an important role in storing
such information and helping people share their ideas. Extracting the attitude and
opinion of people from user entered data is worthwhile for companies. Sentiment
analysis attempts to extract the embedded polarity from a segment of text (or
other data types) with many commercial and con-commercial applications.
Companies are interested in opinions of their customers. On the other hand,
customers are interested in opinions of other customers. Politicians and policy
makers are also interested in public's feedback on political events. The above
mentioned opinions can be (semi)automatically extracted from social media such
as Twitter or Facebook by the help of sentiment analysis techniques.
Sentiment analysis is a language (e.g. English) dependent task that relies on
natural language processing techniques. The richest language in terms of resources
and research in sentiment analysis is English, while many other languages such as
Turkish suer from a lack of resources and techniques for sentiment analysis. In
this thesis, we try to ll this gap by designing and implementing a framework
for sentiment analysis in Turkish. This framework can also be adapted to other
languages with some minor changes. In the scope of the framework, we have
built a few Turkish polarity lexicons for the rst time in the literature. We also
comprehensively investigated the problem of sentiment analysis in Turkish and
suggested some solutions. Experimental evaluation shows the effectiveness of the
proposed resources and techniques for Turkish. |