Tez No |
İndirme |
Tez Künye |
Durumu |
341038
|
|
Sentiment-focused web crawling / Düşünce odaklı web tarayıcılık
Yazar:AVNİ GÜRAL VURAL
Danışman: DOÇ. DR. PINAR KARAGÖZ ; DR. BERKANT BARLA CAMBAZOĞLU
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Türkçe = Turkish
|
Onaylandı
Doktora
İngilizce
2013
112 s.
|
|
Web 2.0'ın gelişi, Web üzerinde yer alan düşünce ve görüş içeriğinin artmasını sağlamıştır. Düşünce ve görüş içeren içerikler sıkça sosyal medya sitelerinde ürün yorumu, kullanıcı yorumu, tartışma forum mesajı, durum güncellemesi, kişisel blog sayfası, haber sayfası, ürün açıklaması şeklinde bulunmaktadır. Düşünce içeriklerinin analizinin web arama, içeriksel reklam, tavsiye gibi bir çok önemli uygulaması mevcuttur. Düşünce içeriklerinin çoğu hemen keşfedilmezse değerlerini kaybetmektedir, bu nedenle bu içeriklerin zamanında keşfi çok önemlidir. Şu ana kadar bütün odaklı web tarayıcılar konu odaklı çalışmaktadır ve bu yaklaşım düşünce içeren sayfaların keşfedilmesinde yetersiz kalmaktadır. Ayrıca, bu zamana kadar düşünce analizi ile ilgili yürütülen araştırmalar ağırlıklı olarak İngilizce diline odaklanmıştır.
Bu tezde odaklı web tarayıcılığa yeni bir perspektif getirilmektedir. İlk önce, düşünce içeren sayfaların daha hızlı keşfini sağlayan bir düşünce odaklı web tarayıcı çatısı önerilecek ve ClueWeb09-B web sayfası koleksiyonu üzerinde simülasyonlar ile değerlendirmeler yapılacaktır. İkinci olarak, Türkçe düşünce analizi çatısı önerilecek ve popüler Türkçe sosyal medya site verileri üzerinde deneyler gerçekleştirilecektir. En son olarak, önerilen bu iki çatı birleştirilerek Türkçe için düşünce odaklı web tarayıcı çatısı sunulacaktır.
|
|
The advent of Web 2.0 has led to an increase in the amount of sentimental content available in the Web. Such content is often found in social media web sites in the form of product reviews, user comments, testimonials, messages in discussion forums, status updates, and personal blogs as well as in other forms, including opinions in personal pages, news articles, and product descriptions. The analysis of sentimental content has a number of important applications, most important being web search, contextual advertisement, and recommendation. The timely discovery of sentimental content is important as most sentiments quickly lose their value if they are not immediately discovered. So far, all focused crawlers work in a topic-specific manner and fall short when sentimental pages are focused to be discovered. In addition, up to date, most of the research carried on sentiment analysis was focused on English language.
In this thesis, we present a new perspective for focused web crawling. First, we propose a sentiment-focused web crawling framework to facilitate the quick discovery of sentimental content and evaluate it via simulations over the publicly available ClueWeb09-B web page collection. Second, we propose a framework for unsupervised sentiment analysis in Turkish and perform experiments with data from popular Turkish social media sites. Finally, we consolidate our frameworks and present a customized version of sentiment-focused web crawling framework for Turkish. |