Tez No İndirme Tez Künye Durumu
444675
Product search engine using product name recognition and sentiment analysis / Duygu analizi ve ürün isim tanımlama kullanan ürün arama motoru
Yazar:FURKAN GÖZÜKARA
Danışman: DOÇ. DR. SELMA AYŞE ÖZEL
Yer Bilgisi: Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Hiyerarşik kümeleme = Hierarchical clustering ; Veri madenciliği = Data mining
Onaylandı
Doktora
İngilizce
2016
235 s.
Bu çalışmada, odaklı tarayıcı, kayıt eşleştirme ve duygu analizi sistemlerinden oluşan özgün bir ürün arama motoru önerilmiştir. E-ticaret siteleri için özgün bir odaklı tarayıcı geliştirilmiş ve bu süreçteki zorluklar ve bu zorluklara önerilen çözüm önerileri detaylı bir şekilde sunulmuştur. E-ticaret ürünlerine yapılan yorumları olumlu ve olumsuz şeklinde sınıflandıracak bir duygu analizi sistemi geliştirilmiştir. Farklı E-ticaret sitelerinden toplanmış aynı ürün isimlerini tanıyacak özgün bir kayıt eşleştirme sistemi sunulmuştur. Kayıt eşleştirme sistemi, dinamik/artımsal olacak şekilde değiştirilmiş Hiyerarşik Tümevarım Kümeleme algoritması üzerine kurulmuştur ve önerdiğimiz ürün kodu eşleştirme sistemi ile kümeleme yaparken ürün ismi karşılaştırma sayısını oldukça azaltmaktadır. Bu sistemlere ek olarak, ürün arama motoru için bir arama sistemi ve kullanıcı ara yüzü de geliştirilmiştir. Bu tez çalışmasında, web taramasında %472 performans artışı, duygu analizinde %91.08 doğruluk, kayıt eşleştirme sisteminde %96.25 F-ölçütü, ve en alakalı ürünleri arama sisteminde %100 isabet elde eden tam kapsamlı bir ürün arama motoru sunulmuştur. Önerilen sistem mevcut sistemlerden daha iyi bir kullanıcı deneyimi sunmayı başarmaktadır.
In this study, a novel product search engine system which consists of a focused crawler, a record linkage system and a sentiment analyzer is proposed. We develop an original focused web crawler for E-commerce sites, and the challenges and our proposed solutions are presented in detail. A sentiment analyzer is developed to classify E-commerce product comments into polarities as negative or positive. A novel record linkage system for E-commerce products is proposed to recognize the same product names collected from different E-commerce sites. The record linkage system is based on a modified dynamic/incremental Hierarchical Agglomerative Clustering algorithm which employs our proposed product code matching system to reduce number of product name comparisons during clustering. In addition to these systems, a search system and a user interface are developed for the product search engine. In this thesis, we present a full scale product search engine that obtains %472 performance boosts in the crawler, 91.08% accuracy in the sentiment analysis, 96.25% F-measure in the record linkage, and 100% precision in most related products search. The proposed system achieves to provide better user experience than the existing systems.