Tez No İndirme Tez Künye Durumu
437874
Görüş sınıflandırma için makine öğrenmesi algoritmalarına dayalı bir yöntem tasarımı ve gerçekleştirimi / The design and implementation of a method for opinion classification based on machine learning algorithms
Yazar:AYTUĞ ONAN
Danışman: PROF. DR. MUSTAFA SERDAR KORUKOĞLU ; YRD. DOÇ. DR. HASAN BULUT
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2016
175 s.
Görüş sınıflandırma, doğal dil işleme, makine öğrenmesi ve istatistik disiplinlerinden, yöntem, teknik ve araçların kullanılması ile metin belgelerinde yer alan öznel bilgilerin belirlenmesine yönelik bir araştırma alanıdır. Bu tez çalışması kapsamında, görüş madenciliği, bir metin sınıflandırma problemi olarak ele alınarak makine öğrenmesi yöntemleri aracılığıyla etkin görüş sınıflandırma yöntemleri geliştirilmiştir. Geliştirilen yöntemler üç temel çatı altında incelenebilir. Birincisi, metin sınıflandırmada karşılaşılan en önemli problemlerden biri olan yüksek boyutluluk ve seyrekliği ortadan kaldırmak amacıyla temel filtre tabanlı öznitelik seçim yöntemlerini etkin bir şekilde birleştiren genetik algoritma ile sıra birleştirmeye dayalı öznitelik seçimi yöntemidir. İkinci olarak, sınıflandırıcı topluluğunda yer alan temel öğrenme algoritmalarının, topluluk çıktısına, doğru sınıflandırma başarımlarına göre katkı koymalarına yönelik, çok amaçlı diferansiyel gelişim algoritmasına dayalı ağırlıklı oylama sınıflandırıcı topluluğu birleştirme kuralıdır. Üçüncü olarak ise, topluluk öğrenmesi sürecinin, topluluk budama aşamasında, uygun öğrenme algoritmalarının seçilmesine yönelik yöntem geliştirilmesidir. Geliştirilen sınıflandırıcı topluluğu budama yönteminde, ortak kümeleme ve metasezgisel aramadan yararlanılmıştır. Geliştirilen yöntemlere dayalı yeni bir sınıflandırma mimarisi önerilmiştir. Bu mimari ile geliştirilen yöntemler etkin bir şekilde birleştirilerek mevcut ve geliştirilen yöntemlerin bireysel performanslarına kıyasla daha iyi başarım elde edilmiştir.
Opinion classification, which utilizes methods, techniques and tools from natural language processing, machine learning and statistics, is a research field to determine subjective information in the text documents. In this thesis, opinion mining is regarded as a text classification problem to build an efficient opinion classification scheme based on machine learning methods. The developed methods can be grouped into three categories. First, a feature selection method based on genetic rank aggregation, which integrates individual filter-based feature selection methods in an effective way, is presented to overcome the high dimensionality and sparsity problems encountered in text classification. Secondly, a classifier ensemble combination rule based on multi-objective differential evolution algorithm is presented so that the base learning algorithms of the classifier ensemble can contribute to the final outcome of the ensemble according to their predictive performance. Thirdly, an ensemble pruning scheme is presented to obtain an appropriate subset of classifiers from the ensemble. In the proposed pruning scheme, consensus clustering and metaheuristic search are utilized. A novel classification architecture is proposed based on the developed methods. With this framework, developed methods are combined in an effective way and the predictive performance of the framework is enhanced compared to the individual performances of the standard and the developed methods.