Tez No |
İndirme |
Tez Künye |
Durumu |
770698
|
|
Metin sınıflandırması için sınıflandırıcı topluluğu yaklaşımları / Ensemble methods for text classification
Yazar:İSMAİL TERZİ
Danışman: DOÇ. DR. ALPER KÜRŞAT UYSAL
Yer Bilgisi: Eskişehir Teknik Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Yazılımı Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Metin sınıflandırma = Text categorization
|
Onaylandı
Doktora
Türkçe
2022
96 s.
|
|
Geleneksel metin sınıflandırma yöntemleri sınıflandırılacak her metin için bir sınıflandırıcı kullanır. Çoklu Sınıflandırıcı Sistemleri sınıflandırma doğruluğunu artırmak için kullanılan popüler araştırma alanıdır. Dinamik Sınıflandırıcı Seçimi ve Dinamik Sınıflandırıcı Topluluğu Seçimi, çoklu sınıflandırıcı sistemlerinin iki popüler biçimidir. Dinamik Sınıflandırıcı Topluluğu Seçiminde sınıflandırıcı havuzundan bir sınıflandırıcı topluluğu seçilir ve kararları birleştirilir, Dinamik Sınıflandırıcı Seçiminde ise metin sınıflandırmak için sınıflandırıcı havuzundan sadece bir sınıflandırıcı seçilir. Bu tez çalışmasında, mevcut Dinamik Sınıflandırıcı Topluluğu Seçimi ve Dinamik Sınıflandırıcı Seçimi yöntemleri metin sınıflandırma problemine uygulanmış ve metin sınıflandırmada sınıflandırma doğruluğunu artırdığı gösterilmiştir. Aynı zamanda metin sınıflandırması için Dinamik Sınıflandırıcı Seçimine dayalı yeni bir yöntem olan DCS-DQ yöntemi önerilmiştir. Deneysel çalışmalarda farklı özelliklere sahip metin veri setleri kullanılmıştır. Önerilen DCS-DQ yöntemi, popüler 7 Dinamik Sınıflandırıcı Seçimi yöntemi ile karşılaştırılmıştır. Deney sonuçlarına göre, önerilen DCS-DQ yöntemi, öznitelik boyutlarının çoğunluğu için sınıflandırma doğruluğu açısından diğer 7 Dinamik Sınıflandırıcı Seçimi yönteminden daha iyi performans göstermektedir. Sonuç olarak, önerilen DCS-DQ yöntemi, metin sınıflandırması için sınıflandırma doğruluğunu önemli oranda iyileştirmektedir.
|
|
Traditional text classification methods use only one classifier for each text to be classified. Multiple Classifier Systems is a popular research area used to improve classification accuracy. Dynamic Classifier Selection and Dynamic Ensemble Selection are two forms of multiple classifier systems. In Dynamic Ensemble Selection, a classifier ensemble is selected from the classifier pool and their decisions are combined, whereas in Dynamic Classifier Selection, only one classifier is selected from the classifier pool to classify text. In this thesis, existing Dynamic Ensemble Selection and Dynamic Classifier Selection methods have been applied to the text classification problem and it has been shown to increase the classification accuracy in text classification. The other contribution is, a DCS-DQ method, which is a new Dynamic Classifier Selection-based method for text classification, is proposed. In experimental studies, text datasets with different properties were used. The proposed DCS-DQ method is compared with 7 popular Dynamic Classifier Selection methods. According to the experimental results, the proposed DCS-DQ method outperforms the other 7 Dynamic Classifier Selection methods in terms of classification accuracy for the majority of feature sizes. As a result, the proposed DCS-DQ method significantly improves the classification accuracy for text classification. |