Tez No İndirme Tez Künye Durumu
255575
A comparison of data mining methods for prediction and classification types of quality problems / Tahmin etme ve sınıflandirma kalite problemleri özelinde veri madenciliği metotlarının karşılaştırılması
Yazar:ZEYNEP ANAKLI
Danışman: DOÇ. DR. ESRA KARASAKAL ; PROF. DR. GÜLSER KÖKSAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Endüstri Mühendisliği Ana Bilim Dalı
Konu:Endüstri ve Endüstri Mühendisliği = Industrial and Industrial Engineering
Dizin:Analitik ağ süreci = Analytical network process ; Sınıflandırma = Classification ; Veri madenciliği = Data mining
Onaylandı
Yüksek Lisans
İngilizce
2009
207 s.
Bu çalışmada, veri madenciliği literatüründeki en yaygın tahmin etme ve sınıflandırma metotlarının performansları Analitik Ağ Süreci (AAS) ve Zenginleştirme Değerlendirmeleri için Sıralama Organizasyon Metodu (PROMETHEE) kullanılarak, birden çok kritere göre kalite iyileştirme verisi özelinde değerlendirilmektedir.Veri madenciliğinde sıklıkla kullanılan tahmin etme ve sınıflandırma metotlarının kalite iyileştirme de olmak üzere bir çok alanda uygulamaları bulunmaktadır. Çok sayıda tahmin etme ve sınıflandırma metodu vardır. Ancak, daha önce bu metotların karşılaştırılması için yapılan çalışmalar kalite iyileştirme verileri için geçerli olmayabilir. Üstelik bu çalışmalarda bütün karar kriterleri değerlendirilmemiştir. Metotların performansları değerlendirilirken bu kriterler ve aralarındaki etkileşimler de hesaba katılmalıdır.Bu çalışmada sınıflandırma metotlarından karar ağaçları (DT), sinir ağları (NN), MARS, lojistik regresyon (LR), Mahalanobis-Taguchi Sistemi (MTS), bulanık sınıflandırma (FC) ve destek vektör makinaları (SVM); tahmin etme metotlarından da DT, NN, MARS, çoklu doğrusal regresyon (MLR), bulanık regresyon (FR) ve robust regresyon (RR) AAS ve PROMETHEE yöntemleri kullanılarak kapsamlı bir karar kriteri kümesi değerlendirilerek önceliklendirilmiştir.Bu çalışmada elde edilen sonuçlara göre, hem sınıflandırma hem de tahmin etme metotları içinde, MARS en iyi metottur. Ayrıca, elde edilen sonuçların karar kriterlerinin ağırlıklarına ve metotlar arasındaki performans farkını ölçecek olan eşik değerine olan duyarlılığı değerlendirilmiştir. Analiz sonuçları, elde edilen önceliklendirme sonuçlarının bu parametlere duyarlılığı olmadığını göstermiştir.Anahtar Kelimeler: Sınıflandırma, Tahmin etme, Analitik Ağ Süreci, PROMETHEE Veri Madenciliği
In this study, an Analytic Network Process (ANP) and Preference Ranking Organization MeTHod for Enrichment Evaluations (PROMETHEE) based approach is developed and used to compare overall performance of some commonly used classification and prediction data mining methods on quality improvement data, according to several decision criteria.Classification and prediction data mining (DM) methods are frequently used in many areas including quality improvement. Previous studies on comparison of performance of these methods are not valid for quality improvement data. Furthermore, these studies do not consider all relevant decision criteria in their comparison. All relevant criteria and interdependencies among criteria should be taken into consideration during the performance evaluation.In this study, classification DM methods namely; Decision Trees (DT), Neural Networks (NN), Multivariate Adaptive Regression Splines (MARS), Logistic Regression (LR), Mahalanobis-Taguchi System (MTS), Fuzzy Classifier (FC) and Support Vector Machine (SVM); prediction DM methods DT, NN, MARS, Multiple Linear Regression (MLR), Fuzzy Regression (FR) and Robust Regression (RR) are prioritized according to a comprehensive set of criteria using ANP and PROMETHEE.According to results of this study, MARS is found superior to the other methods for both classification and prediction. Moreover, sensitivity of the results to changes in weights and thresholds of the decision criteria is analyzed. These analyses show that resulting priorities are very insensitive to these parameters.Keywords: Classification, Prediction, Analytic Network Process, PROMETHEE, Data mining