Tez No İndirme Tez Künye Durumu
691012
Comparison of predictive performances of logistic regression and decision tree algorithms: An application of life satisfaction / Lojistik regresyon ve karar ağacı algoritmalarının tahmin edici performanslarının karşılaştırılması: Yaşam memnuniyeti uygulaması
Yazar:ARZU
Danışman: DOÇ. DR. ÖZGÜL VUPA ÇİLENGİROĞLU
Yer Bilgisi: DOKUZ EYLÜL ÜNİVERSİTESİ / FEN BİLİMLERİ ENSTİTÜSÜ / İSTATİSTİK ANABİLİM DALI / İstatistik Bilim Dalı
Konu:İstatistik = Statistics
Anahtar Kelime:
Onaylandı
Yüksek Lisans
İngilizce
2021
111 s.
Makine öğrenimindeki karar ağacı algoritmaları ve regresyon, veri sınıfları oluşturur. Değişkenler arasındaki ilişkiler modellenir. Karar ağaçları, eğitim verilerini kullanarak sınıflandırma kuralları oluşturur. Ayrıca bu kuralları test verileri üzerinde test eder. Böylece karar ağacı algoritmanın başarısını belirler. Lojistik regresyonda oluşturulan model ile sınıflandırma oluşturulur ve sınıflandırma performansı bulunur. Bu yöntemlerin yorumlanması kolaydır. Büyük veri kümelerine kolayca uygulanır. Varsayımların olmaması nedeniyle birçok farklı alanda kullanılmaktadır. Yaşam memnuniyeti kavramının bir parçası olan memnuniyet, ihtiyaçların, arzuların ve isteklerin karşılanmasıdır. Yaşam memnuniyeti, bir kişinin tüm yaşamıyla ilgilenir. Yaşam memnuniyeti, bireylerin kendi yaşam kalıpları ve standartları ile ilişkili süreçler bütünüdür. Bu çalışmanın amacı, Türkiye İstatistik Kurumu (TÜİK) tarafından 2017 yılı için elde edilen yaşam memnuniyeti verilerini (n=8430) kullanarak lojistik regresyon yöntemi ve karar ağacı algoritmaları (CART, CHAID, QUEST) tahmin edicilerinin performanslarını karşılaştırmaktır. Bu çalışmada performans karşılaştırmaları (doğruluk, duyarlılık, seçicilik, kesinlik, F-puanı) yapılmış ve yaşam memnuniyeti kavramını en iyi açıklayan modelin QUEST algoritması olduğu bulunmuştur.
Decision tree algorithms and regression in machine learning create classes of data. Relationships between variables are modeled. Decision trees create classification rules using training data. They also test these rules on test data. Thus, the decision tree determines the success of the algorithm. With the model created in logistic regression, classification is created and classification performance is found. These methods are easy to interpret. They are easily applied to large data sets. They are used in many different fields due to the lack of assumptions. Satisfaction, which is a part of the concept of life satisfaction, is the fulfillment of needs, desires and wishes. Life satisfaction deals with a person's entire life. Life satisfaction is the whole of processes related to individuals' own life patterns and standards. The aim of this study is to compare the performances of logistic regression method and decision tree algorithms (CART, CHAID, QUEST) estimators using life satisfaction data (n = 8430) obtained by the Turkish Statistical Institute (TURKSTAT) for the year 2017. In this study, performance comparisons (accuracy, sensitivity, selectivity, precision, F-score) were made and it was found that the model that best explains the concept of life satisfaction is the QUEST algorithm.