Tez No İndirme Tez Künye Durumu
305050
A computational approach to nonparametric regression: Bootstrapping CMARS method / Parametrik olmayan regresyon modeline hesaplamalı bir yaklaşım: Konik çok değişkenli uyarlanabilir regresyon eğrilerine (KÇURE) koruyan halka yönteminin uygulanması
Yazar:CEYDA YAZICI
Danışman: DOÇ. DR. İNCİ BATMAZ
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Bölümü
Konu:İstatistik = Statistics
Dizin:Bootstrap yöntemleri = Bootstrap methods ; Parametrik olmayan regresyon = Nonparametric regression
Onaylandı
Yüksek Lisans
İngilizce
2011
134 s.
Koruyan Halka (Bootstrap) yöntemi esas veri kümesine kitle gibi davranarak ondan örneklem alan bir yeniden örnekleme yöntemidir. Bu teknik, özellikle matematiksel çözümü olmayan problemlerde yaygın olarak kullanılmaktadır. Bu çalışmada, özel bir parametrik olmayan regresyon yöntemi olan Konik Çok Değişkenli Uyarlanabilir Regresyon Eğrilerine (KÇURE) ilişkin parametrelerin istatistiksel olarak önemli olup olmadığına karar vermek amacı ile deneysel dağılımlarını elde etmek için kullanılmıştır. Burada KÇURE yöntemi, konik ikinci derece eniyileme yöntemini kullanan ve iyi bilinen bir parametrik olmayan regresyon yöntemi olan Çok Değişkenli Uyarlanabilir Regresyon Eğrilerinin (ÇURE) değiştirilmiş özel bir şeklidir. Birçok ölçüte göre daha iyi başarıma sahip olduğu halde, KÇURE modeli ÇURE modelinden daha karmaşıktır. Bu problemin üstesinden gelebilmek ve KÇURE modelinin başarımını daha da iyileştirmek amacı ile üç farklı Koruyan Halka yöntemi, Sabit-X, Rastgele-X ve de Aşırı (Wild) Koruyan Halka yöntemi, büyüklük ve ölçekleri bakımından farklı dört veri kümesine uygulanmıştır. Daha sonra geliştirilen modellerin başarımları doğruluk, kesinlik, karmaşıklık, durağanlık (stability), sağlamlık (robustness) ve etkinlik (efficiency) ölçütleri açısından karşılaştırılmıştır. Rastgele-X yöntemi, daha az etkin olmasına rağmen özellikle orta büyüklükte ve ölçekte veri kümeleri için daha kesin, doğru ve daha az karmaşık modeller üretmiştir.
Bootstrapping is a resampling technique which treats the original data set as a population and draws samples from it with replacement. This technique is widely used, especially, in mathematically intractable problems. In this study, it is used to obtain the empirical distributions of the parameters to determine whether they are statistically significant or not in a special case of nonparametric regression, Conic Multivariate Adaptive Regression Splines (CMARS). Here, the CMARS method, which uses conic quadratic optimization, is a modified version of a well-known nonparametric regression model, Multivariate Adaptive Regression Splines (MARS). Although performing better with respect to several criteria, the CMARS model is more complex than that of MARS. To overcome this problem, and to improve the CMARS performance further, three different bootstrapping regression methods, namely, Random-X, Fixed-X and Wild Bootstrap are applied on four data sets with different size and scale. Then, the performances of the models are compared using various criteria including accuracy, precision, complexity, stability, robustness and efficiency. Random-X yields more precise, accurate and less complex models particularly for medium size and medium scale data even though it is the least efficient method.