Tez No İndirme Tez Künye Durumu
318843
An algorithm for the forward step of adaptive regression splines via mapping approach / Uyarlanabilir regresyon eğrilerinin ileriye doğru seçme aşaması için gönderim yaklaşımı ile yeni bir algoritma
Yazar:ELÇİN KARTAL KOÇ
Danışman: DOÇ. DR. İNCİ BATMAZ ; YRD. DOÇ. DR. CEM İYİGÜN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Ana Bilim Dalı
Konu:İstatistik = Statistics
Dizin:
Onaylandı
Doktora
İngilizce
2012
148 s.
Çok değişkenli uyarlanabilir regresyon eğrileri (MARS), çok boyutlu veri modellemesinde çıktı değişkeni ile girdi değişkenleri arasında doğrusal olmayan ilişkileri eğriler yardımıyla tahminlemede iyi bilinen bir doğrusal olmayan regresyon yöntemidir. MARS, fonksiyon tahminlemesinde kırılma noktalarıyla birbirinden ayrılan parçalı doğrusal fonksiyonlar kullanır. Fonksiyon tahminlemesinde kullanılan model iki aşamalı bir yöntemle oluşturulur: İleriye doğru seçme ve geriye doğru eleme. İlk aşamada çok fazla temel fonksiyonun yani kırılma noktasının bulunduğu genel bir model oluşturulur ve ikincide genel uyuma az katkıda bulunan temel fonksiyonlar elenir. Klasik uyarlanabilir eğri yöntemlerinde kırılma noktaları, ileriye doğru seçme yöntemini sayısal olarak pahalı yapan ve bölgesel yüksek yayılıma neden olan farklı veri noktalar kümesinden seçilirler. Bu zorluklardan kaçınmak için kırılma noktalarını verinin küçültülmesine yol açan veri noktalarının altkümesinden seçmek mümkün olabilir. Bu çalışmada orijinal veriyi daha az boyutlu uzaya dönüştüren, kendini örgütleyen eşleştirmeye dayalı bir yaklaşımı kullanılarak kırılma noktalarının seçilmesi için yeni bir yöntem önerilmiştir. Böylece MARS algoritmasının ileriye doğru seçme yönteminde model oluşturmak için daha az sayıdaki kırılma noktasının kullanımına olanak tanınmaktadır. Simule edilen ve altı gerçek hayat verisinden elde edilen sonuçlar, önerilen yöntemin model doğruluğunu ve tahminleme performansını düşürmeden model kurmada zaman açısından etkili bir yöntem olduğunu göstermektedir. Bu çalışmada önerilen yaklaşım hesaplama zamanlarını azaltarak MARS ve CMARS yöntemlerini iyileştirmek için yöntemlerin ileriye doğru aşamalarına alternatif olarak uyarlanmıştır.
In high dimensional data modeling, Multivariate Adaptive Regression Splines (MARS) is a well-known nonparametric regression technique to approximate the nonlinear relationship between a response variable and the predictors with the help of splines. MARS uses piecewise linear basis functions which are separated from each other with breaking points (knots) for function estimation. The model estimating function is generated in two stepwise procedures: forward selection and backward elimination. In the first step, a general model including too many basis functions so the knot points are generated; and in the second one, the least contributing basis functions to the overall fit are eliminated. In the conventional adaptive spline procedure, knots are selected from a set of distinct data points that makes the forward selection procedure computationally expensive and leads to high local variance. To avoid this drawback, it is possible to select the knot points from a subset of data points, which leads to data reduction. In this study, a new method (called S-FMARS) is proposed to select the knot points by using a self organizing map-based approach which transforms the original dataset to a lower dimensional space. Thus, a less number of knot points is enabled to be used for model building in the forward selection of MARS algorithm. The results obtained from simulated datasets and of six real-world datasets show that the proposed method is time efficient in model construction without degrading the model accuracy and prediction performance. In this study, the proposed approach is implemented to MARS and CMARS methods as an alternative to their forward step to improve them by decreasing their computing time.