Tez No İndirme Tez Künye Durumu
255446
A comparison of some robust regression techniques / Bazı sağlam regresyon yöntemlerinin bir karşılaştırması
Yazar:EZGİ AVCI
Danışman: PROF. DR. GÜLSER KÖKSAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Endüstri Mühendisliği Ana Bilim Dalı
Konu:Endüstri ve Endüstri Mühendisliği = Industrial and Industrial Engineering
Dizin:Sağlamlık = Robustness
Onaylandı
Yüksek Lisans
İngilizce
2009
155 s.
Saglam(robust) regresyon endüstriyel çalısmalarda; örnegin veri madenciligi,kalite kontrol ve iyilestirme ve finans alanlarında sıklıkla gerek duyulan biryaklasımdır. Saglam regresyon yöntemlerinden En Küçük Medyan Kareler, EnKüçük Budanmıs Kareler, M-regresyon, MM, En Küçük Mutlak Degerler,LOWESS ve MARS metotları yaklasık normal dagılıma göre aykırı degerleriisleme basarımı bakımından En Küçük Kareler metodu ile karsılastırılmıstır.Bu karsılastırmada; aykırı degerlerin oranı, x uzayındaki yeri, örneklembüyüklügü ve bagımsız degisken sayısı gibi parametreler degistirilerek birbenzetim çalısması gerçeklestirilmistir. Metotların karsılastırılmasında aykırıdegerleri belirlemede tip 1 ve 2 hata oranı, iyilestirilmis hata kareler ortalamasıve iyilestirilmis hata kareler ortalaması oranı gibi basarım ölçülerikullanılmıstır. Bu benzetim çalısması sonucunda en iyi basarım gösteren üçmetot bir endüstriyel veri seti üzerinde uygulanmıs olup belirleme katsayısı veortalama karesel hata basarım ölçülerine göre bu metotların basarımıtartısılmıstır.
Robust regression is a commonly required approach in industrial studies likedata mining, quality control and improvement, and finance areas. Among therobust regression methods; Least Median Squares, Least Trimmed Squares, Mregression,MM-method, Least Absolute Deviations, Locally Weighted ScatterPlot Smoothing and Multivariate Adaptive Regression Splines are comparedunder contaminated normal distributions with each other and Ordinary LeastSquares with respect to the multiple outlier detection performance measures. Inthis comparison; a simulation study is performed by changing some of theparameters such as outlier density, outlier locations in the x-axis, sample sizeand number of independent variables. In the comparison of the methods,multiple outlier detection is carried out with respect to the performancemeasures detection capability, false alarm rate and improved mean square errorand ratio of improved mean square error. As a result of this simulation study,the three most competitive methods are compared on an industrial data set withrespect to the coefficient of multiple determination and mean square error.