Tez No İndirme Tez Künye Durumu
255294
A simulation study on the comparison of methods for the analysis of longitudinal count data / Uzunlamasına kesikli veri analizi için yöntemlerin karşılaştırılması üzerine bir benzetim çalışması
Yazar:GÜL İNAN
Danışman: DR. ÖZLEM İLK
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Bölümü / İstatistik Ana Bilim Dalı
Konu:İstatistik = Statistics
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2009
91 s.
Ölçümlerin, uzunlamasına özelliği ve bağımlı değişkenin sayım süreci, uzunlamasına kesikli veri analizi için geliştirilen regresyon modellerin birey içi ölçümler arası bağımlılık ve aşırı yayılım gibi olguları dikkate almasını sağlamaktadır. Uzunlamasına çalışmalarda, analizlere fazladan zorluk katan, ortak bir sorun, kayıp veri problemidir. Bu problem kayıp veri çözüm teknikleri vasıtasıyla üstesinden gelinebilir. Fakat verideki kayıp değer miktarı ve de verinin sahip olduğu kayıp veri mekanizması, çözüm tekniklerinin başarısını etkilemektedir. Bu tez çalışmasında, uzunlamasına kesikli veri için geliştirilmiş olan regresyon modelleri arasından, Log-Log-Gama marjinalleştirilmiş çok düzeyli model ile rasgele sabit terimli model üzerinde durulmuştur. Modellerin başarıları bir benzetim çalışması üzerinden, üç kayıp veri mekanizması (tamamıyla rasgele kayıp, gözlenmiş veriye bağlı rasgele kayıp, rasgele olmayan kayıp), iki tür kayıp yüzdesi (% 10 ve % 20), ve dört farklı kayıp veri çözüm tekniği (tüm durum analizi, yerine zaman ortalaması yükleme, yerine grup ortalaması yükleme, yerine regresyon yöntemiyle yükleme) altında karşılaştırılmıştır. Benzetim çalışması, Log-Log-Gama marjinalleştirilmiş çok düzeyli modelinin rasgele sabit terimli modelinden daha büyük ortalama mutlak hata ve ortalama karesel hata ürettiğini gösterirken, her iki regresyon modelinde paralel sonuçlar gözlenmektedir. Benzetim çalışması sonuçları, her iki regresyon modelinde de veri içindeki kayıp değer miktarı ve kayıp veri mekanizmasının, kayıp veri çözüm tekniğinin başarısını ciddi bir şekilde etkilediğini doğrulamaktadır. Ayrıca, genellikle yerine zaman ortalaması yükleme tekniği en kötü başarıyı gösterirken, yerine regresyon yöntemiyle yükleme tekniği, yerine zaman ortalaması yükleme ve yerine grup ortalaması yükleme tekniklerine nazaran üstün bir başarı sergilemektedir ve tüm durum analiziyle benzer sonuçlar doğurmaktadır.
The longitudinal feature of measurements and counting process of responses motivate the regression models for longitudinal count data (LCD) to take into account the phenomenons such as within-subject association and overdispersion. One common problem in longitudinal studies is the missing data problem, which adds additional difficulties into the analysis. The missingness can be handled with missing data techniques. However, the amount of missingness in the data and the missingness mechanism that the data have affect the performance of missing data techniques. In this thesis, among the regression models for LCD, the Log-Log-Gamma marginalized multilevel model (Log-Log-Gamma MMM) and the random-intercept model are focused on. The performance of the models is compared via a simulation study under three missing data mechanisms (missing completely at random, missing at random conditional on observed data, and missing not random), two types of missingness percentage (10% and 20%), and four missing data techniques (complete case analysis, subject, occasion and conditional mean imputation). The simulation study shows that while the mean absolute error and mean square error values of Log-Log-Gamma MMM are larger in amount compared to the random-intercept model, both regression models yield parallel results. The simulation study results justify that the amount of missingness in the data and that the missingness mechanism that the data have, strictly influence the performance of missing data techniques under both regression models. Furthermore, while generally occasion mean imputation displays the worst performance, conditional mean imputation shows a superior performance over occasion and subject mean imputation and gives parallel results with complete case analysis.