Tez No |
İndirme |
Tez Künye |
Durumu |
269187
|
|
Yüzüncü Yıl Üniversitesi e-posta trafiğinin sıfır değer ağırlıklı regresyon yöntemleri kullanılarak incelenmesi / Investigation of e-mail traffic of Yüzüncü Yil University using zero-inflated regression models
Yazar:YILMAZ KAYA
Danışman: YRD. DOÇ. DR. ABDULLAH YEŞİLOVA
Yer Bilgisi: Yüzüncü Yıl Üniversitesi / Fen Bilimleri Enstitüsü / Zootekni Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; İstatistik = Statistics
Dizin:
|
Onaylandı
Doktora
Türkçe
2010
116 s.
|
|
Sayıma dayalı olarak elde edilen verilerin analizinde Poisson ve Negatif Binomiyal (NB) regresyon yöntemleri yaygın olarak kullanılmaktadır. Poisson dağılımına sahip veriler beklenenden fazla sıfır değerine sahip olabilirler. Beklenenden fazla sayıda sıfır değerine sahip bağımlı değişkenin modellenmesinde Sıfır Değer Ağırlıklı Poisson (ZIP), sıfır değer ağırlıklı negatif binomiyal (ZINB) regresyon yöntemlerinin kullanılması daha uygun yaklaşımlardır. ZIP ve ZINB veri kümesinin iki farklı gruptan oluştuğunu varsaymaktadır. Birincisi gözlemlerin doğrudan sıfır olarak gözlendiği grup, buna karşın ikinci grup ise ZIP için gözlemlerin Poisson dağılımı, ZINB için gözlemlerin NB dağılımı gösterdiği gruptur.Sıfır değer ağırlıklı sayıma dayalı verilerin analizinde Hurdle modeller de kullanılmaktadır. Hurdle modeller iki aşamadan oluşmaktadır. Birincisi, sıfır (0) gözlemlere karşı pozitif sayımları (1) gösteren ikili cevaplar; ikincisi ise yalnız pozitif gözlemlerin oluştuğu süreçtir. İkili cevaplar logit, probit, complementary loglog ile modellenirken, pozitif sayımlar ise pozitif gözlemlerin dağılımına bağlı olarak sıfır değer sınırlandırılmış (Zero Truncated) Poisson veya NB ile modellenmektedir.Bu çalışmada, Yüzüncü Yıl Üniversitesi e-posta sunucusundan personelin 2009 bahar eğitim öğretim döneminde yaptıkları e-posta trafiği incelenmiştir. Veri kümesine önce PR uygulanmıştır. Veri kümesinin aşırı yayılım göstermesinden dolayı daha sonra NB regresyonu uygulanmıştır. Veri kümesinde beklenenden fazla sayıda sıfır (%78,9) değerlerin bulunmasından dolayı veri kümesine ZIP, ZINB, Poisson Hurdle ve NB Hurdle regresyonları uygulanmıştır. Gönderilen e-posta sayılarında hem sıfır yayılımı hem de aşırı yayılım olduğundan dolayı aşırı yayılımı ve sıfır yayılımını dikkate alan ZINB ve NB Hurdle regresyonlarının daha iyi uyum gösterdikleri saptanmıştır. Uyum ölçütleri, olabilirlik oran ve Vuong istatistiklerine göre ZINB'in en iyi model olduğu saptanmıştır.
|
|
Poisson and negative binomial (NB) regression models have been commonly used in analyzing the data obtained from counting basis. Data possessed Poisson distribution may have zero values more than expected. Zero-Inflated Poisson (ZIP), Zero-Inflated negative binomial (ZINB) are more common approaches in modeling more zero value possessing dependent variables than expected. It supposed that ZIP and ZINB data sets are formed two different groups. The first is the group in which observation are direct observed as zero. And the second is the group in which Poisson distribution of observation for ZIP is the group showing NB distribution of observation for ZINB.Hurdle models are used in the data analysis based on the zero inflated counting. Hurdle models are consisted of two stages. The first one is the binary responses showing positive counting versus zero observations. The second one is the processes in which only the positive observations occurs. While the binary responses are being modeled with logit, probit, complementary log log, the positive counting are being modeled with zero truncated Poisson and NB distributions depending on positive observations.In the present study, the e-mail traffic of Yüzüncü Yıl University in 2009 spring semester was investigated. PR applied first in data set. Then NB regression was applied due to overdispersion of the data set. ZIP and ZINB, Poisson Hurdle and NB Hurdle regressions were applied on the data set because more zeros counting (%78.9) were found in data set than expected. ZINB and NB Hurdle regression considered zero dispersion and overdispersion were found to be more compatible due to overdispersion and zero dispersion in sending e-mail. ZINB is determined to be best model according to Vuong statistics, likelihood ratio and information criteria. |