Tez No İndirme Tez Künye Durumu
640818
Büyük verilerin analizi için coğrafi ağırlıklı regresyon yaklaşımlarının geliştirilmesi / Developing geographically weighted regression approaches for analysis of big data
Yazar:MURAT TAŞYÜREK
Danışman: DOÇ. DR. METE ÇELİK
Yer Bilgisi: Erciyes Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2020
112 s.
Coğrafi ağırlıklı regresyon (geographically weighted regression - GWR), ekoloji, çevre yönetimi, halk sağlığı, meteoroloji ve turizm gibi birçok uygulama alanında değişen ilişkileri modellemek için yaygın olarak kullanılan yerel mekânsal regresyon tekniğidir. GWR yaklaşımları yüksek bilgi işlem kaynakları ve geniş bellek alanlarına ihtiyaç duymaktadır. Veri boyutu büyüdükçe ve/veya veri güncellemeleri sıklaştıkça bu sorunlar daha kritik hale gelmektedir. Diğer taraftan literatürde yapılan çalışmalar genellikle mekânsal veya mekânsal ve rakımsal veya mekânsal ve zamansal ilişkilerini analiz etmektedir. Fakat gerçek dünyada mekânsal, rakımsal ve zamansal ilişkiler birçok veri kümesinde birlikte bulunmaktadır ve bu ilişkilerin birlikle analizi için önerilmiş bir GWR yaklaşımı bulunmamaktadır. Bu tez çalışmasında, GWR yöntemi ile analizlerin etkili bir şekilde yapılması için çeşitli teknikler kullanan farklı yaklaşımlar geliştirilmiştir. Geliştirilen ilk yaklaşım, sık güncellenen veri kümelerini analiz etmek için ters en yakın komşu (reverse nearest neighbor - RNN) stratejisini kullanan hesaplama açısından etkili bir GWR algoritmasınıdır (RNN-GWR). İkinci yaklaşım, coğrafi ve zamansal ağırlıklı regresyon yaklaşımının (geographically and temporally weighted regression - GTWR) veri boyutu kısıtlamasının üstesinden gelmek için hızlı GTWR yaklaşımıdır (FastGTWR). Üçüncü yaklaşım, veri kümelerindeki mekânsal, rakımsal ve zamansal olarak değişen ilişkileri ele almak için coğrafi, rakımsal ve zamansal ağırlıklı regresyon yaklaşımıdır (4D-GWR). Önerilen yaklaşımların başarımlarını değerlendirmek için sentetik ve gerçek veri kümeleri kullanılarak çeşitli deneyler yapılmıştır. Deneysel sonuçlar, önerilen yaklaşımların literatürdeki benzerlerine göre daha etkili bir şekilde çalıştıklarını göstermiştir. Anahtar Kelimeler: Veri madenciliği, coğrafi ağırlıklı regresyon, ters en yakın komşu, sık güncellenen veriler, büyük veri, mekânsal-rakımsal-zamansal değişkenlikler
Geographically weighted regression (GWR) is a local spatial regression technique to model varying relationships in many application domains, such as ecology, environmental management, public health, meteorology, and tourism. GWR approaches require high computing resources and large memory spaces. These issues become more critical as data size grows and/or data updates become frequently. On the other hand, studies in the literature generally analyze spatial, spatial and altitudinal or spatial and temporal relationships. However in the real world, spatial, altitudinal, and temporal relationships exist together in many datasets , and there is not yet a proposed GWR approach to analyze datasets that contain these relationships together. In this thesis, different approaches using various techniques have been developed in order to perform the analyzes with the GWR method effectively. The first approach is a computationally efficient GWR algorithm (RNN-GWR) that uses the reverse nearest neighbor (RNN) strategy to analyze frequently updated datasets. The second approach is a fast geographically and temporally weighted regression (FastGTWR) to overcome data size restriction of GTWR. The third approach is a geographically, altitudinal, and temporally weighted regression (4D-GWR) approach to handle spatial, altitudinal and temporal nonstationarities in datasets. In order to evaluate the performances of the proposed approaches, various experiments were conducted using synthetic and real datasets. Experimental results showed that the proposed approaches worked more effectively than their counterparts in the literature. Keywords: Data mining, geographically weighted regression, reverse nearest neighbor, frequently updated data, big data, spatial-altitudinal-temporal nonstationarities