Tez No İndirme Tez Künye Durumu
739872
Büyük veri ile hava kalitesi tahmini / Air quality prediction with big data
Yazar:ARZU ÖZ
Danışman: PROF. DR. YAŞAR HOŞCAN
Yer Bilgisi: Eskişehir Teknik Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Bilimleri Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Büyük veri = Big data ; Hava kalitesi = Air quality ; Makine öğrenmesi = Machine learning ; Regresyon = Regression
Onaylandı
Doktora
Türkçe
2022
152 s.
Bu tezde, İstanbul il genelinde yer alan istasyonlarda ölçülen hava kalitesi indeksi ve hava kirleticilerinin yoğunluğu büyük veri ve akıllı yöntemler aracılığı ile tahmin edilmiştir. Tezde temel olarak ele alınan problem, makine öğrenmesinin temel problemlerinden biri olan regresyon problemidir. Hava kalitesinin tahmini için çok sayıda farklı kaynaktan veri elde edilmesi, bu verilerin ilgili regresyon problemini oluşturmak üzere düzenlenerek veri kümesi haline dönüştürülmesi amacıyla çeşitli web servisleri ve web kazıma yaklaşımları kullanılmıştır. Daha sonra temizlenen veri kümeleri üzerinden literatürde ana akım olarak bulunan birçok regresyon yöntemi kullanılmış ve bu yöntemlerin parametrelerinin en iyi şekilde belirlenmesine yönelik çalışmalar yapılmıştır. Elde edilen sonuçlar karşılaştırmalı olarak raporlanmıştır.
In this thesis, the air quality index and the density of air pollutants measured at stations located throughout the province of Istanbul were estimated by means of big data and smart methods. The main problem in the thesis is the regression problem, which is one of the main problems of machine learning. Various web services and web scraping approaches have been used to obtain data from many different sources for the prediction of air quality, and to transform these data into a dataset by arranging the relevant regression problem. Afterwards, many regression methods, which are mainstream in the literature, were used on the cleaned datasets and studies were carried out to determine the hyperparameters of these methods in the best way. Obtained results are reported comparatively.