Ulusal Tez Merkezi

Tez No	İndirme	Tez Künye	Durumu
739872		Büyük veri ile hava kalitesi tahmini / Air quality prediction with big data Yazar:ARZU Danışman: PROF. DR. YAŞAR HOŞCAN Yer Bilgisi: ESKİŞEHİR TEKNİK ÜNİVERSİTESİ / LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ / BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI / Bilgisayar Bilimleri Bilim Dalı Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control Anahtar Kelime:Büyük veri = Big data ; Hava kalitesi = Air quality ; Makine öğrenmesi = Machine learning ; Regresyon = Regression	Onaylandı Doktora Türkçe 2022 152 s.

Bu tezde, İstanbul il genelinde yer alan istasyonlarda ölçülen hava kalitesi indeksi ve hava kirleticilerinin yoğunluğu büyük veri ve akıllı yöntemler aracılığı ile tahmin edilmiştir. Tezde temel olarak ele alınan problem, makine öğrenmesinin temel problemlerinden biri olan regresyon problemidir. Hava kalitesinin tahmini için çok sayıda farklı kaynaktan veri elde edilmesi, bu verilerin ilgili regresyon problemini oluşturmak üzere düzenlenerek veri kümesi haline dönüştürülmesi amacıyla çeşitli web servisleri ve web kazıma yaklaşımları kullanılmıştır. Daha sonra temizlenen veri kümeleri üzerinden literatürde ana akım olarak bulunan birçok regresyon yöntemi kullanılmış ve bu yöntemlerin parametrelerinin en iyi şekilde belirlenmesine yönelik çalışmalar yapılmıştır. Elde edilen sonuçlar karşılaştırmalı olarak raporlanmıştır.

In this thesis, the air quality index and the density of air pollutants measured at stations located throughout the province of Istanbul were estimated by means of big data and smart methods. The main problem in the thesis is the regression problem, which is one of the main problems of machine learning. Various web services and web scraping approaches have been used to obtain data from many different sources for the prediction of air quality, and to transform these data into a dataset by arranging the relevant regression problem. Afterwards, many regression methods, which are mainstream in the literature, were used on the cleaned datasets and studies were carried out to determine the hyperparameters of these methods in the best way. Obtained results are reported comparatively.