Tez No İndirme Tez Künye Durumu
663012
Data mining and machine learning in environmental informatics / Çevresel enformatikte veri madenciliği ve makine öğrenmesi
Yazar:GÖKSU TÜYSÜZOĞLU
Danışman: DOÇ. DR. DERYA BİRANT
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Birliktelik kural madenciliği = Association rule mining ; Kümeleme = Clustering ; Makine öğrenmesi = Machine learning ; Regresyon = Regression ; Sınıflandırma = Classification ; Veri madenciliği = Data mining ; Zaman serileri = Time series
Onaylandı
Doktora
İngilizce
2021
191 s.
Çevresel enformatik, günümüzde, veri işleme ve analizi için veri madenciliği ve makine öğrenimi tekniklerinin sıklıkla kullanıldığı alanlardan biridir. Bu tezde, farklı konulardaki çevresel verileri içeren birkaç vaka çalışması, veri madenciliği ve makine öğrenmesi kapsamında farklı görevlerde (sınıflandırma, regresyon, kümeleme, birliktelik kuralı madenciliği, zaman serileri) incelenmiştir. Hava kalitesi izleme istasyonlarından elde edilen veriler ve meteorolojik veriler incelenerek belirli bir hava kalitesi izleme istasyonunun hangi istasyon tipine (endüstriyel, kırsal veya kentsel) ait olduğunun belirlenmesi, istasyonların benzerliklerine göre en doğru şekilde kümeleme uygulamasının yapılması deneysel çalışmaların belirli bir kısmını oluşturmaktadır. Ayrıca, hava kirletici maddeler ve meteorolojik faktörler arasındaki ilişkiler birliktelik analizi kapsamında detaylı bir şekilde incelenerek ilişki kuralları çıkarılmıştır. Diğer yandan, çeşitli derinliklerde toprak sıcaklığı tahmini için regresyon ve zaman serisi analizleri yapılmıştır. Hava ve toprak kaynaklı problemleri çözmek için önerilen yöntemler şu şekildedir: (i) yeni bir topluluk öğrenmesi yöntemi olan Geliştirilmiş Torbalama (eBagging), (ii) yarı denetimli yeni bir yöntem olan Kendi Kendine Eğitim Yoluyla Toprak Sıcaklığı Tahmini (STST), (iii) birden fazla görevi birlikte ele almak için önerilen Çoğunluk Oylamasına Dayalı Çok Görevli Kümeleme (MV-MTC), (iv) yeni bir ağırlıklı birliktelik kuralı madenciliği türü olan WARM ve (v) yeni bir toprak yönetim uygulaması olan Çok Görünümlü Çok Derinlikli Toprak Sıcaklığı Tahmini (MV-MD-STP)'dir. Deneysel sonuçlara bakıldığında, önerilen yeni yöntemlerin karşılaştırıldıkları son teknoloji yöntemlerden daha iyi performans gösterdiği ve çevre sorunlarına etkili çözümler sunduğu açıktır.
Nowadays, environmental informatics is one of the fields where data mining and machine learning techniques for data processing & analysis are frequently used today. In this thesis, several case studies including environmental data on different subjects were conducted for different tasks (classification, regression, clustering, association rule mining, time series) under data mining and machine learning. Examining the data obtained from air quality monitoring stations and meteorological data, determining which station type (industrial, rural, or urban) a particular air quality monitoring station belongs to, and making the most accurate clustering application according to the similarities of the stations are a certain part of the experimental studies. In addition, the relations between air pollutants and meteorological factors were examined in detail within the scope of association rule mining analysis, and the relationship rules were drawn. On the other side, regression and time series analysis for soil temperature prediction at various depths were performed. The proposed methods to handle air and soil-related problems are as follows: (i) Enhanced Bagging (eBagging) which is a new ensemble learning method, (ii) Soil Temperature Prediction via Self-training (STST) which is a new semi-supervised learning method, (iii) Majority Voting Based Multi-Task Clustering (MV-MTC) which is proposed to consider multiple tasks jointly, (iv) WARM which is a new type of weighted association rule mining, and (v) Multi-View Multi-Depth Soil Temperature Prediction (MV-MD-STP) which is a new soil management framework. Considering the experimental results, it is clear that the newly proposed methods performed better than the other state-of-the-art methods they were compared to and offered effective solutions to environmental problems.