Tez No İndirme Tez Künye Durumu
202707
Modeling and analyzing marine data using data mining techniques / Veri madenciliği tekniklerinin kullanılarak deniz verilerinin modellenmesi ve analizi
Yazar:DERYA BİRANT
Danışman: PROF. DR. ALP KUT
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Veri ambarı = Data warehouse ; Veri madenciliği = Data mining
Onaylandı
Doktora
İngilizce
2006
118 s.
Bu tezde sunulan çalışma bilgisayar bilimleri ve deniz bilimlerini birleştiren disiplinler arası bir çalışmadır. Bu tez (i) deniz verilerinin modellenmesi, toplanması, arşivlenmesi (ii) deniz verileri üzerinde veri madenciliği tekniklerinin kullanılması ve analizlerin yapılması (iii) deniz verilerinin görselleştirilmesi için yeni bilgisayar tabanlı yaklaşımlar, teknikler ve teknolojiler sağlamaktadır. Bu tez fiziksel, kimyasal ve biyolojik deniz verilerinin toplanması için yaptığım çabaları, deniz verilerinin haritalar üzerinde görselleştirilmesi üzerine bazı açıklamaları, fiziksel deniz verileri için oluşturulan karar ağaçlarını sunmaktadır. Ayrıca iki tane yeni veri madenciliği algoritmasını tanıtmaktadır: bunlardan bir tanesi konumsal-zamansal verilerin kümelenmesi için, diğeri ise veri ambarlarında konumsal-zamansal sıra dışı verilerin tespiti içindir. Bu tez ayrıca yeni bir yaklaşımda önermektedir: web servis tabanlı paralel kümeleme. Bu yöntem büyük veritabanlarında kümelerin keşfedilmesine yönelik web servislerin paralel olarak çalıştırmasını öngörmektedir. Bu tez yeni kümeleme algoritmasına ek olarak bu algoritma ile elde edilen kümeleme sonuçlarının doğruluğunu ve geçerliliğini değerlendirir. Bir küme doğrulama tekniği kullanarak matematiksel kalitesini ve güvenilirliliğini gösterir. Bu tez aynı zamanda yeni kümeleme algoritmasının girdi değerlerine olan duyarlılık analizini de sunmaktadır.
The research presented in this thesis is an interdisciplinary work that combines computer science and marine science. It provides new computer based approaches, techniques and technologies for (i) modeling, collecting, archiving marine data, (ii) analyzing and mining marine data by using data mining techniques and (iii) visualizing marine data. It presents my efforts on the collecting physical, biological, chemical marine data, some explanations about the visualization of marine data on the map, my works on the construction of decision trees to classify physical marine data. This thesis introduces two new data mining algorithms: one is for clustering spatio-temporal data and the other is for spatio-temporal outlier detection in data warehouses. It also proposes a new approach: web service-based parallel clustering which includes the parallel execution of web services for discovering clusters in large data warehouses. In addition to new clustering algorithm, this thesis also presents the validation and evaluation of the clustering results of this clustering algorithm. It shows the mathematical quality and reliability of the clustering results by using a cluster validation technique. It also presents the sensitivity analysis of the new clustering algorithm to the input parameters.