Tez No İndirme Tez Künye Durumu
259494
Küme merkezlerinin belirlenmesinde yeni bir yöntem (IFART) / A new method for determining cluster centers (IFART)
Yazar:SEVİNÇ İLHAN
Danışman: DOÇ. DR. NEVCİHAN DURU
Yer Bilgisi: Kocaeli Üniversitesi / Fen Bilimleri Enstitüsü / Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Kümeleme = Clustering ; Veri madenciliği = Data mining ; Yapay sinir ağları = Artificial neural networks
Onaylandı
Doktora
Türkçe
2009
151 s.
İnsanoğlu sürekli olarak çevresinde gördüklerini sınıflama ya da kümeleme eğilimindedir. Bu nedenle kümeleme, veri madenciliği yöntemleri içerisinde en sık başvurulan ve en yaygın olarak kullanılanlardan bir tanesidir. K-means, büyük veri yığınlarını hızlı kümeleyebilen bir algoritma olması nedeni ile kümeleme algoritmaları içerisinde en yaygın olarak kullanılan algoritmadır. Ancak algoritmaya getirilen en büyük eleştiri, başlangıç parametrelerine aşırı duyarlı olmasıdır. Başlangıç parametreleri küme sayısı ve başlangıç küme merkezleridir. Dolayısı ile başlangıç küme merkezleri ne kadar iyi seçilebilir ise kümeleme de o kadar etkin ve doğru şekilde gerçekleştirilebilir. Elde edilen sonuç ağırlıklı olarak başlangıç küme merkezlerinin seçimine bağlı olarak değişmektedir. Genelde algoritma küme merkezlerine ait farklı başlangıç değerleri ile çalıştırılmakta ve en iyi kümelemenin belirlenebilmesi için sonuçlar birbiri ile karşılaştırılmaktadır.Adaptif Rezonans Teorisi (ART) yapay sinir ağları, sınıflandırma problemleri için geliştirilmiş denetimsiz öğrenme algoritmalarıdır.Tez kapsamında, bulanık adaptif rezonans teorisi ağlarının kümelemedeki başarısızlıkları, değerlendirilip giderilerek; iyileştirilmiş bulanık adaptif rezonans teorisi adı verilen bir algoritma önerilmiştir. Önerilen bu yöntem k-means algoritmasının başlangıç küme merkezlerinin belirlenmesinde kullanılmıştır. İyileştirilmiş bulanık A.R.T. ile başlatılan k-means kümeleme sonuçları, rastgele örnekler ile başlatılan k-means sonuçları ile karşılaştırılmıştır. Sonuç olarak hem hata payı hem de kümeleme hızı açısından k-means algoritmasının performansının başarılı şekilde artırıldığı gözlenmiştir. Ayrıca k-means algoritması daha kararlı bir algoritma haline gelmiştir.
People always tend to classify or cluster the things seen around. Because of this, clustering is one of the frequently used data mining methods. The k-means algorithm is most commonly used algorithm among the clustering algorithms because of its ability to cluster the huge data quickly. However, the most important review about the algorithm is that, it is very sensitive to initial parameters. The initial parameters are the cluster number and the initial cluster centers. So, how much the initial cluster centers can be selected fairly, the clustering can be done more accurate and valid. The obtained result mostly depends on the selection of the initial cluster centers. Usually, k-means algorithm runs with different cluster centers and then the clustering results are compared to determine the best clustering situation.Adaptive Resonance Theory (ART) is one of the learning algorithms without consultants which are developed for clustering problems in artificial neural networks.Within the thesis the fuzzy art clustering results are evaluated. In order to make these results better, an algorithm called Improved Fuzzy Art is proposed. This proposed algorithm is used for determining the cluster centers for k-means algorithm. K-means clustering results which have been initialized with Improved Fuzzy Art method are compared with the results which have been initialized with random selection. Consequently, in terms of error rate and also execution time the performance of k-means algorithm increased successfully. Additionally, the k-means algorithm became more stable.