Tez No İndirme Tez Künye Durumu
285581
An interactive preference based evolutionary algorithm for the clustering problem / Kümeleme problemi için etkileşimli tercih tabanlı bir çok amaçlı evrimsel algoritma
Yazar:KEREM DEMİRTAŞ
Danışman: DOÇ. DR. ESRA KARASAKAL ; PROF. DR. NUR EVİN ÖZDEMİREL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Endüstri Mühendisliği Bölümü
Konu:Endüstri ve Endüstri Mühendisliği = Industrial and Industrial Engineering
Dizin:Kümeleme analizi = Cluster analysis ; Kümeler = Clusters
Onaylandı
Yüksek Lisans
İngilizce
2011
81 s.
Bu çalışmada kümeleme problem için etkileşimli, tercih tabanlı, çok amaçlı bir evrimsel algoritma önermekteyiz. Kümeleme problemi gayet kombinasyonal olup literatürde NP-Hard olarak geçmektedir. Problemin amacı belirli bir benzerlik ölçüsüne göre benzer öğeleri aynı kümelere, benzeşmeyen öğeleri farklı kümelere koyarken sıkılık, bağlanabilirlik ve ayrışma gibi içsel amaçları sağlamaktır. Ancak bahsi geçen amaçlardan bir tanesinin kullanımı, rastgele şekilleri olan veya yoğunluk farkı bulunan kümeleri içeren farklı veri kümelerinin altında yatan yapıları ortaya çıkarmakta yeterli olmamaktadır. Tek amaç kullanımının yetersizliği daha iyi anlaşılmakla birlikte, literatürdeki güncel eğilim çok amaçlı yaklaşımların kullanılması yönündedir. Problemin bir zorluğu da optimal çözümün iyi tanımlanamamasından kaynaklanmaktadır. Bildiğimiz kadarıyla, kümeleme problemi için önerilmiş bütün çok amaçlı algoritmalar tüm Pareto optimal çözümlerin oluşturduğu kümeyi oluşturmayı hedeflemektedir. Bu kümedeki çoğu çözümün bir karar verici tarafından değerlendirildiğinde ilgi çekici bulunmaması bu yaklaşımın pek faydalı olmadığını gösterebilir. Bu çalışmada, hedef kümeleri bulmak için, karar vericinin tercihlerini iyi bilinen bir çok amaçlı algoritma olan SPEA2'nin içerisine, referans noktaları ve başarı skalarlaştırma fonksiyonları kullanarak dahil etmekteyiz.
We propose an interactive preference-based evolutionary algorithm for the clustering problem. The problem is highly combinatorial and referred to as NP-Hard in the literature. The goal of the problem is putting similar items in the same cluster and dissimilar items into different clusters according to a certain similarity measure, while maintaining some internal objectives such as compactness, connectivity or spatial separation. However, using one of these objectives is often not sufficient to detect different underlying structures in different data sets with clusters having arbitrary shapes and density variations. Thus, the current trend in the clustering literature is growing into the use of multiple objectives as the inadequacy of using a single objective is understood better. The problem is also difficult because the optimal solution is not well defined. To the best of our knowledge, all the multiobjective evolutionary algorithms for the clustering problem try to generate the whole Pareto optimal set. This may not be very useful since majority of the solutions in this set may be uninteresting when presented to the decision maker. In this study, we incorporate the preferences of the decision maker into a well known multiobjective evolutionary algorithm, namely SPEA-2, in the optimization process using reference points and achievement scalarizing functions to find the target clusters.