Tez No İndirme Tez Künye Durumu
355747
Multi-view feature extraction based on canonical correlation analysis / Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı
Yazar:CEMAL OKAN ŞAKAR
Danışman: PROF. DR. FİKRET GÜRGEN ; DOÇ. DR. OLCAY KURŞUN
Yer Bilgisi: Boğaziçi Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Yapay sinir ağları = Artificial neural networks ; Örüntü sınıflama = Pattern classification ; Örüntü tanıma = Pattern recognition
Onaylandı
Doktora
İngilizce
2014
143 s.
Kanonik Korelasyon Analizi (KKA) iki değişken kümesi arasındaki doğrusal bağıntıları belirlemeyi amaçlayan bir yöntemdir. KKA son zamanlarda makine öğrenme alanında aynı verinin farklı temsillerinden olusan çok-bakşlı veri kümelerinin artmasıyla birlikte çokça kullanılmaya başlamıştır. Bu tez, KKA yönteminin gürbüzlüğü ve sınıflandırma başarısının arttırılmasına yönelik çalsmaları içermektedir. KKA, maksimum korelasyona sahip izdüşüm vektörlerinin (eşdegişkenler) bulunması için bakışları karmaşık sınıf etiketleri gibi kullanmaktadır. Bu nedenle, KKA eğitim kümesi üzerinde aşırı ögrenmeye sebep olabilir. Topluluk öğrenme yöntemleri sınıflandırma ve kümeleme yöntemlerinin bu tür aşırı ögrenme sorunlarını engellemek için kullanılmış, ancak KKA icin bir topluluk yaklaşımı henüz önerilmemiştir. Bu tezde, birden fazla alt-örneklemden elde edilen eşdegişken kümelerinin birleştirilmesiyle nihai bir eşdegişken kümesinin elde edilmesi için bir topluluk yöntemi önerdik. Çeşitli veri kümeleri üzerinde elde edilen deneysel sonuçlar topluluk KKA yönteminin başarısını göstermektedir. KKA yönteminin gerçeklemesinde sınıf etiketlerinden yararlanılmadığı için, bu yöntemle elde edilen öznitelikler sınıf-ayırıcı özelliğe sahip olamayabilmektedir. Bu tez iki bakış arasındaki ortak bilgiyi iceren ve aynı zamanda farklı sınıflara ait örnekleri ayırt edebilen öznitelikler arayan bir yöntem önermektedir. Önerdiğimiz yöntem her biri doğrusal gizli katmanlı ve hem sınıf örneklerini hem de birbirlerinin çıktılarını tahmin etmeyi amaçlayan iki çok katmanlı algılayıcıdan oluşmaktadır. Deneysel sonuçlar, önerilen yöntemle çıkartılan özniteliklerin daha yüksek sınıflandırma başarısı verdiğini göstermiştir. Bu tez çalışmasının diğer bir katkısı, KKA yönteminin bir öznitelik seçme yönteminin geliştirilmesinde kullanılmasıdır. Bunun yanında çok-bakışlı veri kümeleri için topluluk sınıflandırma ve kümeleme üzerine çalışmalarımızı da içermektedir.
Canonical Correlation Analysis (CCA) aims at identifying linear dependencies between two sets of variables. CCA has recently become popular in the field of machine learning with the increase in the number of multi-view datasets, which consist of di fferent representations coming from diff erent sources or modalities. This thesis presents our e fforts to improve the robustness and discriminative ability of CCA. CCA uses the views as complex labels to guide the search of maximally correlated projection vectors (covariates). Therefore, CCA can over fit the training data. Although, ensemble approaches have been e ffectively used to avoid such overfi ttings of classifi cation and clustering techniques, an ensemble approach has not yet been formulated for CCA. In this thesis, we propose an ensemble method for obtaining a fi nal set of covariates by combining multiple sets of covariates extracted from subsamples. Experimental results on various datasets demonstrate the usefulness of ensemble CCA approach. The correlated features extracted by CCA may not be class-discriminative since it does not utilize the class labels in its implementation. This thesis introduces a method to explore correlated and also discriminative features. Our proposed method utilizes two (alternating) multi-layer perceptrons, each with a linear hidden layer, learning to predict both the class-labels and the outputs of each other. The experimental results show that the features found by the proposed method accomplish signi cantly higher classifi cation accuracies. Another contribution of this thesis is the use of CCA to improve a filter feature selection algorithm. We also present our works on ensemble classifi cation and clustering for multi-view datasets.