Ulusal Tez Merkezi

Tez No	İndirme	Tez Künye	Durumu
355747		Multi-view feature extraction based on canonical correlation analysis / Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı Yazar:CEMAL OKAN Danışman: PROF. DR. FİKRET GÜRGEN ; DOÇ. DR. OLCAY KURŞUN Yer Bilgisi: BOĞAZİÇİ ÜNİVERSİTESİ / FEN BİLİMLERİ ENSTİTÜSÜ / BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control Anahtar Kelime:Yapay sinir ağları = Artificial neural networks ; Örüntü sınıflama = Pattern classification ; Örüntü tanıma = Pattern recognition	Onaylandı Doktora İngilizce 2014 143 s.

Kanonik Korelasyon Analizi (KKA) iki değişken kümesi arasındaki doğrusal bağıntıları belirlemeyi amaçlayan bir yöntemdir. KKA son zamanlarda makine öğrenme alanında aynı verinin farklı temsillerinden olusan çok-bakşlı veri kümelerinin artmasıyla birlikte çokça kullanılmaya başlamıştır. Bu tez, KKA yönteminin gürbüzlüğü ve sınıflandırma başarısının arttırılmasına yönelik çalsmaları içermektedir. KKA, maksimum korelasyona sahip izdüşüm vektörlerinin (eşdegişkenler) bulunması için bakışları karmaşık sınıf etiketleri gibi kullanmaktadır. Bu nedenle, KKA eğitim kümesi üzerinde aşırı ögrenmeye sebep olabilir. Topluluk öğrenme yöntemleri sınıflandırma ve kümeleme yöntemlerinin bu tür aşırı ögrenme sorunlarını engellemek için kullanılmış, ancak KKA icin bir topluluk yaklaşımı henüz önerilmemiştir. Bu tezde, birden fazla alt-örneklemden elde edilen eşdegişken kümelerinin birleştirilmesiyle nihai bir eşdegişken kümesinin elde edilmesi için bir topluluk yöntemi önerdik. Çeşitli veri kümeleri üzerinde elde edilen deneysel sonuçlar topluluk KKA yönteminin başarısını göstermektedir. KKA yönteminin gerçeklemesinde sınıf etiketlerinden yararlanılmadığı için, bu yöntemle elde edilen öznitelikler sınıf-ayırıcı özelliğe sahip olamayabilmektedir. Bu tez iki bakış arasındaki ortak bilgiyi iceren ve aynı zamanda farklı sınıflara ait örnekleri ayırt edebilen öznitelikler arayan bir yöntem önermektedir. Önerdiğimiz yöntem her biri doğrusal gizli katmanlı ve hem sınıf örneklerini hem de birbirlerinin çıktılarını tahmin etmeyi amaçlayan iki çok katmanlı algılayıcıdan oluşmaktadır. Deneysel sonuçlar, önerilen yöntemle çıkartılan özniteliklerin daha yüksek sınıflandırma başarısı verdiğini göstermiştir. Bu tez çalışmasının diğer bir katkısı, KKA yönteminin bir öznitelik seçme yönteminin geliştirilmesinde kullanılmasıdır. Bunun yanında çok-bakışlı veri kümeleri için topluluk sınıflandırma ve kümeleme üzerine çalışmalarımızı da içermektedir.

Canonical Correlation Analysis (CCA) aims at identifying linear dependencies between two sets of variables. CCA has recently become popular in the field of machine learning with the increase in the number of multi-view datasets, which consist of different representations coming from different sources or modalities. This thesis presents our efforts to improve the robustness and discriminative ability of CCA. CCA uses the views as complex labels to guide the search of maximally correlated projection vectors (covariates). Therefore, CCA can overfit the training data. Although, ensemble approaches have been effectively used to avoid such overfittings of classification and clustering techniques, an ensemble approach has not yet been formulated for CCA. In this thesis, we propose an ensemble method for obtaining a final set of covariates by combining multiple sets of covariates extracted from subsamples. Experimental results on various datasets demonstrate the usefulness of ensemble CCA approach. The correlated features extracted by CCA may not be class-discriminative since it does not utilize the class labels in its implementation. This thesis introduces a method to explore correlated and also discriminative features. Our proposed method utilizes two (alternating) multi-layer perceptrons, each with a linear hidden layer, learning to predict both the class-labels and the outputs of each other. The experimental results show that the features found by the proposed method accomplish signicantly higher classification accuracies. Another contribution of this thesis is the use of CCA to improve a filter feature selection algorithm. We also present our works on ensemble classification and clustering for multi-view datasets.