Tez No |
İndirme |
Tez Künye |
Durumu |
355747
|
|
Multi-view feature extraction based on canonical correlation analysis / Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı
Yazar:CEMAL OKAN ŞAKAR
Danışman: PROF. DR. FİKRET GÜRGEN ; DOÇ. DR. OLCAY KURŞUN
Yer Bilgisi: Boğaziçi Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Yapay sinir ağları = Artificial neural networks ; Örüntü sınıflama = Pattern classification ; Örüntü tanıma = Pattern recognition
|
Onaylandı
Doktora
İngilizce
2014
143 s.
|
|
Kanonik Korelasyon Analizi (KKA) iki değişken kümesi arasındaki doğrusal
bağıntıları belirlemeyi amaçlayan bir yöntemdir. KKA son zamanlarda makine öğrenme
alanında aynı verinin farklı temsillerinden olusan çok-bakşlı veri kümelerinin artmasıyla birlikte çokça kullanılmaya başlamıştır. Bu tez, KKA yönteminin gürbüzlüğü
ve sınıflandırma başarısının arttırılmasına yönelik çalsmaları içermektedir. KKA, maksimum
korelasyona sahip izdüşüm vektörlerinin (eşdegişkenler) bulunması için bakışları
karmaşık sınıf etiketleri gibi kullanmaktadır. Bu nedenle, KKA eğitim kümesi üzerinde
aşırı ögrenmeye sebep olabilir. Topluluk öğrenme yöntemleri sınıflandırma ve kümeleme yöntemlerinin bu tür aşırı ögrenme sorunlarını engellemek için kullanılmış, ancak KKA
icin bir topluluk yaklaşımı henüz önerilmemiştir. Bu tezde, birden fazla alt-örneklemden
elde edilen eşdegişken kümelerinin birleştirilmesiyle nihai bir eşdegişken kümesinin
elde edilmesi için bir topluluk yöntemi önerdik. Çeşitli veri kümeleri üzerinde elde
edilen deneysel sonuçlar topluluk KKA yönteminin başarısını göstermektedir. KKA
yönteminin gerçeklemesinde sınıf etiketlerinden yararlanılmadığı için, bu yöntemle elde
edilen öznitelikler sınıf-ayırıcı özelliğe sahip olamayabilmektedir. Bu tez iki bakış
arasındaki ortak bilgiyi iceren ve aynı zamanda farklı sınıflara ait örnekleri ayırt edebilen öznitelikler arayan bir yöntem önermektedir. Önerdiğimiz yöntem her biri doğrusal
gizli katmanlı ve hem sınıf örneklerini hem de birbirlerinin çıktılarını tahmin etmeyi
amaçlayan iki çok katmanlı algılayıcıdan oluşmaktadır. Deneysel sonuçlar,
önerilen yöntemle çıkartılan özniteliklerin daha yüksek sınıflandırma başarısı verdiğini
göstermiştir. Bu tez çalışmasının diğer bir katkısı, KKA yönteminin bir öznitelik seçme
yönteminin geliştirilmesinde kullanılmasıdır. Bunun yanında çok-bakışlı veri kümeleri
için topluluk sınıflandırma ve kümeleme üzerine çalışmalarımızı da içermektedir.
|
|
Canonical Correlation Analysis (CCA) aims at identifying linear dependencies
between two sets of variables. CCA has recently become popular in the field of machine
learning with the increase in the number of multi-view datasets, which consist
of different representations coming from different sources or modalities. This thesis
presents our efforts to improve the robustness and discriminative ability of CCA. CCA
uses the views as complex labels to guide the search of maximally correlated projection
vectors (covariates). Therefore, CCA can overfit the training data. Although, ensemble
approaches have been effectively used to avoid such overfittings of classification and
clustering techniques, an ensemble approach has not yet been formulated for CCA. In
this thesis, we propose an ensemble method for obtaining a final set of covariates by
combining multiple sets of covariates extracted from subsamples. Experimental results
on various datasets demonstrate the usefulness of ensemble CCA approach. The correlated
features extracted by CCA may not be class-discriminative since it does not
utilize the class labels in its implementation. This thesis introduces a method to explore
correlated and also discriminative features. Our proposed method utilizes two
(alternating) multi-layer perceptrons, each with a linear hidden layer, learning to predict
both the class-labels and the outputs of each other. The experimental results show
that the features found by the proposed method accomplish signicantly higher classification accuracies. Another contribution of this thesis is the use of CCA to improve a
filter feature selection algorithm. We also present our works on ensemble classification
and clustering for multi-view datasets. |