Tez No İndirme Tez Künye Durumu
143659 Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.
Towards finding optimal mixture of subspaces for data classification / Veri sınıflama için en iyi altuzay karışımlarının bulunmasına doğru
Yazar:MOHAMED ELHAFIZ MUSTAFA MUSA
Danışman: DOÇ. DR. VOLKAN ATALAY
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2003
99 s.
Örüntü tanımada, verilerin girdi uzayında değişik yapıları olduğunda, bu veriye uygun tek bir genel model bulmak çok yavaş ve yanlış olabilir. Öte yandan öğrenme algoritmaları yerel bölgelerdeki verinin yapısını çabucak öğrenebilir ve böylece daha hızlı ve doğru model bulmaya yolaçabilirler. Öğrenme veri kümesini küçük altkümelere bölmek, altkümedeki verinin büyüklüğü nedeniyle altmodelin parameter kümesini bul mak için yeterli olmayabilir. Birçok durumda da eldeki veri kümesi büyütülemeyebilir. Yerel bölgelerdeki veriler ilginçtir ki birbirleriyle daha ilişkili olabilirler. Bu yüzden, dekorelasyon yöntemleriyle verinin boyutunu ve böylece de parameter sayısını in dirgeyebiliriz Başka bir deyişle, verinin değişiminin çoğunu yakalayan kendi içinde ko- rele olmayan alçak boyutlu altuzaylar bulabiliriz. Şu anda varolan altuzay modelleme yöntemleri verilen bir öğrenme veri yapısı tipi için genel modelleme yöntemlerine gore daha yüksek başarı göstermişlerdir. Bunun yanısıra, aşağıdaki sınırlamalardan dolayı bu konuda araştırma yapılması gerekmektedir. Optimal altuzay sayısını bulmak için standart bir yöntem mevcut değildir.. Herbir altuzaydaki optimal boyutu bulmak için standart bir yöntem mevcut değildir. Şu andaki modellerde yukarıda bahsedilen her iki parametre de elle önceden saptan maktadır. Bu araştırmada suboptimal altuzay sayısını ve herbir altuzay için subopti- mal boyutu otomatik bulmak için algoritmaların tasarlanması ve denenmesi önerilmektedir.Anahtar Kelimeler: Temel bileşen analizi, Karışım modeli, Bekleme-eniyileme al goritması.
In pattern recognition, when data has different structures in different parts of the input space, fitting one global model can be slow and inaccurate. Learning methods can quickly learn the structure of the data in local regions, consequently, offering faster and more accurate model fitting. Breaking training data set into smaller subsets may lead to curse of dimensionality problem, as a training sample subset may not be enough for estimating the required set of parameters for the submodels. Increasing the size of training data may not be at hand in many situations. Interestingly, the data in local regions becomes more correlated. Therefore, by decorrelation methods we can reduce data dimensions and hence the number of parameters. In other words, we can find uncorrelated low dimensional subspaces that capture most of the data variability. The current subspace modelling methods have proved better performance than the global modelling methods for the given type of training data structure. Nevertheless these methods still need more research work as they are suffering from two limitations. There is no standard method to specify the optimal number of subspaces.. There is no standard method to specify the optimal dimensionality for each subspace. In the current models these two parameters are determined beforehand. In this dis sertation we propose and test algorithms that try to find a suboptimal number of principal subspaces and a suboptimal dimensionality for each principal subspaces au tomatically. Keywords: Principal Component Analysis, Mixture Model, Expectation Maximization algorithm.