Tez No İndirme Tez Künye Durumu
181156
A hierarchical object localization and image retrieval framework / Katmanlı bir mimari ile nesne bulma ve imge sorgulama sistemi
Yazar:MUTLU UYSAL
Danışman: PROF. DR. FATOŞ YARMAN VURAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2006
122 s.
Bu tezde; sorgulanacak olan her imge sınıfı için, "en uygun" öznitelik vektörünü eldeeden, nesne temelli bir sorgulama sistemi önerilmektedir. Geliştirilen sistemde, "enuygun" öznitelik vektörünü bulmak için, katmanlı bir öğrenme mimarisi; imgelerindüzgün etiketlenebilmesi için ise ?komşuluk ağacı? kavramı önerilmektedir. Bukapsamda, ilk olarak, otomatik olarak bölütlenmiş imgelerden, öznitelik vektörleriçıkartılmaktadır. Daha sonra, her bir imge sınıfını diğer sınıflardan ayırdedecek,öznitelik ağırlık vektörleri, önerilen mimari kullanılarak bulunmaktadır.Bu tezde geliştirilen katmanlı öğrenme metodu, içeriğe dayalı imge sorgulamasistemlerinin öznitelik uzayı tasarımı, normalizasyon, boyut artması (curse ofdimensionality) ve anlamsal farklılık (semantic gap) gibi temel problemlerini azaltmayayöneliktir. Bu doğrultuda, göz ve beyin arasındaki ilişkiden yola çıkılarak, iki katmanlıbir sınıflandırma yöntemi önerilmiştir. Birinci katmanda, farklı sınıflandırma araçları,vektör uzayının farklı bölümlerini kullanılarak sınıflandırmalar yapmakta; bir üstkatmanda ise, elde edilen sonuçlar birleştirilmektedir. Bu yöntem, öznitelik vektörlerininardarda eklenmesiyle elde edilen, çok boyutlu vektörün yol açtığı problemleri,azaltmaya çalışmaktadır.Önerilen sistem, aynı zamanda, bölütlenmiş imgelerde yer alan nesnelerinetiketlenebilmesi için, komşuluk ağacı kavramını tanımlamaktadır. Komşuluk ağacı,iimge içinde birbiriyle komşu olan bölütlerin, birleştirilmesi ile oluşan bir gösterimbiçimidir.Geliştirilen sistemin performansını denemek için, Corel veri kümesi üzerindedeneyler yapılmıştır. Eğitim modülünde, bir sınıfı en iyi temsil eden özniteliklerinbulunması için önce bulanık ARTMAP ve ADABOOST yöntemleri kullanılmış, dahasonra ise iki katmanlı bir mimari geliştirilerek performans arttırılmıştır.Yapılan deneyler sonucunda, önerilen katmanlı mimarinin diğerlerinden daha iyisonuçlar verdiği gözlemlenmiştir.Anahtar Kelimeler: Nesneye Dayalı mge Sorgulama, Komşuluk Ağacı, Katmanlısınıflandırma, En iyi temsil eden Öznitelik, Bulanık ARTMAP, ADABOOST.ii
This thesis proposes an object localization and image retrieval framework, which trains adiscriminative feature set for each object class. For this purpose, a hierarchical learningarchitecture, together with a Neighborhood Tree is introduced for object labeling.Initially, a large variety of features are extracted from the regions of the pre-segmentedimages. These features are, then, fed to the training module, which selects the "best setof representative features", suppressing relatively less important ones for each class.During this study, we attack various problems of the current image retrieval andclassification systems, including feature space design, normalization and curse ofdimensionality. Above all, we elaborate the semantic gap problem in comparison tohuman visual system. The proposed system emulates the eye-brain channel in twolayers. The first layer combines relatively simple classifiers with low level, lowdimensional features. Then, the second layer implements Adaptive Resonance Theory,which extracts higher level information from the first layer. This two-layer architecturereduces the curse of dimensionality and diminishes the normalization problem.The concept of Neighborhood Tree is introduced for identifying the whole objectfrom the over-segmented image regions. The Neighborhood Tree consists of the nodescorresponding to the neighboring regions as its children and merges the regions througha search algorithm. Experiments are performed on a set of images from Corel database,using MPEG-7, Haar and Gabor features in order to observe the power and the weaknessiof the proposed system. The "Best Representative Features" are found in the trainingphase using Fuzzy ARTMAP [1], Feature-based AdaBoost [2], Descriptor-basedAdaBoost, Best Representative Descriptor [3], majority voting and the proposedhierarchical learning architecture.During the experiments, it is observed that the proposed hierarchical learningarchitecture yields better retrieval rates than the existing algorithms available in theliterature.Keywords: Object localization, image retrieval, Neighborhood Trees,Hierarchical learning, Best Representative Descriptor, FUZZY ARTMAP,ADABOOST.ii