Tez No İndirme Tez Künye Durumu
383250
Multi-modal stereo-vision using infrared/visible camera pairs / Görünür ve kızılötesi kamera çiftleri kullanarak çoklu biçimli steryo görme
Yazar:MUSTAFA YAMAN
Danışman: YRD. DOÇ. DR. SİNAN KALKAN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayarla görme = Computer vision ; Fotometrik stereo = Photometric stereo ; Fotometrik stereo yöntemi = Photometric stereo method ; Görme = Vision ; Görüntü bölütleme = Image segmentation ; Kızılötesi kameralar = Infrared cameras ; Sayısal kameralar = Digital cameras ; Yapay görme = Machine vision
Onaylandı
Doktora
İngilizce
2014
228 s.
Bu tezde, kızılötesi ve görünür bantta kamera çiftleri kullanılarak yeni bir çoklu biçimli steryo görme yöntemi önerilmiştir. Yöntem karşılıklı bilgiyi temel benzerlik ölçüsü olarak kullanmaktadır. Ancak karşılıklı bilgi değerinin üretilmesinde bölütleme temelli bir uyarlanır pencere mekanizması önerilmiş ve sonuçlar oldukça geliştirilmiştir. Ayrıca yöntem maliyet matrisini hesaplarken, negatif karşılıklı bilgi değerine ek olarak önsel olasılık değerlerini de hesaba katmaktadır. Yeni bir uyarlanır maliyet toplama yöntemi de ayrıca önerilmiş ve bu yöntemde maliyet güvenilirlikleri hesaplanarak toplama işlemi gerçekleştirilirken, en küçük maliyetle eşleştirilen piksel farklılıklarından yeterince güvenilir olanlar ise daha sonra bölütlere göre düzleme oturtulmuştur. Bölütler yinelemeli olarak güvenilir farklılık değerlerine göre birleştirilip parçalanarak düzeltilmekte ve farklılık haritası hesaplamasının ilk bölütlemeye olan bağımlılığı azaltılmaktadır. Son olarak tüm bu adımlar yinelenmektedir. Yeni adımlarda daha önce üretilmiş olan farklılık haritası da kullanılarak daha doğru ön olasılık değerleri kullanılabilmektedir. Önerilen yöntemi ve literatürde yer alan diğer yöntemleri değerlendirmek için iki farklı çoklu biçimli steryo görüntü veri kümesi oluşturularak kullanılmıştır: Middlebury Steryo Değerlendirme veri kümesinden sentetik olarak değiştirilmiş görüntü çiftleri ve Kinect cihazından elde edilen kızılötesi ve görünür kamera görüntü çiftleri. Veri kümeleri çoklu-biçimli steryo görme yöntemleri için performans değerlendirme test veri kümesi olarak kullanılabilecek şekilde oluşturulmuştur. Bu veri kümelerinde, (i) önerilen yöntemin varolan karşılıklı bilgi formulasyonuna göre sonuçları iyileştirdiği, (ii) önerilen yöntemin literatürde yer alan diğer yöntemlerden daha iyi performans gösterdiği, ve (iii) önerilen yöntemin Kinect derinlik verisi ile karşılaştırılabilir derecede iyi derinlik verisi elde edebildiği gösterilmiştir.
In this thesis, a novel method for computing disparity maps from a multi-modal stereo-vision system composed of an infrared-visible camera pair is introduced. The method uses mutual information as the basic similarity measure where a segmentation-based adaptive windowing mechanism is proposed along with a novel mutual information computation surface for greatly enhancing the results. Besides, the method incorporates joint prior probabilities when computing the cost matrix in addition to negative mutual information measures. A novel adaptive cost aggregation method is also proposed using computed cost confidences and resulting minimum cost disparities that are confident enough are fitted planes in segments. The segments are refined by iteratively splitting and merging according to the fitted confident disparities that helps to reduce the dependence of the disparity computation to the initial segmentation. Finally, all the steps are repeated iteratively where more accurate joint probabilities are calculated by using previous iteration's disparity map. Two multi-modal stereo image datasets are generated for evaluating the method and the state of the art methods confronted in literature; the synthetically altered image pairs from the Middlebury Stereo Evaluation Dataset, and our own dataset of Kinect Device infrared- visible camera image pairs, which can function as a benchmark for multimodal stereo-vision methods. On these datasets, it is presented that (i) the proposed method improves the quality of existing MI formulation, (ii) the proposed method outperforms state of the art methods in literature, and (iii) the proposed method can provide depth comparable to the quality of Kinect depth data.