Tez No İndirme Tez Künye Durumu
255631
Structure-from-motion for systems with perspective and omnidirectional cameras / Perspektif ve tümyönlü kamera kullanan sistemler için hareketten yapı çıkarımı
Yazar:YALIN BAŞTANLAR
Danışman: PROF. DR. YASEMİN YARDIMCI ÇETİN ; YRD. DOÇ. ALPTEKİN TEMİZEL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Bilişim Sistemleri Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Kalibrasyon = Calibration ; Kamera = Camera
Onaylandı
Doktora
İngilizce
2009
117 s.
Bu tezde, karma kameralı sistemler ile hareketten yapı çıkarımı yapmak için basamaklı bir şema tanımlanmış ve bu basamaklar için yöntemler geliştirilerek yapı çıkarımı işleminin daha gürbüz ve otomatik olması sağlanmıştır. Tanımlanan basamaklar, kamera kalibrasyonu, nokta eşleştirme, epipolar geometri ve kameraların duruş (konum ve yönelim) kestirimi, üçgenleme ve toplu düzenleme olarak özetlenebilir. Katadioptrik tümyönlü kameralar ve perspektif kameralar ile çalıştık ve hem tek görüş noktalı (single viewpoint) tümyönlü kameraları hem de perspektif kameraları kapsayan küresel kamera modelini kullandık.Küresel kamera modelinin kalibrasyonu için doğrusal ve otomatik parametre ilklendirmesi avantajına sahip yeni bir yöntem geliştirilmiştir. 3B uzaydaki noktaların katadioptrik imgeye düşürülmesi, yükseltilmiş koordinatlar kullanılarak, 6x10 boyutunda bir izdüşüm matrisi ile doğrusal olarak ifade edilmiştir. Yeterli sayıda 3B-2B nokta eşleniği ile bu izdüşüm matrisi hesaplanabilmekte, içsel ve dışsal parametreler bu matristen elde edilebilmektedir. Ardından doğrusal olmayan bir optimizasyon ile parametreler iyileştirilmektedir.Karma kamera imgeleri arasında nokta eşlemesi için, ölçekten bağımsız öznitelik dönüşümü (SIFT) kullanılmış ve eşleme başarısını artırmak üzere bir yöntem önerilmiştir. Önerilen yöntemle tümyönlü-perspektif eşleme performansı otomatik eşlemeyi mümkün kılacak ölçüde artmıştır. Ayrıca, tümyönlü imgelerden bükme sonucu elde edilen ve perspektif imge özellikleri taşıyan sanal kamera düzlemi (VCP) görüntülerini kullanarak eşleme yapılması da araştırılmıştır.Karma epipolar geometri kestirimi rasgele örnek onaylaşımı (RANSAC) ile gerçeklenmiş ve kamera duruş (konum ve yönelim) tespiti için alternatifler değerlendirilmiştir. Yapı kestirimi doğruluğunu artırmak üzere döngülü doğrusal üçgenleme için bir ağırlıklandırma yöntemi geliştirilmiştir. Son olarak, çok imgeli hareketten yapı çıkarımı için, yapıya her defasında yeni bir imge ekleme yaklaşımına dayalı yöntem uygulanmış ve kestirilen yapının doğruluğunun artırılması için nadir verili toplu düzenleme yöntemi küresel kamera modeli için modifiye edilerek kullanılmıştır.Önerilen yöntemler için benzetimli ve gerçek imgeler üzerinde deneyler yapılmıştır. Ayrıca, perspektif kameralarla beraber tümyönlü kameraları kullanmanın avantajlı olduğu durumlar vurgulanarak, karma kameralarla çok imgeli hareketten yapı çıkarımı gösterimleri yapılmıştır.
In this thesis, a pipeline for structure-from-motion with mixed camera types is described and methods for the steps of this pipeline to make it effective and automatic are proposed. These steps can be summarized as calibration, feature point matching, epipolar geometry and pose estimation, triangulation and bundle adjustment. We worked with catadioptric omnidirectional and perspective cameras and employed the sphere camera model, which encompasses single-viewpoint catadioptric systems as well as perspective cameras.For calibration of the sphere camera model, a new technique that has the advantage of linear and automatic parameter initialization is proposed. The projection of 3D points on a catadioptric image is represented linearly with a 6x10 projection matrix using lifted coordinates. This projection matrix is computed with an adequate number of 3D-2D correspondences and decomposed to obtain intrinsic and extrinsic parameters. Then, a non-linear optimization is performed to refine the parameters.For feature point matching between hybrid camera images, scale invariant feature transform (SIFT) is employed and a method is proposed to improve the SIFT matching output. With the proposed approach, omnidirectional-perspective matching performance significantly increases to enable automatic point matching. In addition, the use of virtual camera plane (VCP) images is evaluated, which are perspective images produced by unwarping the corresponding region in the omnidirectional image.The hybrid epipolar geometry is estimated using random sample consensus (RANSAC) and alternatives of pose estimation methods are evaluated. A weighting strategy for iterative linear triangulation which improves the structure estimation accuracy is proposed. Finally, multi-view structure-from-motion (SfM) is performed by employing the approach of adding views to the structure one by one. To refine the structure estimated with multiple views, sparse bundle adjustment method is employed with a modification to use the sphere camera model.Experiments on simulated and real images for the proposed approaches are conducted. Also, the results of hybrid multi-view SfM with real images are demonstrated, emphasizing the cases where it is advantageous to use omnidirectional cameras with perspective cameras.