Tez No İndirme Tez Künye Durumu
768374
On the regularization of 3D object pose estimation / 3 boyutlu nesne poz kestiriminde regularizasyon
Yazar:MUHAMMET ALİ DEDE
Danışman: DR. ÖĞR. ÜYESİ YAKUP GENÇ
Yer Bilgisi: Gebze Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayarla görme = Computer vision
Onaylandı
Doktora
İngilizce
2022
90 s.
6-DoF Pose tahmini, bir nesnenin tercih edilen bir nesneye konumunu ve rotasyonunu bulmaktır. Yapay sinir a˘gları yardımı ile gelis¸tirilen sinir a˘gları klasik modellere go¨re oldukc¸a bas¸arlı olmaktadır O¨ zellikle zorlu aydınlatma, engellenme ve sahne da˘gınıklı˘gının g¨or¨unt¨uy¨u bozdu˘gu karmas¸ık sahneler de algoritmaların performanıs dikkat c¸ekici hale gelimis¸tir. Bununla birlikte, performanstaki kazanc¸ bir hesaplama maliyeti tas¸ır. O¨ zellikle elle etiketlenmis¸ verinin az ve pahalı olması ve ¨onerilerin daha y¨uksek bas¸arım ic¸in daha b¨uy¨uk modeller kullanması Bu algoritmaların uygulanabilece˘gi platformları kısıtlamaktadır. Bu tez c¸alıs¸masında, hesaplama y¨uk¨un¨u ve b¨uy¨uk veri ba˘gımlılı˘gı hafifletme olasılı˘gını aras¸tırılmıs¸tır. Bu sorunları c¸ ¨ozmek ic¸in ¨uc¸ farklı y¨ontem ¨onerilmis¸tir. ˙Ilk y¨ontem, ba˘gımlılı˘gı ortadan kaldırmak ic¸in sentetik olarak olus¸turulmus¸ verileri kullanırak daha k¨uc¸ ¨uk modeller kullanılabilir mi sorusunua cevap aramaktadır. ˙Ikinci y¨ontem, aspect sınıflandırması ve yo˘gun anahatar nokta tahminlemesi kullanarak nesne pozunu bulmaya c¸alıs¸ır. Son c¸alıs¸mamızda ise, m¨ufredat benzeri yeni bir e˘gitim rejimi ¨onerilmektedir. Bu m¨ufredatı olus¸turulurken, sentetik ve gerc¸ek d¨unya verilerinden ve yapay sinir a˘glarının davranıs¸larından yararlanır. O¨ nerilen yo¨ntemlerimizi, dig˘er aras¸tırmacılarında kullandıg˘ı ic¸in halka ac¸ık veri k¨umeleri test ettik. Elde etti˘gimiz sonuc¸lar, ¨onerilen y¨ontemlerin poz kestirim algoritmalarını hızlandırırken, en son teknolojiye sahip algoritmalarla kars¸ılas¸tırılabilir bir performans sergiledi˘gini g¨osteriyor. Anahtar
6-DoF Pose estimation is finding the rotation and translation of an object to a preferential frame of reference. With the help of Neural Networks, recent pose estimation algorithms show significant improvements over the classical ones. Especially in complex scenes where challenging illumination, occlusion, and scene clutter impair the algorithm performance. However, the gain in performance carries a computational cost and expensive hand-annotated real-world data. Moreover, prominent algorithms require larger neural models to raise the bar, thus requiring more expensive training data. This thesis investigates the possibility of easing the computational burden and dependency on big data. We propose three different methods to address the issue. Our first model uses synthetically generated data to remove dependency on real-world data for pose estimation with a light-weight neural network. The second method incorporates aspect-classification and dense key-point estimation processes and recovers the object pose using robust algorithms. Our final study proposes a new curriculum-like training regime. This curriculum takes advantage of synthetic and real-world data and the behavior of neural networks against adversarial and noisy(perturbed) data. We conduct our experiments on public datasets to validate our proposed methods. Results demonstrate that the proposed methods perform comparably to the state-of-the-art algorithms while speeding up the inference time significantly.