Tez No İndirme Tez Künye Durumu
678927
Deep learning approaches for the localization of capsule endoscope / Kapsül endoskopi lokalizasyonu için derin öğrenme yaklaşımları
Yazar:KUTSEV BENGİSU ÖZYÖRÜK
Danışman: DOÇ. DR. BORA GARİPCAN ; DR. MEHMET TURAN
Yer Bilgisi: Boğaziçi Üniversitesi / Biyo-Medikal Mühendislik Enstitüsü / Biyomühendislik Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyoteknoloji = Biotechnology
Dizin:
Onaylandı
Doktora
İngilizce
2021
78 s.
Derin öğrenme teknikleri endoskopi vidyolarında yoğun topografi yeniden canlandırma ve lokasyon tahmini methodları için ümit vaad etmektedir. Ancak, şuan anonim veri kümeleri efektif sayısal kıyaslamayı desteklememektedir. Bu tezde, altı domuz içorganı ile eş güdümlü konumlandırma ve haritalandırma algoritmaları geliştirmede kullanılabilecek 3D nokta bulutu datası, kapsül ve standart endoskopi kayıtları oluşturuldu. Ayrıca, Unity ortamında sentetik olarak üretilmiş ve standart klinik kullanımdaki endoskop ile fantom kolondan toplanan bilgisayarlı tomografi taramasını kesin referans olarak içeren veri eklenerek kapsamlı bir endoskopi dataset oluşturulmuştur. Buna ek olarak, Endo-SfMLearner, konumsal dikkat modulü ile derin kalıntı ağlarını kombinleyen güdümsüz monokülar derinlik ve pozisyon tahmini methodu önerilmiştir. Parlaklık farkındalıklı fotometrik yitim fonksiyonu sayesinde endoskopik vidyolarda sıkça görülen kamera kareleri arası hızlı ışık değişimlerine karşı dayanıklılık artırılmıştır. EndoSLAM veri kümesi kullanımı, Endo-SfMLearner algoritmasının en yaygın kullanılan methodlarla; SC-SfMLearner, Monodepth2 ve SfMLearner ile geniş kıyaslaması ile örneklenmiştir.
Deep learning techniques hold promise to develop dense topography reconstruction and pose estimation methods for endoscopic videos. However, currently available datasets do not support effective quantitative benchmarking. In this thesis, we introduce a comprehensive endoscopic simultaneous localization and mapping (SLAM) dataset consisting of 3D point cloud data for six porcine organs, capsule and standard endoscopy recordings, synthetically generated data as well as clinically in use conventional endoscope recording of the phantom colon with computed tomography scan ground truth. To verify the applicability of this data for use with real clinical systems, we recorded a video sequence with a state-of-the-art colonoscope from a full representation silicon colon phantom. Additionally, we propound Endo-SfMLearner, an unsupervised monocular depth and pose estimation method that combines residual networks with a spatial attention module in order to dictate the network to focus on distinguishable and highly textured tissue regions. The proposed approach makes use of a brightness-aware photometric loss to improve the robustness under fast frame-to-frame illumination changes that are commonly seen in endoscopic videos. To exemplify the use-case of the EndoSLAM dataset, the performance of Endo-SfMLearner is extensively compared with the state-of-the-art: SC-SfMLearner, Monodepth2, and SfMLearner.