Derinlik bilgisini sağlayan RGB-D görüntülerinden nesne tanıma, robotik ve bilgisayarlı görü gibi uygulama alanlarında çok önemli bir görevdir. Evrişimli sinir ağları, özellikle RGB-D nesne tanıma uygulamalarında yaygın olarak kullanılmaktadır. Evrişimli sinir ağları, nesne tanımada üstün performans göstermesine rağmen, belirli kısıtlara sahiptir. Evrişimli sinir ağlarında kullanılan örnekleme katmanı, öznitelik çıkarma aşamasında bilgi kaybına neden olmaktadır. Buna ek olarak, evrişimli sinir ağları, dönme ve ışık şiddeti gibi çevresel etkenlere karşı çok hassastır. Hinton tarafından önerilen kapsül ağları, bu tarz problemlerden kaçınmak için geliştirilmiştir. Bu tezde, kapsül ağlarının, RGB-D veri seti üzerindeki performansları incelenmiştir. Ayrıca, ilk katmanında derinlik görüntüleri, ikinci katmanında RGB görüntüleri olan iki katmanlı hiyerarşik bir yapı önerilmiştir. Evrişimli sinir ağları ve kapsül ağlarından oluşan iki farklı hiyerarşik yapı tasarlanmıştır. Evrişimli sinir ağları ve kapsül ağlarının performansları, Washington RGB-D veri seti üzerinde değerlendirilmiştir. Simülasyon sonuçlarına göre, en iyi performans hiyerarşik evrişimli sinir ağı ile elde edilmiştir.
|