Tez No İndirme Tez Künye Durumu
641182
Training object detectors by directly optimizing LRP metric / LRP metriğinin doğrudan en iyilenmesi ile nesne tespitçilerinin eğitilmesi
Yazar:BARIŞ CAN ÇAM
Danışman: DR. ÖĞR. ÜYESİ EMRE AKBAŞ ; DOÇ. DR. SİNAN KALKAN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayarla görme = Computer vision ; Nesne tanıma = Object recognition ; Yapay görme = Machine vision
Onaylandı
Yüksek Lisans
İngilizce
2020
102 s.
Bu tezin odak noktası, derin nesne tespitçi ağların, nesne tespitçilerinin iki alt görevini (sınıflandırma ve konumlandırma) birleşik olarak değerlendirebilen LRP performans ölçütünün (Oksuz vd., 2018) eniyilenerek eğitilmesidir. Bu hedefe ulaşmak için, yaygın doğrusal ağırlıklandırma yaklaşımının aksine, geçmiş çalışmalarda kullanılan sınırlandırılmış konumlandırma kayıp fonksiyonları kullanılmış ve sınıflandırma görevinin aralığını sınırlandırabilen yeni bir kayıp fonksiyonu önerilerek dolaylı olarak LRP performans ölçütü eniyilenmiştir. Aralık sınırlandırma yaklaşımına ek olarak, eğitim süresince toplanan LRP değerlerinin regresyonu ile nesne tespitçilerinin eğitilmesi amaçlanmıştır. Önerilen regresyon mimarisinin LRP değerlerini kabul edilebilir hata oranları ile tahmin edebildiği gösterilmiştir. Buna rağmen, regresyon mimarisinin LRP hata tahmincisi olarak eklenmesi ile nesne tespitçisi eğitimi başarısız olmuştur. Son olarak, Chen vd. (2020)'nin önerdiği perceptron öğrenme algoritmasının uyarlanması ile LRP metriğinin nesne tespitçisi eğitmek üzere kayıp fonksiyonu olarak entegre edilmesi sağlanmıştır. Bu tezde, perceptron öğrenme tabanlı yaklaşım irdelenmiş ve bu yaklaşımın IoU tabanlı konumlandırma kayıp fonksiyonlarına genelleştirilmesi önerilmiştir.
This thesis focuses on training deep object detection networks by directly optimizing the localisation-recall-precision (LRP) performance metric that can evaluate classification and localisation performance of an object detector in a unified manner (Oksuz et al., 2018). To achieve this goal, unlike the commonly used linear weighting approach, we aim to implicitly optimize the LRP metric first by using a bounded localisation loss from previous works and proposing a loss function that can bound the range of classification task loss. In addition to this range balancing approach, we aim to train an object detector with an LRP regressor trained with LRP values collected during the training stage. We show that the proposed regression architecture can estimate LRP values with low error rates. However, training an object detector by attaching the regressor architecture as a differentiable LRP error estimator did not yield satisfactory results. Finally, by adapting the perceptron learning algorithm based approach proposed by Chen et al. (2020), we show that we can embed the LRP metric as a loss function to train a deep object detector. In this thesis, this perceptron learning-based approach is examined, and its generalization to all IoU based localisation loss functions is proposed.