Tez No İndirme Tez Künye Durumu
714907
Style-based generative adversarial networks for enhancing deep-learning-based person re-identification / Derin öğrenme tabanlı kişi yeniden tanımlamak için stil tabanlı üretici çekişmeli (adversarıal) ağlar
Yazar:SALEH HUSSIN SALEM HUSSIN
Danışman: PROF. DR. REMZİ YILDIRIM
Yer Bilgisi: Ankara Yıldırım Beyazıt Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2021
195 s.
Derin öğrenme teknolojisi, kişiyi yeniden tanımlama performansını büyük ölçüde artırdı. Öğrenmedeki zorlukların etkisini bir dereceye kadar azaltmaya da katkıda bulundu. Ancak, bu derin öğrenme yöntemlerin eğitimi için büyük miktarda lisanslı veriye ihtiyaç duyulduğu için yeni bir zorluk ile de karşılaşıldı. Dolayısıyla, kişinin yeniden tanımlanması hala ciddi bir sorundur ve tüm değişik zorluklar için de belirgin bir çözümü de yoktur. Bu nedenle, eğitim setleri için yeterli veri seti ile derin öğrenme teknolojisini kullanan bir kişiyi yeniden tanımlama yönteminin geliştirilmesine ihtiyaç vardır. Bu çalışmada, derin öğrenme teknolojisine dayalı kişi yeniden tanımlama yöntemi ile birlikte StyleGAN ve LSRO algoritması önermektedir. Önerilen yöntem, derin öğrenmeye dayalı kişinin yeniden tanımlanmasına ilişkin temel sorunu, yani eğitim için gerekli veri eksikliğini çözmektedir. Nesne tanıma için geliştirilen genel CNN modelini değiştirerek kişiyi yeniden tanımlamaya yönelik güçlü ayırt edici özellikler elde etmek için başarılı bir temel model oluşturarak işe başlar. Daha sonra, mevcut kişi yeniden tanımlama veri kümelerinden yüksek kaliteli yeni sentetik görüntüler oluşturmak için StyleGAN'ı kullanır. Oluşturulan bu görüntüler, arka plan, renk, aydınlatma ve pozlar açısından çok daha kapsamlı bir çeşitlilik sunarak eğitim setlerini genişletmek için kullanır. Sonrada, LSRO algoritması, StyleGAN tarafından üretilen görüntüleri, tek tip bir etiket dağılımı yaparak ve temel modeli eğitmek için düzenli bir kayıp işlevi tanımlayarak orijinal etiketli eğitim görüntülerine entegre etmek için kullanılır. StyleGAN kullanılarak yeni yüksek kaliteli sentetik görüntülerin oluşturulması ve bunların LSRO kullanılarak veri kümelerindeki gerçek görüntülerle entegre edilmesi, bu çalışmanın bu alana yaptığı en önemli katkısıdır. Gerçekleştirilen deneysel analiz ve sonuçları, önerilen kişiyi yeniden tanımlama yaklaşımımız, diğer teknoloji metotlara göre daha iyi performans elde edilmiştir. . Anahtar Kelimeler: Kişinin yeniden tanımlanması; Derin öğrenme; Transfer öğrenimi; Evrişimli sinir ağları; Üretken düşmanlık ağları; Aykırı değerler için etiket yumuşatma düzenlemesi; StyleGAN.
Deep-learning (DL) technologies have greatly boosted the performance of person Re-ID. However, they add a new challenge, in that these deep methods need large amounts of labeled data for training. Hence, person Re-ID remains an open problem, for which no prominent solutions have been found for all the different challenges. Thus, there is a need to develop a person Re-ID method that uses DL technology with a sufficient dataset for training. This study proposes an improved person Re-ID method based on DL technology, along with a StyleGAN and LSRO algorithm. The proposed method can solve the main issue of DL-based person Re-ID, namely the lack of data needed for training. It begins by constructing a successful baseline model to extract the strong discriminative features necessary for person Re-ID by modifying a general CNN model developed for the general object recognition task. Then, fine-tuning it using the transfer learning approach to make it more suitable for the person Re-ID problem domain. Moreover, random erasing and re-ranking are combined with the baseline model proposed herein to achieve significant performance improvement further and avoid overfitting. Afterward, the proposed method for person Re-ID exploits the StyleGAN to generate synthetic images that are both new and high-quality using the person Re-ID datasets that already exist. These newly generated images are then used to enlarge the training sets by introducing more extensive variations in terms of illumination, background, poses, and color. Then, the LSRO algorithm is used to integrate the generated images into the originally labeled training images. This is done by giving each of them uniform label distribution and designating a regularized loss function to them for the training of the baseline model. Generation of the new high-quality synthetic images using the StyleGAN and integrating them with the real images in datasets using the LSRO is the foremost contribution of the present research. The conducted experimental analysis and results proved that the proposed person Re-ID approach yielded better overall performance when compared with state-of-the-art person Re-ID approaches. Keywords: Person re-identification; Deep learning; Transfer learning; Convolutional neural networks; Generative adversarial networks; Label smoothing regularization for outliers; StyleGAN.