Tez No İndirme Tez Künye Durumu
680414
Deep learning ensembles for image understanding /
Yazar:SARA ATITO ALI AHMED
Danışman: PROF. DR. AYŞE BERRİN YANIKOĞLU YEŞİLYURT
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2021
121 s.
Derin sinir ağları, görüntü anlama da dahil olmak üzere birçok uygulamada karar verme sistemlerinin performansını artırdı. Çeşitli sınıflandırma ve regresyon görevleri için güçlü araçlar olduğu gösterilen topluluk yöntemleri kullanılarak daha fazla performans kazanımı elde edilebilir. Bu tez iki bölümden oluşmaktadır. Birinci bölüm, yüz öznitelikleri sınıflandırma problemini incelemeye ayrılmıştır. CelebA ve LFWA veri kümelerinde en gelişmiş sonuçları elde ederek bu sorun için birkaç yeni yaklaşım sunuyoruz: i) temel öğrenicilerin konuma göre gruplandırıldığı, ölçeklenebilirlik için çoklu öznitelik sınıflandırması için çok görevli öğrenme (MTL) çerçevesini kullanıyoruz yüzdeki özniteliğin ve ağırlıkların paylaşılması. Bir özniteliğin konumu hakkında ön bilgi olarak bilgi verilmesi, öğrenme sürecini hızlandırdığı ve doğruluğun artmasına neden olduğu gösterilmiştir. ii) derin öğrenme modelinin kendisinde (ağ içi topluluk) yeni bir topluluk öğrenme tekniği tanıtıyoruz ve neredeyse aynı anda tek bir modelin karmaşıklığıyla artan performans gösteriyoruz. iii) göreli öznitelik sınıflandırması için (iki fotoğraftaki öznitelik ifadesini karşılaştırarak) DVM formülasyonunu derin sıralı öğrenmeye uyarlayan Deep-RankSVM adlı yeni bir çerçeve öneriyoruz. İkinci bölüm, derin ağ toplulukları oluşturmak için farklı son teknoloji tasarım stratejilerinin uygunluğunu analiz etmeye ayrılmıştır. Hata Düzeltme Çıktı Kodları (ECOC) çerçevesini yeni bir derin öğrenme topluluğu yöntemi olarak öneriyoruz ve keyfi doğruluk-karmaşıklık değiş tokuşu için MTL çerçevesiyle kullanılabileceğini gösteriyoruz. Çeşitli veri setlerinde tanıtılan ECOC tasarımları ile topluluk ortalaması ve gradyan artırma karar ağaçları gibi son teknoloji topluluk teknikleri arasında kapsamlı bir karşılaştırmalı çalışma yürütüyoruz. Tezin geri kalanında, cilt lezyonu sınıflandırmasını ve bitki tanımlamasını içeren önerilen topluluk tekniklerinin genel uygulamalarını tartışıyoruz.
Deep neural networks have enhanced the performance of decision making systems in many applications, including image understanding. Further performance gains canbe achieved by using ensemble methods, which are shown to be powerful tools for various classification and regression tasks. This dissertation consists of two parts.The first part is devoted to studying the face attributes classification problem. We introduce several novel approaches for this problem, achieving state-of-art resultson CelebA and LFWA datasets: i) we use the multi-task learning (MTL) framework for multiple attributes classification for scalability, where base learners are grouped according to the location of the attribute on the face and share weights. Giving information about the location of an attribute as prior information is shown to speed up the learning process and lead to increased accuracy. ii) we introduce a novel ensemble learning technique within the deep learning model itself (within-network ensemble), showing increased performance at almost the same time complexity of a single model. iii) we propose a new framework called Deep-RankSVM for relative attribute classification (comparing the attribution expression on two photographs) adapting the SVM formulation to deep rank learning. The second part is devoted to analyzing the suitability of different state-of-art design strategies for constructing ensembles of deep networks. We propose the Error Cor-recting Output Codes (ECOC) framework as a novel deep learning ensemble method, and show that it can be used with the MTL framework for arbitrary accuracy-complexity trade-off. We carry out an extensive comparative study between the introduced ECOC designs and the state-of-the-art ensemble techniques such as ensemble averaging and gradient boosting decision trees, on several datasets. In the rest of the dissertation, we discuss general applications of the proposed ensemble techniques that include skin lesion classification and plant identification.