Tez No İndirme Tez Künye Durumu
724182
Konvolüsyonel sinir ağlarında ağ eğitiminin iyileştirilmesi / Improving the network training in convolutional neural networks
Yazar:KÜBRA UYAR
Danışman: PROF. DR. ŞAKİR TAŞDEMİR
Yer Bilgisi: Selçuk Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bulanık mantık = Fuzzy logic ; Derin öğrenme = Deep learning ; Konvolüsyon = Convolution ; Medikal resimleme = Medical image ; Sinir ağları = Nerve net ; Yapay zeka = Artificial intelligence
Onaylandı
Doktora
Türkçe
2022
144 s.
Literatürde görüntü analizi problemlerinin çözümü için makine öğrenmesi yöntemleri kullanılarak farklı yaklaşımlar geliştirilmiştir. Fakat makine öğrenmesi yöntemleri ile görüntülerin analiz edilebilmesi için öncelikle özellik çıkarımının yapılması gerekmektedir. Ham veri üzerinde özellik keşfinin otomatik olarak yapılabilmesi için derin öğrenme mimarileri geliştirilmiştir. Yapay zekânın bir alt dalı olan derin öğrenme derin katmanlı ağ mimarilerinin genel bir adı olarak ifade edilmektedir. Özellikle görüntü analizi uygulamalarında kullanılan derin öğrenme modellerinin ortaya çıkması ile nesne sınıflandırmadaki hata oranında keskin bir düşüş yaşanmıştır. Derin katmanlar boyunca veriye ait farklı özelliklerin keşfedilmesi derin öğrenmenin başarısının temel nedenidir. Derin sinir ağlarının etkili performansı farklı gerçek dünya problemlerinin çözümüne olanak sağlamıştır. Derin öğrenme yöntemleri arasında yer alan konvolüsyonel sinir ağları görüntü temelli uygulamalarda özellikle özellik çıkarımında doğru, etkili ve güvenilir bir yöntem olarak bilinmektedir. Bu tez çalışması kapsamında konvolüsyonel sinir ağlarında ağ eğitiminin iyileştirilmesi amacıyla farklı yaklaşımlar önerilmiştir. Özgün bölge bazlı çalışan konvolüsyonel sinir ağları modelinin tasarlanması, bulanık mantık yaklaşımı ile konvolüsyonel sinir ağlarının eğitimi sırasında kullanılan hiperparametrelerin analiz ve optimizasyonu ve istatistiksel dağılımlar ve üç boyutlu referans görüntüler kullanılarak konvolüsyon filtrelerinin tasarlanması tez çalışmasının kapsamını oluşturmaktadır. İlk olarak ResNet50 modeli modifiye edilerek bölge bazlı çalışan Faster R-CNN modeli tasarlanmıştır. Kapsamlı bir analiz sunmak amacıyla makine öğrenmesi ve derin öğrenme yöntemleri test edilmiştir. Yapay Sinir Ağları, AdaBoost, Karar Ağacı, Lojistik Regresyon, Naive Bayes, Rastgele Orman ve Destek Vektör Makineleri makine öğrenmesi yöntemleri olarak kullanılırken literatürde sıklıkla kullanılan farklı yapılardaki 13 farklı konvolüsyonel sinir ağı modeli ve özgün olarak tasarlanan ResNet50 modifiyeli Faster R-CNN modeli derin öğrenme yöntemi olarak kullanılmıştır. İkinci olarak konvolüsyonel sinir ağlarında ağ eğitimi sırasında kullanılan topoloji ve eğitim parametrelerinin sınıflandırma performansı üzerine etkilerini analiz etmek amacıyla bir bulanık ağaç yapısı oluşturulmuştur. Başlangıç öğrenme hızı, devir sayısı, paket boyutu ve kullanılan konvolüsyonel sinir ağı modeline bağlı olarak sınıflandırma sonucu tahmin edilmeye çalışılmıştır. Ayrıca kural tabanının ve bulanık model parametrelerinin uzman kişiye gerek kalmadan otomatik olarak belirlenmesi bu çalışmaya özgünlük katmaktadır. Son olarak, konvolüsyonel sinir ağlarında konvolüsyon katmanlarında bulunan filtrelerin ilk değerlerinin belirlenmesi amacıyla iki farklı filtre oluşturma yaklaşımı önerilmiştir. Bu iki filtre oluşturma yaklaşımı literatüre yeni bir bakış açısı sağlamaktadır. Bu yaklaşımlar derin ağlar kullanmak yerine daha basit mimarilerle daha başarılı sınıflandırma sonuçlarının elde edilebileceğini göstermektedir. Önerilen yaklaşımların analiz edilebilmesi için özgün olarak hazırlanmış olan histoloji ve radyoloji veri setleri kullanılmıştır. Histoloji veri seti bağ, epitel, kan, kas ve sinir dokuya ait görüntülerden oluşmaktadır. Radyolojik görüntü olarak beyin bilgisayarlı tomografi görüntüleri alınmış olup normal, kanamalı ve ventriküler genişlemeli retrospektif görüntüler incelenmiştir. Ek olarak literatürde sıklıkla kullanılan ve başta CIFAR10 ve CIFAR100 olmak üzere bazı veri setleri de benchmark veri setleri olarak kullanılmıştır. Deneysel çalışmalar önerilen yaklaşımların ağ eğitimini iyileştirdiğini göstermektedir. Özgün olarak hazırlanmış gerçek dünya verileri üzerinde gerçekleştirilen derin öğrenme/sınıflandırma çalışmaları tıp uzmanları için bilgisayar destekli tıbbi karar destek sistemi olarak da kullanılabilmektedir.
In the literature, different approaches have been developed using machine learning methods for the solution of image analysis problems. However, in order to analyze images with machine learning methods, feature extraction must be done first. Deep Learning architectures have been developed for automatic feature discovery on raw data. It is expressed as a general name of deep layer network architectures, which is a subfield of artificial intelligence. Especially with the emergence of deep learning models used in image analysis applications, the error rate in object classification has experienced a sharp decrease. The discovery of different features of data across deep layers is the main reason for the success of deep learning. The effective performance of deep neural networks has enabled the solution of different real-world problems. Convolutional Neural Network (CNN), which is one of the deep learning methods, is known as an accurate, effective, and reliable method in image-based applications, especially in feature extraction. Within the scope of this thesis, different approaches have been proposed to improve network training in CNNs. The scope of the thesis is to design the original region-based CNN model, to analyze and optimize the hyperparameters used during the training of the CNN with fuzzy logic approach, and to design convolution filters using statistical distributions and three-dimensional reference images. Firstly, ResNet50 model was modified and the region-based Faster R-CNN model was designed. Machine learning and deep learning methods have been tested to provide a comprehensive analysis. While Artificial Neural Networks, AdaBoost, Decision Tree, Logistic Regression, Naive Bayes, Random Forest, and Support Vector Machines were used as machine learning methods, 13 different CNN models with different structures frequently used in the literature and the originally designed ResNet50 modified Faster R-CNN model were used as deep learning methods. Secondly, a fuzzy tree structure was created to analyze the effects of topology and training parameters used during network training in CNN on classification performance. The classification result was tried to be estimated depending on the initial learning rate, number of epochs, the minibatch size, and used CNN model. In addition, the automatic determination of the rule base and fuzzy model parameters without the need for an expert provides originality to this study. Finally, two different filter generation approaches were proposed to determine the initial values of the filters in the convolution layers in CNN. These two filter generation approaches provide a new perspective to the literature. These approaches show that more successful classification results can be obtained with simpler architectures instead of using deep networks. Originally prepared histology and radiology datasets were used to analyze the proposed approaches. The histology dataset consists of images of connective, epithelial, blood, muscle, and nerve tissues. Brain computed tomography images were taken as radiological images, and retrospective images with normal, hemorrhagic, and ventricular enlargement were examined. In addition, some datasets, especially CIFAR10 and CIFAR100, which are frequently used in the literature, have also been used as benchmark datasets. Experimental studies show that the proposed approaches improve network training. Deep learning/classification studies carried out on real-world data using originally prepared data sets can also be used as a computer-aided medical decision support system for medical professionals.