Tez No İndirme Tez Künye Durumu
747457
Use of spatial information in classification and segmentation of synthetic aperture radar images / Uzamsal bilgilerin yapay açıklıklı uydu görüntülerinin sınıflandırma ve bölütleme işleminde kullanılması
Yazar:ÜNSAL GÖKDAĞ
Danışman: DOÇ. DR. GÖKHAN BİLGİN
Yer Bilgisi: Yıldız Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Gauss = Gauss ; Görüntü bölütleme = Image segmentation ; Makine öğrenmesi = Machine learning ; Radar = Radar ; Sentetik açıklık radarı = Synthetic aperture radar ; Tamamlayıcı yaklaşım = Complementary approach
Onaylandı
Doktora
İngilizce
2022
134 s.
Bu tez, farklı U Şekilli Ağların anlamsal sınıflandırma performansları üzerine çeşitli deneyler yapmak ve sınıflandırma sonuçlarını sınıflandırma sonişlem sürecinden geçirerek anlamsal sınıflandırma başarımını arttırma üzerine yazılmıştır. Anlamsal sınıflandırma son yıllarda U Şekilli ağların icadı ile birlikte ciddi bir önem kazanmış ve bu süreçte U-Ağ üzerine çeşitli geliştirmeler yapılarak çeşitli modeller elde edilmiştir. Bu tezde U-Ağ, İlgi Mekanizmalı U-Ağ, Transformatör U-Ağ ve Swin U-Ağ mimarileri 2 farklı Yapay Açıklıklı Radar (YAR) ve multispektral veri kümesi üzerinde en önemli iki hiperparametre'nin (başlangıç öğrenme katsayısı ve üstel öğrenme katsayısı sönümü) etkisi üzerine yazılmıştır. Her ne kadar farklı hiperparametrelerin sonuçları etkilediği görülse de, YAR ve multispektral veri kümelerinin yüksek gürültülü yapıları sebebiyle en yüksek performanslar ancak probleme özgü hiperparametrelerin seçilmesiyle elde edilebilmiş ve tüm veri kümeleri için ortak bir optimal çözümün mümkün olmadığını göstermiştir. YAR görüntüleri üzerinde piksel tabanlı ve uzamsal tabanlı sınıflandırma algoritmalarının ikisinin de piksel seviyesinde hata yaptığı gözlemlenmiştir. Bu tezde tamamlayıcı Gauss çekirdeği (TGÇ) kullanılarak sınıflandırma hatalarının giderimi hedeflenmiştir. Önerilen metodun başarımının tespiti için düz çekirdek (DÇ), Gauss çekirdeği (GÇ), rasgele Markov ağları (RMA) ve toplam varyasyon (TV) metodları kıyaslanmıştır. Önerilen metod filtreleme ve yeniden öğrenme yöntemlerinin bir bileşkesi olup YAR görüntülerine uygulanabilecek bir sınıflandırma son işlem yöntemidir. Önerilen yöntemde her bir pikselin konvolüsyonel sinir ağları tarafından tüm sınıflara ait olasılıkları hesaplanır. Daha sonra bu olasılıklar DÇ, GÇ, TV ve TGÇ metodları ile komşu piksel olasılıkları ile birlikte güncellenmiştir. Yapılan deneyler sonucunda önerilen TGÇ metodunun diğer metodlardan sınıflandırma başarımını daha fazla arttırdığı gözlemlenmiş ve yapılan McNemar istatistik testine göre elde edilen sınıflandırma değişimi miktarı istatistiksel anlamlılık ifade etmektedir.
This thesis focuses on experimentation over different U-Shaped architectures and highlight their differences and improving semantic segmentation performance by various classification post-processing methods. Semantic segmentation has gained a lot of attention after the inception of the U-Net architecture, and several other models were subsequently developed on this basis. In this thesis, U-Net, Attention U-Net, TransUNet and Swin-Unet architectures are compared with each other on two different SAR (Synthetic Aperture Radar) and multispectral data sets over two most significant hyperparameters (learning rate and learning rate decay). The results shows that although hyperparameters affects the performance of an architecture, the noisy nature of the SAR images affects performance and can only be remedied by fine-tuning, leaving the possibility of one-solution-fits-all approach. Classification errors may occur both in pixel and spatial based classification methods at the pixel level for SAR images. In this thesis, a classification post-processing method is proposed by utilizing complementary Gaussian kernel weighting (CGKW) for regularization of classification errors on the classified SAR images. To demonstrate the validity of the proposed method, the uniform kernel weighting (UKW), the Gaussian kernel weighting (GKW), Markov random fields (MRF) and Total Variation (TV) methods are also presented for comparison purposes. The proposed approach is a combination of filtering and relearning based classification post-processing method that can be applied to SAR images. In the proposed framework, class probabilities for every pixel are initially obtained by a convolutional neural network. Afterwards, classification results are updated again using the selected weighted averaging method and neighboring classification probabilities, and then the results of $UKW$, $GKW$, $CGKW$, $MRF$ and $TV$ are compared. Experimental results prove that the proposed $CGKW$ method improves the final classification accuracy better than other comparison methods, and the resulting classification difference between the UKW, GKW, MRF and TV methods is statistically significant according to McNemar's statistical significance test.