Tez No İndirme Tez Künye Durumu
747288
Çekişmeli üretken ağlarla medikal görüntülerin üretimi ve analizi / Use of generative adversarial networks in medical image synthesis and segmentation
Yazar:SARA ALTUN GÜVEN
Danışman: PROF. DR. MUHAMMED FATİH TALU
Yer Bilgisi: İnönü Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Derin öğrenme = Deep learning ; Görüntü bölütleme = Image segmentation ; Görüntü iyileştirme = Image enhancement ; Görüntü üretimi = Image production ; Üretici ağlar = Producer networks
Onaylandı
Doktora
Türkçe
2022
114 s.
Çekişmeli Üretken Ağlar (ÇÜA), son yıllarda popüler derin öğrenme mimarilerinden biridir. Görüntü sentezlemesi yapılırken gerçek görsellere çok yakın görseller elde etmiştir. ÇÜA, sinyalden görüntüye dönüşümde, görüntü sentezleme ve bölütlemesinde, çözünürlük arttırma ve eksik parçaların tamamlanması gibi alanlarda birçok araştırmacının dikkatini çekmiştir. Bilgisayar görmesi alanındaki çoğu yöntemi geride bıraktığı gözlenmiştir. Bu tez çalışmasında, medikal veri kümesi oluşturma ve medikal veriler üzerinden görüntü sentezleme, bölütleme ve çözünürlük arttırma gibi alanlardaki en güncel yaklaşımlar incelenmiş ve ÇÜA temelli yeni mimariler geliştirilerek literatüre katkılar sunulmuştur. Yapılan ilk deneysel çalışmada, klasik ÇÜA mimarilerinden CycleGAN ve Pix2Pix yöntemlerinin PAPSMEAR hücre çekirdeği üretmedeki etkisi incelenmiştir. Mimarilerin performansları kıyaslanırken Jaccard ve Dice benzerliklerinden yararlanılmıştır. Görüntü sentezleme performansları ayrı ayrı incelenerek sonuçlar çizelgeler ve görsel şekilde sunulmuştur. Tez kapsamında yapılan ikinci deneysel çalışma, sentetik PAPSMEAR veri kümesi oluşturmada matematiksel modelleme tabanlı yöntemin kullanılmasıdır. Oluşturulan yöntem MathModel olarak adlandırılmıştır. Tez kapsamında yapılan üçüncü deneysel çalışmanın birinci kısmında, PAPSMEAR veri kümesi üzerinde klasik ÇÜA mimarileri (CycleGAN, Pix2Pix, DiscoGAN ve AttentionGAN) kullanılarak yeni görüntüler sentezlenmiştir. Oluşturulan görüntüler MSE, SSIM ve PSNR'ye göre kıyaslanmıştır. Bu çıktılar dikkate alınarak Pix2PixSSIM olarak adlandırılan yeni bir ÇÜA mimarisi önerilmiştir. Elde edilen sonuçlar çizelgelerle ve görsellerle sunulmuştur. İkinci kısmında ise PAPSMEAR veri kümesi üzerinde klasik ve güncel karşılaştırma metriklerinin ÇÜA mimarileri maliyetinin değişmesindeki etkisi incelenmektedir. Bu çalışmadaki amaç gelecekte ÇÜA mimarilerinde genel kullanmaya elverişli maliyet fonksiyonu keşfetmektir. Sonuçlar görsel ve çizelgesel olarak sunulmaktadır. Tez kapsamında yapılan dördüncü deneysel çalışmada, PAPSMEAR veri kümesi üzerinde görüntü bölütlemesi yaparken klasik ÇÜA mimarileri (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) kullanılmıştır. Yöntem sonuçları kıyaslanırken hem görsel hem de çizelgesel sonuçlara yer verilmiştir. Çıktılar kıyaslanırken LPIPS, PSNR, FID ve KID benzerlik metrikleri kullanılmıştır. Tez kapsamında yapılan beşinci deneysel çalışmada, 2 boyutlu beyin MRI veri kümesi üzerinde görüntü bölütlemesi yaparken klasik ÇÜA mimarileri (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) kullanılmıştır ve SSimDCL olarak adlandırılan yeni ÇÜA mimarisi önerilmiştir. Önerilen yöntemin hem görüntü çözünürlüğü arttırmada hem de bölütlemede başarılı sonuçlar verdiği gözlemlenmiştir. Oluşturulan görüntüler kıyaslanırken LPIPS,PSNR, FID ve KID yöntemleri kullanılmıştır. Çalışmanın son aşamasında ise günümüzde dokusal olarak Beyin MRI konusunda iyi bölütleme yapabilen VolBrain sonuçları ile görsel ve metriksel olarak kıyaslama yapılmıştır. Tez kapsamında yapılan altıncı deneysel çalışma, beşinci deneysel çalışmanın devamı şeklindedir. 2 boyutlu Beyin MRI, PAPSMEAR, CHASEDB ve XRAY veri kümelerinde görüntü bölütlemesi yaparken klasik ÇÜA mimarileri (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) ile SSimDCL yöntemi kullanılmıştır. Amaç, diğer medikal görüntüler üzerinde bölütleme yapılırken önerilen yöntemin verimliliği incelenmektedir. Çıktılar görsel ve çizelgesel olarak sunulmaktadır. Tez kapsamında yapılan yedinci deneysel çalışma, beyin tümörü bölütlemede ÇÜA mimarilerinden SSimDCL (önerilen) ile derin öğrenme mimarilerinden nnU-Net yöntemi kıyaslanmıştır. Beyin tümörü veri kümesi olarak BraTs kullanılmıştır. Bu çalışmada veri kümeleri iyileştirilmiş ve bu veri kümeleri üzerinden tekrar sonuçlar elde edilmiştir. Çıktılar hem görsel hem de çizelgesel olarak sunulmuştur. dördüncü deneysel çalışmanın devamı şeklindedir. Benzerlik metriği olarak LPIPS ve PSNR yöntemleri kullanılmıştır. Çıktılar görsel ve çizelgesel olarak sunulmaktadır. Yapılan deneyler ve incelemeler sonucunda, ÇÜA temelli yaklaşımların birçok problem çözümüne olumlu katkılar sağladığı gözlemlenmiştir.
Generative Adversarial Networks (GANs) are one of the popular deep learning architectures in recent years. While performing image synthesis, images very close to real images were obtained. GANs have attracted the attention of many researchers in areas such as signal-to-image conversion, image synthesis and segmentation, resolution enhancement and completion of missing parts. It has been observed that it surpasses most methods in the field of computer vision. In this thesis, the most up-to-date approaches in areas such as creating medical datasets and image synthesis, segmentation and resolution enhancement on medical data were examined, and new GAN-based architectures were developed and contributions were made to the literature. In the first experimental study, the effect of classical GAN architectures CycleGAN and Pix2Pix methods on PAPSMEAR cell nuclei production was investigated. While comparing the performances of the architectures, Jaccard and Dice similarities were used. Image synthesis performances were examined separately and the results were presented in charts and visual forms. The second experimental study within the scope of the thesis is the use of mathematical modeling-based method to create synthetic PAPSMEAR dataset. The created method is named MathModel. In the first part of the third experimental study conducted within the scope of the thesis, new images were synthesized on the PAPSMEAR dataset by using classical MPA architectures (CycleGAN, Pix2Pix, DiscoGAN and AttentionGAN). The created images were compared according to MSE, SSIM and PSNR. Considering these outputs, a new GAN architecture called Pix2PixSSIM has been proposed. Obtained results are presented with charts and visuals. In the second part, the effect of classical and current comparison metrics on the PAPSMEAR dataset on the cost of GAN architectures is examined. The aim of this study is to discover a cost function suitable for general use in future GAN architectures. Results are presented visually and tabularly. In the fourth experimental study conducted within the scope of the thesis, classical GAN architectures (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) were used while performing image segmentation on the PAPSMEAR dataset. While comparing the method results, both visual and tabular results are included. LPIPS, PSNR, FID and KID similarity metrics were used when comparing the outputs. In the fifth experimental study within the scope of the thesis, classical GAN architectures (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) were used while performing image segmentation on the 2D brain MRI dataset, and a new GAN architecture called SSimDCL was proposed. It has been observed that the proposed method gives successful results both in increasing image resolution and in segmentation. LPIPS, PSNR, FID and KID methods were used when comparing the created images. In the last stage of the study, a visual and metric comparison was made with VolBrain results, which can now make good segmentation in brain MRI texturally. The sixth experimental study conducted within the scope of the thesis is the continuation of the fifth experimental study. Classical GAN architectures (CycleGAN, CUT, FastCUT, DCLGAN, SimDCL) and SSimDCL method were used while performing image segmentation on 2D Brain MRI, PAPSMEAR, CHASEDB and XRAY datasets. The aim is to examine the efficiency of the proposed method when segmentation on other medical images. Outputs are presented in a visual and tabular form. In the seventh experimental study conducted within the scope of the thesis, SSimDCL (recommended) from GAN architectures and nnU-Net method from deep learning architectures were compared in brain tumor segmentation. BraTs was used as the brain tumor dataset. In this study, datasets were improved and results were obtained over these datasets. Outputs are presented both visually and schematically. It is a continuation of the fourth experimental study. LPIPS and PSNR methods were used as similarity metrics. Outputs are presented visually and in tabular form. As a result of experiments and investigations, it has been observed that GAN-based approaches make positive contributions to many problem solutions.