Tez No İndirme Tez Künye Durumu
678476
Evrişimli sinir ağları kullanılarak retina görüntülerinin segmentasyonu ve sınıflandırılması / Segmentation and classification of retina images using convolutional neural networks
Yazar:MALI MOHAMMEDHASAN
Danışman: PROF. DR. HARUN UĞUZ
Yer Bilgisi: Selçuk Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
88 s.
Derin öğrenme, bilgisayar ve veri biliminde son birkaç yılda en hızlı büyüyen alanlardan biridir. Çeşitli uygulamalarda özellik çıkarma ve tanıma için yaygın olarak kullanılmaktadır. Derin öğrenmedeki son gelişmeler, tıbbi görüntülerdeki kalıpları tanımlamak, sınıflandırmak ve ölçmek için büyük bir adım atmıştır. Bu şekilde, derin öğrenme, çeşitli tıbbi uygulamalarda gelişmiş performanslar elde eden son teknoloji bir temel olduğunu hızla kanıtlamaktadır. Bu tez çalışmasında doku segmentasyonu ve bilgisayar destekli hastalık teşhisi üzerine iki temel çalışma gerçekleştirilmiştir. İlk çalışma, retina kan damarlarını fundus görüntülerinden otomatik olarak bölümlere ayırmak için yeni bir Derin Evrişimli Sinir Ağı (DESA) mimarisi önermektedir. Otomatik segmentasyon, retina hastalıklarının bilgisayar destekli teşhisinde temel bir rol oynamaktdır. Göz hastalıklarının ve belirgin patolojik semptomlara yol açan diğer sistemik hastalıkların tanısında oldukça önemlidir. Retina kan damarı segmentasyonu, gürültülü bir arka planda damarların morfolojisindeki aşırı değişiklikler nedeniyle zordur. Mevcut derin öğrenme tabanlı denetimli yöntemler, anlamsal segmentasyon görevlerinde avantajlı olan düşük seviyeli özelliklerin yetersiz kullanımından dolayı çeşitli problemlerle karşılaşmaktadır. Tez kapsamında önerilen mimari, retina kan damarlarını segmentlere ayırmak için hem yüksek seviyeli özellikleri hem de düşük seviyeli özellikleri kullanmaktadır. Önerilen mimarinin ana katkısı iki önemli faktöre odaklanmaktadır. Birincisi, kümelenmiş rezidüel bağlantıların son derece modülerleştirilmiş ağ mimarisini sağlamasıdır. İkincisi, ağ içindeki bilgi işlem kaynaklarının kullanımını iyileştirmektir. Bu, hesaplama maliyetinin istikrarını korurken ağın derinliğini ve genişliğini artırmaya izin veren bir tasarımla elde edilmektedir. Deneysel sonuçlar, retina damarlarını daha doğru ve net bir şekilde bölümlere ayırmada kümelenmiş rezidüel bağlantıların kullanılmasının etkinliğini göstermektedir. Mevcut en iyi yöntemlerle karşılaştırıldığında, önerilen yöntem, farklı ölçümlerde diğer mevcut yöntemlerden daha iyi performans göstermiştir. İnce damarlarda daha az yanlış pozitif içermiştir ve uzmanların manuel segmentasyonu gibi yeterli ayrıntılarla daha net sınır çizgileri içermiştir. Diyabetik Retinopati (DR), zamanla retina dekolmanı, vitreus kanaması, glokom gibi görme sorunlarına yol açan ve daha kötü durumlarda başlangıçta periyodik DR taraması ile kontrol edilebilen körlüğe yol açan bir retina hastalığıdır. Erken teşhis, hastalığın daha fazla kontrolüne yol açacaktır, oysa tüm diyabetik hastalarda retina muayenelerinin yapılması ulaşılamaz bir ihtiyaçtır. Diyabetik retinopati, retina dokularında iz ve lezyonlar bırakacak ölçüde retinadaki kan damarlarında ilerleyici hasara neden olmaktadır. Bu lezyonlar kenarlar şeklinde görünür ve retina görüntülerini işlerken, diyabetik retinopati semptomlarının daha iyi teşhisini sağlamak için bu kenarlar vurgulamaya çalışılır. Tez kapsamında yapılan ikinci çalışma, Evrişimli Sinir Ağlarının (ESA) gücünü DR'nin sınıflandırma teşhisine kullanılabileceğini gösteren yeni bir strateji önermektedir. DR teşhisinde çok iyi performans gösteren, rezidüel bağlantılara sahip yeni bir ESA mimarisi kullanılmaktadır. Tanılama doğruluğunu iyileştirmek için verilere öncelikle Temel Bileşen Analizi (TBA) uygulanmıştır. Önerilen model, Kenarı-koruyan Kılavuzlu Görüntü Filtrelemeden (K-KGF) yararlanmaktadır. Bir kontrast geliştirme mekanizması olarak çalışmaktadır ve düşük gradyanlı alanları düzleştirmenin yanı sıra güçlü kenarları da vurgulamaktadır. Önerilen model, "RUnet-PCA: Temel Bileşen Analizi ile Rezidüel U-net Derin ESA" olarak adlandırılmıştır. Önerilen modelle karşılaştırma için iyi bilinen AlexNet, VggNet-s, VggNet-16, VggNet-19, GoogleNet ve ResNet modelleri kullanılmıştır. DR teşhis doğruluğunu analizi için Kaggle veri kümesi kullanılmıştır. Deneysel sonuçlar, önerilen RUnet-PCA modelinin %98,44 tanı doğruluğuna ulaştığını ve diğer tanı yöntemlerine kıyasla son derece sağlam ve umut verici olduğunu göstermektedir.
Deep learning is one of the most rapidly growing fields in computer and data science in the past few years. It has been widely used for feature extraction and recognition in various applications. Recent advances in deep learning have made a big leap to identify, classify, and quantify patterns in medical images. In that way deep learning is rapidly proving to be the state-of-the-art foundation which achieving enhanced performances in various medical applications. In this thesis, two basic studies were carried out on tissue segmentation and computer-aided disease diagnosis. The first work proposes an incoming Deep Convolutional Neural Network (DCNN) architecture for segmenting retinal blood vessels automatically from fundus images. Automatic segmentation plays a fundamental role in computer-aided diagnosis of retinal diseases. It is of considerable importance in the diagnosis of eye diseases and other systemic diseases that give rise to noticeable pathological symptoms. Retinal blood vessel segmentation is challenging because of the excessive changes in the morphology of the vessels on a noisy background. Previous deep learning-based supervised techniques suffer from the insufficient use of low-level features which is advantageous in semantic segmentation tasks. The proposed architecture takes advantage of both high-level features and low-level features to segment retinal blood vessels. The major contribution of the proposed architecture focuses on two important points. The first, in its introducing of extremely modularized network architecture of aggregated residual connections. The second, is to improve the utilization of computing resources within the network. This is accomplished through a skillfully crafted design which permits for increased depth and width of the network while maintaining the stability of its computational cost. Experimental results prove the effectiveness of using aggregated residual connections in segmenting retinal vessels more accurately and clearly. Compared to the best existing technigues, the proposed method outperformed other existing methods in different considerations. It comprised less false positives at fine vessels, and embraced more clear boundary lines with sufficient details like the experts manual segmentation. Diabetic Retinopathy (DR) is a disease of the retina, which drives over time to vision problems such retinal detachment, vitreous hemorrhage, glaucoma, and in worse cases leads to blindness, which can initially be avoided by recurrent DR-screening. Early diagnosis will lead to more dominance of the disease, whereas doing retinal examinations on all diabetic patients is a need that cannot be fulfilled. Diabetic retinopathy causes progressive damage to the blood vessels in the retina to the extent that it leaves traces and lesions in the tissues of the retina. These lesions back in the form of edges and when processing retinal images, we aim to accentuate these edges to enable better diagnosis of diabetic retinopathy symptoms. The second work proposes a new strategy that imports the strength of Convolutional Neural Networks (CNNs) to the diagnosis of DR. A new CNN architecture with residual connections is used, which outperformed in diagnosing DR. Coupled with utilizing Principal Component Analysis (PCA) to improve the diagnostic accuracy. The proposed model exploiting Edge-preserving Guided İmage Filtering (E-GIF) that carries out as a contrast enhancement technique, and besides to smoothing low gradient areas, it also protrudes strong edges. The proposed model is named with "RUnet-PCA: Residual U-net Deep CNN with Principal Component Analysis". The well-known AlexNet, VggNet-s, VggNet-16, VggNet-19, GoogleNet, and ResNet models were adopted for comparison with the proposed model. Publicly available Kaggle dataset was employed for training to exploring the DR diagnosis accuracy. Experimental results prove that the proposed RUnet-PCA model accomplished a diagnosis accuracy of 98.44% and it was extremely robust and promising in comparison to other diagnosis techniques.