Bilimsel çalışmalarda 200'den fazla kanser türünün insanları etkilediği ifade edilmektedir. Söz konusu bilinen kanser türleri arasında en ölümcül olanı akciğer kanseridir. Akciğer kanserini, semptom ve bulguların takip edilmesiyle teşhis ve tedavi etmek oldukça önemlidir. Ancak hastalığın hangi aşamada olduğuna, örneğin hastalığın başka organlara da yayılma durumuna bağlı olarak, semptomlarda farklılıklar görülebilir. Fakat hastalığa ilişkin herhangi bir semptom görülmediğinde, elde edilmiş bir bulgu olmadığı için hekimler tarafından yapılan fiziksel muayene esnasında hastalık gözden kaçırılabilmektedir. Dolayısıyla bu gibi durumların yaşanmaması için hastalığın tanısında Manyetik Rezonans Görüntüleme (MR), Bilgisayarlı Tomografi (BT) vb. tekniklerin kullanılmasıyla akciğer bölgesinin detaylı görüntülenmesi çok önemlidir.
Bu yöntemler sayesinde her yıl yüz binlerce canın kurtarılabilmesi amacıyla kanser hastalığı erken safhada saptanabilmektedir. Fakat söz konusu bu yüz binlerce hastaya ait taramaların analiz edilmesi radyologlar açısından zaman ve yoğun emek gerektiren ciddi bir iş yüküdür. Çok sayıda radyoloğun bu ciddi iş yükünün neden olduğu gözlemci yorgunluğu sebebiyle performansları da olumsuz şekilde etkilenmektedir. Dolayısıyla BT taramalarının daha verimli şekilde okunarak saptanması ve değerlendirilmesi amacıyla bir sisteme gereksinim duyulmaktadır.
Bu tez kapsamında bu gereksinimden hareketle; %80'i eğitim, %10'u test ve geriye kalan %10'u ise doğrulama için kullanılmak üzere Kanser Arşiv Merkezi (KAM) merkezinden alınan 639598 BT görüntüsü üzerinde Derin Öğrenme (DÖ) ve Öğrenme Aktarımı (ÖA) yöntemlerine dayalı işlemler yapılarak 4K-ESA ve BNN 4K-ESA modelleri geliştirilmiştir. Geliştirilen 4K-ESA modelinin geleneksel modellerden (AlexNet, MobileNet vb.) önemli farkı; 4 katmanlı olması sebebiyle bilgisayara fazla yük getirmemesi ve seyreltme tekniği yerine DropWeights tekniğini kullanmasıdır. Çünkü geleneksel modeller çok katmanlı ve çok parametreli yapılara sahip olmaları sebebiyle yanlış hata oranlıları oldukça yüksek olan modellerdir. Bu tez çalışması kapsamında geliştirilen 4K-ESA modeli geleneksel yöntemlerin (ImageNet gibi) aksine, BT görüntülerini işlemeye uygun ince ayarlar yapılarak hazırlanması ve fazla yük ve parametrelerden arındırılmış olması sebebiyle sadece bir konuya yönelerek veriyi 00:03:21sn gibi bir sürede işleyebilmektedir. 4K-ESA üzerine Uncertainty of Quantification (UQ) eklenmesiyle oluşturulan Bayes Ağları (BNN) 4K-ESA modeli sayesinde ise 4K-ESA modelinden elde edilen sonuçlar güven ölçeğine tabi tutulmaktadır.
Geliştirilen modeller sırasıyla; ön işleme, sınıflandırma, belirsizlik ölçeğinin uygulanması ve karar verme olmak üzere temel olarak dört adımdan oluşmaktadır. Ön işleme adımından elde edilen sonuçlara göre; verilerin mini-paket şeklinde verilmesinin bütün modellerin performanslarını olumlu yönde etkilediği kanıtlanmıştır. Sınıflandırma adımından elde edilen sonuçlar sayesinde; modellere girdi olarak verilen BT görüntülerinin kanserli olup olmadığı, kanserli ise bunun iyi mi yoksa kötü huylu mu oldukları belirlenmiştir. Belirsizlik ölçeğinin uygulanması adımından elde edilen sonuçlarla; çalıştırılan modeller arasında en iyi sonuç veren modelin, parametre sayıları geleneksel modellere göre daha düşük olan 4K-ESA modeli olduğu görülmüştür. Karar verme aşamasından elde edilen sonuçlara göre ise; UQ eklenmeden yapılan deneyler neticesinde 4K-ESA modellinin Matthews correlation coefficient (MCC) değeri 0.988, F2 skoru 0.816, doğruluk oranı 0.971, özgüllük 0.825, hassasiyet 0.974 olarak hesaplanmıştır. F1 skoru 0.962; UQ eklenerek yapılan deneyler neticesinde de BNN 4K-ESA MC modellinin MCC değeri 0.98, F2 skoru 0.88, doğruluk oranı 0.98, özgüllük 0.94, hassasiyet 0.97 ve F1 skoru 0,96 olarak bulunmuştur. Ayrıca çalışmadan elde edilen bulgulara dayalı olarak; belirsizlik Tahmini Entropisi ve Uyuşmazlık Yoluyla Bayesian Aktif Öğrenme (UYBNN) oranları da %90 olarak saptanmıştır. Böylece akciğer hastalıklarıyla ilgili BT görüntülerinde hastalığın, kanser olup olmadığı kanser ise hangi tür kanser olduğunun tespit edilebilmesi açısından geliştirilen modellerin geleneksel modellere göre %98'e kadar daha doğru sonuçlar verdiği görülmüştür.
|
It is stated that more than 200 known types of cancer affect humans. Among the known types of cancer, lung cancer is the most deadly one. It is very important to diagnose and treat lung cancer by following the symptoms and signs. However, depending on the stage of the disease, for example, if the disease has spread to other organs, there may be differences in symptoms. However, when there are no symptoms related to the disease, the disease can be overlooked during the physical examination by physicians since there is no finding obtained. Therefore, in order to avoid such situations, Magnetic Resonance Imaging (MRI), CT, etc. Detailed imaging of the lung area with the use of techniques is very important.
Thanks to these methods, cancer disease can be detected at an early stage in order to save hundreds of thousands of lives every year. However, analyzing the scans of these hundreds of thousands of patients is a serious workload that requires time and effort for radiologists. The performances of many radiologists are also negatively affected due to the observer fatigue caused by this serious workload that requires time and effort. Therefore, a system is needed to read, detect and evaluate CT scans more efficiently.
Based on this requirement within the scope of the study; 4K-ESA and BNN 4K-ESA models have been developed by performing operations based on DÖ and ÖA methods on 639598 CT images taken from the KAM center to be used for 80% training, 10% testing, and the remaining 10% for verification. The primary difference of the 4K-ESA model developed from traditional models (AlexNet, MobileNet, etc.); Since it is 4 layers, it does not cause too much load on the computer and uses the DropWeights technique instead of the dilution technique. Because traditional models have multi-layer and multi-parameter structures, they are models with very high false error rates. In addition, the developed 4K-ESA model, unlike traditional methods (such as ImageNet), can process the data in a time like 00:03:21 by focusing on only one subject, as it is prepared by fine-tuning suitable for processing CT images and is free from excess load and parameters. Thanks to the BNN 4K-ESA model created by adding UQ on 4K-ESA, the results obtained from the 4K-ESA model are subjected to a confidence scale.
The models developed are; It basically consists of four steps: preprocessing, classification, application of the uncertainty scale, and decision making. According to the results obtained from the pre-processing step; It has been proved that giving the data as mini-packets positively affects the performance of all models. Thanks to the results obtained from the classification step; It was determined whether the CT images, which were given as input to the models, were cancerous, and if they were cancerous, whether they were benign or malignant. With the results obtained from the application of the uncertainty scale; It has been observed that the best model among the operated models is the 4K-ESA model with lower parameter numbers compared to conventional models. According to the results obtained from the decision-making phase; As a result of the experiments without adding UQ, the MCC value of the 4K-ESA model was 0.988, the F2 score was 0.816, the accuracy ratio was 0.971, the specificity was 0.825, the sensitivity was 0.974 and the F1 score was 0.962; As a result of the experiments performed by adding UQ, the MCC value of the BNN 4K-ESA MC model was 0.98, the F2 score was 0.88, the accuracy ratio was 0.98, the specificity was 0.94, the sensitivity was 0.97 and the F1 score was 0.96. In addition, as a result of the findings obtained from the study; Uncertainty Estimated Entropy and UYBNN ratios were also found to be 90%. Thus, it has been observed that the models developed in terms of detecting whether the disease is cancer or what type of cancer it is in CT images related to lung diseases give more accurate results than traditional models. |