Tez No İndirme Tez Künye Durumu
521274
Enhancing machine learning algorithms in healthcare with electronic stethoscope / Tıpta elektronik stetoskop kullanarak makine öğrenmesi algoritmaları geliştirilmesi
Yazar:MURAT AYKANAT
Danışman: DR. ÖĞR. ÜYESİ ÖZKAN KILIÇ
Yer Bilgisi: Ankara Yıldırım Beyazıt Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2018
218 s.
Bu çalışmada, 1.630 denekten elektronik stetoskop ile kaydedilen 17.930 ses ve metin verisinden oluşan bir veri kümesinde, konvolüsyonel sinir ağları (CNN), destek vektör makineleri (SVM), k en yakın komşuluk (k-NN) ve Gaussian Bayes (GB) algoritmaları kullanılarak, solunum seslerinin ve akciğer hastalıklarının sınıflandırılması amaçlanmıştır. Solunum seslerini sınıflandırmak için; Mel frekanslı kepstral katsayısı (MFCC) özellikleri ile SVM, k-NN, GB ve ayrıca 28x28 ve 600x600 spektrogram görüntüleri ile CNN kullandık. Solunum seslerini sınıflandırmak için 4 veri kümesi hazırladık: (1) sağlıklı ve patolojik ses; (2) ral, ronküs ve normal ses; (3) tekil solunum sesi tipi; ve (4) tüm ses türlerini içeren sınıflandırma. Kesinlik sonuçları yüzde olarak sırasıyla; (1) CNN 86 ve 95, SVM 86, k-NN 85, GB 58, (2) CNN 80 ve 93, SVM 80, k-NN 79, GB 42, (3) CNN 76 ve 85, SVM 75, k-NN 76, GB 22, (4) CNN 62 ve 77, SVM 62, k-NN 61, GB 15 olarak bulundu. Hastaları hastalıklarına göre sınıflandırmak için 6 veri kümesinde SVM, k-NN ve GB algoritmaları çalıştırıldı; (1) metin verisine göre hasta veya sağlıklı, (2) ses verisindeki MFCC özelliklerine göre hasta veya sağlıklı, (3) ses verisindeki MFCC özellikleri ve metin verileri ile hasta veya sağlıklı, (4) metin verilerine göre 12 hastalık, (5) ses verisindeki MFCC özelliklerine göre 12 hastalık, (6) ses verisindeki MFCC özellikleri ve metin verileri ile 12 hastalık. Kesinlik sonuçları yüzde olarak sırasıyla SVM için 75, 88, 64, 73, 63, 70; k-NN için 95, 92, 92, 67, 64, 66; GB için 98, 91, 97, 58, 48, 58 olarak bulundu. Geleneksel ve elektronik stetoskobu karşılaştırmak için 3 uzman doktor, 100 sesi değerlendirdi. Kappa istatistik yöntemi ile 2. ile 3. doktor arasında iyi düzeyde, 1. ile 3. ve 1. ile 2. doktor arasında ise ortalama düzeyde tutarlılık gözlemlendi.
In this study, our aim is to classify respiratory sounds and diseases via audio and text data recorded by an electronic stethoscope using convolutional neural networks (CNNs), support vector machines (SVMs), k-nearest neigbor (k-NN) and Gaussian Bayes (GB) algorithms on a dataset that contains 17,930 lung sounds that were recorded from 1630 subjects. For classifying respiratory sounds, we employed; SVM, k-NN and GB with mel frequency cepstral coefficient (MFCC) features and CNN with 28x28 and 600x600 spectrogram images. We prepared 4 datasets to classify respiratory audio into: (1) healthy versus pathological; (2) rale, rhonchus, and normal sound; (3) singular respiratory sound type; and (4) audio type with all sound types classification. Accuracy results in percent were; (1) CNN 86 and 95, SVM 86, k-NN 85, GB 58, (2) CNN 80 and 93, SVM 80, k-NN 79, GB 42, (3) CNN 76 and 85, SVM 75, k-NN 76, GB 22 and (4) CNN 62 and 77, SVM 62, k-NN 61, GB 15 respectively. For classifying respiratory diseases, SVM, k-NN and GB algorithms were run on 6 datasets to classify patients into; (1) ill or healthy with text data, (2) ill or healthy with audio MFCC features, (3) ill or healthy with the text data and audio MFCC features, (4) 12 diseases with text data, (5) for 12 disease with audio MFCC features, (6) for 12 disease with the text data and audio MFCC features. Accuracy results in percent for SVM were 75, 88, 64, 73, 63, 70; for k-NN 95, 92, 92, 67, 64, 66; for GB 98, 91, 97, 58, 48, 58 respectively. To compare the electronic and traditional stethoscope, 3 chest physicians assessed 100 audio clips. We observed; good level consistency between physicians 2 and 3, average level consistency between physicians 1, 3 and 1, 2 via kappa statistic method.