Tez No İndirme Tez Künye Durumu
676563
Yüksek çözünürlüklü erime eğrilerinin sınıflandırılması için derin öğrenme tabanlı yöntemlerin geliştirilmesi / Developing deep learning methods to classify high resolution melting curves
Yazar:FATMA ÖZGE ÖZKÖK
Danışman: DOÇ. DR. METE ÇELİK
Yer Bilgisi: Erciyes Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
123 s.
Yüksek çözünürlüklü erime (HRM) eğrisi analizi, gerçek zamanlı polimeraz zincir reaksiyonu (PCR) sonuçlarını analiz etmek için etkili, güvenilir ve hızlı bir tekniktir. Eğriler DNA dizisinin uzunluğunu, sırasını ve guanin/sitozin oranını temsil ettiği için DNA analizinde sıklıkla kullanılmaktadır. Literatürde, bu eğrilerin sınıflandırılması genellikle görsel inceleme yoluyla yapılmaktadır ve sınırlı sayıda sayısal analize dayanan yöntem kullanılmıştır. Ancak, türlerin örneklerinin ve yakından ilişkili türlerin sayısı arttıkça, HRM eğrilerinin sınıflandırılması zorlaşmaktadır. Bu nedenle, bu zorlukları çözmek için yeni teknikler gerekmektedir. Bu tezde, HRM verilerinin sınıflandırma doğruluğunu iyileştirmek için derin öğrenme tabanlı üç yeni yöntem önerilmiştir. İlk yöntem, yineleme haritaları (YH) kullanılarak oluşturulan HRM verilerinin görüntü temsilini kullanan YH-ESA'dır. HRM verileri yineleme haritasına dönüştürüldükten sonra önerilen evrişimli sinir ağları (ESA) tabanlı modeller ile sınıflandırılır. İkinci yöntem, hem HRM eğrilerini hem de HRM türev eğrilerini girdi olarak alan ESA-UKVH'dır. Önerilen ESA-UKVH modelinde özellik çıkarımı için ESA modeli ve sınıflandırma için ise UKVH modeli kullanılmıştır. Üçüncü yöntem, önceki iki yöntemin bir kombinasyonu olan YH-ESA-ÇY-UKVH'dir. Önerilen yöntem, HRM eğrilerinin ve HRM türev eğrilerinin yineleme haritalarını ESA-ÇY-UKVH kullanarak sınıflandırmıştır. Önerilen yöntemlerin performansı, doğruluk, makro ortalama F1, özgüllük, kesinlik ve geri çağırma sınıflandırma ölçütleri kullanılarak değerlendirilmiştir. Deneysel çalışmalarda önerilen yöntemler literatürdeki klasik yöntemlerden daha iyi performans göstermiştir.
High resolution melting curve analysis (HRM) is an efficient, reliable, and fast technique for analyzing real-time polymerase chain reaction results. Since the curves represent the length, sequence, and guanine/cytosine ratio of the DNA sequence, it is frequently used in DNA analysis. In the literature, the classification of the curves is usually done by visual inspection and a limited number of methods based on numerical analysis have been used. However, as the number and sample of species and the number of closely related species increase, classification of HRM curves becomes difficult. Therefore, new techniques must be developed to solve these difficulties. In this thesis, three new methods are proposed to improve the classification accuracy of HRM data. The first method is RP-CNN using image representation of HRM data generated using recurrence plots. After the images are transformed into recurrence plots, they are classified according to convolutional neural network-based models. The second method is CNN-LSTM, which takes both HRM curves and derivative curves as input. In the CNN-LSTM model, the CNN model was used for feature extraction, and the LSTM model was used for classification. The third method is RP-CNN-Bi-LSTM, which is a combination of the previous two methods. The method classifies recurrence plots of melting curves and derivative melting curves using CNN-Bi-LSTM. The performances of the proposed methods are evaluated using accuracy, macro mean of F1, specificity, precision, and recall classification criteria. In the experimental studies, the proposed methods outperform conventional methods in the literature.