Tez No İndirme Tez Künye Durumu
543086
İyileştirilmiş klonal seçim algoritması ile hemoglobin proteini ikincil yapı tahmini / Hemoglobin protein secondary structure prediction by using improved clonal selection algorithm
Yazar:BURCU ÇARKLI YAVUZ
Danışman: DOÇ. DR. NİLÜFER YURTAY
Yer Bilgisi: Sakarya Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2018
80 s.
Protein ikincil yapının biliniyor olması proteinin işlevinin belirlenmesinde, birçok hastalığın tedavi edilmesinde ve ilaç tasarımında çok önemli avantajlar sağlamaktadır. Laboratuvar ortamında ikincil yapı tespiti hem maliyetli hem de zorlu bir süreçtir. Bu nedenle protein ikincil yapı tahmini, uzun yıllardır biyoinformatik ve hesaplamalı biyolojinin önemli bir çalışma alanıdır. İki aşamalı olan bu çalışmada doğadan ilham alan yöntemler kullanılarak protein ikincil yapı tahminine katkı sağlanması amaçlanmıştır. Birinci aşamada veri, canlı bağışıklık sisteminden esinlenerek modellenen Klonal Seçim Algoritması (KSA) ile eğitilmiştir. KSA'da geleneksel yöntemden farklı olarak, her bir antijene en benzer antikor seçimi yerine, toplam benzerlikleri dikkate alınarak seçim yapılmıştır. İkinci aşamada farklı yöntemler kullanılarak sınıflandırma yapılmıştır. Biyolojik sinir sisteminden esinlenerek modellenen yöntemlerden biri olan çok katmanlı algılayıcı (ÇKA), mesafeye dayalı k en yakın komşu algoritması (kNN), karar ağaçları temelli ID3 ve istatistiksel hesaplara dayalı Naive Bayes (NB) yöntemleri sınıflandırma için tercih edilmiştir. Alınan sonuçlar KSA'da önerilen yeni antikor seçimi yaklaşımının geleneksel KSA modeline göre daha iyi sonuçlar verdiğini göstermiştir. Geliştirilen KSA modeli ile hemoglobin veri seti eğitilmiş ve eğitilen protein verisinin ikincil yapı tahmini farklı sınıflandırıcı yöntemleri ile yapılmıştır. Çalışmanın sonunda KSA ile eğitilen verinin sınıflandırma başarısının eğitilmeyen veriye göre daha yüksek olduğu görülmüştür.
The protein secondary structure information provides very important advantages in determining the function of a protein, treating numerous diseases and drug design. Determining the secondary structure in the laboratory environment is both costly and challenging. Therefore, the prediction of protein secondary structure has been an important study field of bioinformatics and computational biology for many years. The aim of the present two-phased study is to provide a contribution to the prediction of protein secondary structure using the nature-inspired methods. The data in the first phase were trained with Clonal Selection Algorithm (CSA) which was modeled by being inspired by the live immune system. CSA was improved by using the total similarity for the selection instead of the traditional way of the most similar antibody for an antigen. Using different methods classification is realized in the second phase. The classification was then performed with Multilayer Perceptron (MLP) which is modeled by being inspired by the biological nervous system, k nearest neighbor (kNN) algorithm which is based on distance, decision tree based ID3 method and Naive Bayes (NB) method based on statistical calculations. The results obtained indicated that the proposed antibody selection method performed better than the traditional method. The hemoglobin data set was trained by the new CSA model and the secondary structure prediction of the trained set was realized by different classification methods. In conclusion it was found out that the classification success of the trained data set was better than the success of the untrained data set.