Tez No İndirme Tez Künye Durumu
178317
Computational prediction of disordered regions in proteins / Proteindeki düzensiz bölgelerin hesapsal tahmini
Yazar:İREM ERSÖZ KAYA
Danışman: YRD. DOÇ. DR. TURGAY İBRİKÇİ
Yer Bilgisi: Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik ve Elektronik Mühendisliği Bölümü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2008
87 s.
Proteinler hayati önem taşıyan görevleri nedeni ile canlı organizmaların en önemli molekülleridir. Bu bakımdan, bir organizmanın yaşam sürecini anlayabilmek için ilk olarak yapı- işlev ilişkisinin bilinmesi gerekmektedir. Yapılan çalışmalar ile birçok proteinin 3B yapısına sahip olmadıkları halde bir veya birden fazla fonksiyona sahip oldukları bulunmuştur. Bu proteinlerin önemli fonksiyonlarda ve bazı hastalıklarda anahtar rol oynadıklarının bulunmasıyla bu proteinlerin tanımlanması, protein yapısının tahmini ve fonksiyonun belirlenmesi için talep gören bir işlem haline gelmiştir. Bu nedenle, düzensizliğin başarılı tahmini üzerine birçok çalışma yapılmıştır. Bu düzensizliğin tahmin edilmesi problemi ile başa çıkabilmek için, büyük veri setlerindeki karmaşık ilişkileri ve korelâsyonu ortaya çıkarmadaki yeteneği nedeniyle çoğunlukla makine öğrenmesi teknikleri kullanılmaktadır.Bu çalışmada, Sınır Vektör Belirleme ve Genişletilmiş Adaptasyon (SVBGA) metodu düzensiz bölgelerin tahmini için başarılı bir alternatif sınıflandırıcı olarak geliştirilmiştir. Metodun başarısının onaylanması için üç hesapsal öğrenme tekniği ve on bir mevcut düzensiz bölge tahmin aracı karşılaştırmada kullanılmıştır. Tahminlerin gerçekleştirilebilmesi için öncelikle, birçok yapısal özellik kullanılarak yeni bir veri hazırlanmıştır. Daha sonra, 5 katlı çapraz değerlendirme ile eğitimler gerçekleştirilmiştir. Verilen öğrenme yöntemleri ile karşılaştırıldığında, metot sınıflandırmada en başarılı sonucu vermiştir. Burada, SVBGA diğerlerine göre daha başarılı ve daha hızlı öğrenme sağlamıştır. Ayrıca, verilen mevcut tahmin araçları ile yapılan diğer karşılaştırma, metodun oldukça iyi bir tahmin performansı elde ettiğini göstermiştir. Sonuç olarak, yeni metodun düzensiz ve düzenli bölgelerin tahmini üzerine dikkate değer bir katkı sağladığı gösterilmiştir.
Proteins are one of the most important parts of an organism because of their vital tasks. Hence, it is necessary to know the structure of a protein since it is closely related to its biological function. Studies on structural genomics indicate that numerous protein segments remain unfolded in their native states. Currently these proteins are generally referred to as ?natively unfolded? or ?intrinsically disordered?. Upon noticing that many of these proteins play key role in vital functions and also in some diseases, identification of the disordered regions has became a demanding process for structure prediction and functional characterization of proteins. Therefore, many studies have been motivated on accurate prediction of disorder. Mostly, machine learning techniques have been used for dealing with the prediction problem of disorder due to capability of extracting the complex relationships and correlations hidden in large data sets.In the study, a novel method, named Border Vector Detection and Extended Adaptation (BVDEA) was developed for predicting disorder as an alternative accurate classifier. For attesting the performance of the method, three computational learning techniques and eleven specific tools were used for comparison. In order to perform the predictions, firstly the collected data was prepared by choosing a variety of structural features for proteins. Then, training was executed based on the data by 5-fold cross validation. When compared with the three learning methods of GRNN, LVQ and BVDA, the proposed method gives the best accuracy on classification. Here, BDVEA provides more fast and robust learning as compared to the others. Furthermore, comparison with the other existing disorder predictors demonstrates that the method achieves rather good prediction performance in finding disordered regions of proteins. As a conclusion, it has been shown that the new method provides a significant contribution on predicting disorder and order regions of proteins.