Tez No İndirme Tez Künye Durumu
571574
Yapay zekâ tekniklerinin kullanımıyla protein etkileşimlerinin sekans bilgisine dayalı tahmini / Prediction of protein interactions by using artificial intelligence techniques based on protein sequence data
Yazar:YUNUS EMRE GÖKTEPE
Danışman: DOÇ. DR. HALİFE KODAZ
Yer Bilgisi: Konya Teknik Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2019
116 s.
Proteinler hücre içerisindeki tüm olaylarda önemli roller oynarlar ve biyolojik yapıların temelini oluştururlar. Görevlerini yerine getirirken proteinler diğer protein ve moleküllerle farklı yapı ve şekillerde iletişim kurarlar. Protein-protein etkileşimleri denilen bu yapılar tüm biyolojik süreçlerin yürütülmesinde görev alırlar. Bu sebeple etkileşimlerin belirlenmesi araştırmacıların yoğunlaştığı önemli bir çalışma konusudur. Proteinler arasında kurulan etkileşimlerin tespit edilmesi için farklı yöntemler kullanılmaktadır. Bu yöntemler temel olarak in-vivo, in-vitro ve in-silico olarak gruplandırılmaktadır. Etkileşimlerin deneysel olarak belirlenmesi laboratuvar ortamında yapılan yüksek hacimli çalışmalar olarak değerlendirilmektedir. Bu çalışmalar çok fazla zaman ve çaba gerektirmektedir. Ayrıca araştırmacılar bu tür çalışmaların yanlış pozitif ve yanlış negatif oranlarının da oldukça yüksek olduğunu vurgulamaktadırlar. Laboratuvar ortamında yapılan bu çalışmaları desteklemek ve onlara ön bilgi sunmak gibi amaçlarla hesapsal etkileşim tahmini yöntemleri yoğun olarak çalışılmaktadır. Bu çalışmada proteinler arasında meydana gelen etkileşimlerin tahmini için hesapsal metotlar önerilmiştir. Bu metotlarda eldeki veri tabanlarından alınan protein sekans bilgilerini kullanan özellik çıkarım adımları üretilmiştir. Bu şekilde önerilen metotlar tüm protein veri kümelerine uygulanabilmekte olup proteinler hakkında farklı özelliklerin bilinmesine ihtiyaç duyan hesapsal metotlardan farklılık göstermektedir. Elde edilen özellik matrisleri kullanılarak destek vektör makinesi tabanlı bir sınıflandırma sistemi ile etkileşim tahmini yapılmaktadır. Önerilen sistemlerin performansları sık kullanılan değerlendirme ölçütleri ile test edilmiştir. Önceki çalışmalarla karşılaştırılarak önerilen sistemlerin farklı veri kümeleri üzerinde elde ettiği sonuçların başarılı ve kabul edilebilir oldukları görülmüştür.
Proteins play important roles in all events in the cell and form the basis of biological structures. While carrying out their tasks, proteins communicate with other proteins and molecules in different structures and forms. These structures, called protein-protein interactions, are involved in carrying out all biological processes. Therefore, determining the interactions is an important subject of research. Different methods are used to detect interactions between proteins. These methods are mainly divided into 3 groups as in-vivo, in-vitro and in-silico. Experimental determination of the interactions is evaluated as high throughput studies made in laboratory. These studies require a lot of time and effort. In addition, researchers emphasize that the false positive and false negative rates of such studies are quite high. In order to support these studies conducted in the laboratory environment and to provide them with preliminary information, computational interaction prediction methods are studied extensively. In this study, computational methods have been proposed for the estimation of interactions between proteins. In these methods, feature extraction steps using the protein sequence information from the present databases were generated. The models proposed in this way can be applied to all protein datasets and differ from computational methods that need to know different and complex properties about proteins. By using the obtained feature matrices, interaction prediction was made with a support vector machine based classification system. The performances of the proposed systems were tested with commonly used evaluation criteria. Compared to previous studies, it was seen that the results of the proposed systems on different datasets were successful and acceptable.