Tez No İndirme Tez Künye Durumu
338357
Machine learning methods for using network based information in microRNA target prediction / MicroRNA hedef tahminlerinde ağ tabanlı bilgilerin kullanılması için makine öğrenim yöntemleri
Yazar:MERTER SUALP
Danışman: DOÇ. DR. TOLGA CAN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyomühendislik = Bioengineering
Dizin:Oylama = Voting ; Sınıflandırma = Classification ; Öğrenen durum makineleri = Learning automata
Onaylandı
Doktora
İngilizce
2013
91 s.
Hayvan genlerindeki microRNA (miRNA) hedeflerinin berimsel olarak tanımlanması, miRNA ile hedefi arasındaki kusurlu eşleşmeler sebebiyle zorlu bir problemdir. Yalnızca sıralamaya dayalı teknikler, normalde varolmayan bir çok pozitif etkileşim üretmeye meyillidirler. Bundan ötürü, yüksek pozitif hata oranını azaltmaya yönelik olarak, ek genetik bilgileri, yapısal özellikleri, ve evrimsel muhafaza kurallarını bir araya getiren birleştirici yöntemler oluşturulmaktadır. Biz, olası miRNA hedeflerinin protein-protein etkileşim (PPI) ağlarındaki bağlamlarının, berimsel miRNA hedef tahmini yapan algoritmalarda ilave bir filtre olarak kullanılabileceğini öne sürmekteyiz. Ağ bağlamı göstergesi olarak, insan PPI ağı üzerinde birden fazla kuramsal grafik ölçüsü hesapladık. Deneysel olarak ispatlanmış düşük ve yüksek çıktılı insan miRNA hedef veri kümeleri kullanarak, bağlam ölçülerinin bireysel ve birleştirilmiş performanslarını, popüler bir miRNA hedef tahmin aracı olan TargetScan'in hassasiyetinin artısı üzerinden değerlendirdik. Bu değerlendirmede sınıflandırma algoritmaları kullandık. Egitim örnekleri olarak yalnızca miRNA hedefleri bulunduğundan, problem Tek Sınıflı Sınıflandırma (OCC) problemi haline geldi. DiVo adından, basit mesafe ölçülerine ve oylamaya dayalı, özgün bir OCC algoritması geliştirdik. Son teknoloji yöntemlerle yaptığımız karşılaştırmalı analizler gösterdi ki, DiVo daha iyi sınıflandırma performansına ulaşmaktadır. Nihai sonuçlarımız, PPI ağlarındaki hedef gen ürünlerinin topolojik özelliklerinin, hatalı pozitif miRNA hedef genlerinin elenmesinde değerli birer bilgi kaynağı olduğunu belirtmektedir. Bir takım miRNA hedefleri için, ağ bağlamının, tahmin aracı tarafından sağlanan sıralama bazlı skora göre, hedef olup olmamayla daha ilintili olduğunu göstermiş bulunmaktayız.
Computational microRNA (miRNA) target identification in animal genomes is a challenging problem due to the imperfect pairing of the miRNA with the target site. Techniques based on sequence alone are prone to produce many false positive interactions. Therefore, integrative techniques have been developed to utilize additional genomic, structural features, and evolutionary conservation information for reducing the high false positive rate. We propose that the context of a putative miRNA target in a protein-protein interaction (PPI) network can be used as an additional filter in a computational miRNA target prediction algorithm. We compute several graph theoretic measures on human PPI network as indicators of network context. We assess the performance of individual and combined contextual measures in increasing the precision of a popular miRNA target prediction tool, TargetScan, using low throughput and high throughput datasets of experimentally verified human miRNA targets. We used classification algorithms for that assessment. Since there exists only miRNA targets as training samples, this problem becomes a One Class Classification (OCC) problem. We devised a novel OCC method, DiVo, based on simple distance metrics and voting. Comparative analysis with the state of the art methods show that, DiVo attains better classification performance. Our eventual results indicate that topological properties of target gene products in PPI networks are valuable sources of information for filtering out false positive miRNA target genes. We show that, for targets of a number of miRNAs, network context correlates better with being a target compared to a sequence based score provided by the prediction tool.