Tez No İndirme Tez Künye Durumu
237619
Automated biological data acquisition and integration using machine learning techniques / Makine ögrenmesi teknikleri kullanılarak otomatikleşmiş biyolojik veri kaynaşım ve kazancı
Yazar:LEVENT ÇARKACIOĞLU
Danışman: PROF. DR. VOLKAN ATALAY
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Biyoinformatik = Bioinformatics ; Gen sıklığı = Gene frequency ; Gen teknolojisi = Gene technology ; Kümeleme teknikleri = Cluster technics
Onaylandı
Doktora
İngilizce
2009
117 s.
İlk genom düzenleme projelerinden bu yana teknoloji, moleküler biyoloji ve büyük ölçekli transkriptom analizindeki gelişmeler çok sayıda veri birikmesine sebep olmuştur. Bu veriler farklı platformlar tarafından sağlanıp farklı labrotuvarlardan geldiklerinden dolayıderlenmiş ve ayrıntılı bir analize ihtiyaç duyulmaktadır. Bu tezde farklı veri tabanları üzerinde makine ögrenmesi teknikleri kullanarak, otomatikleşmiş biyolojik veri kaynaşım ve kazancını inceledik. Bu tez kapsamında iki farklı madencilik çalısmasına odaklandık.Birinci çalısmada ev idaresi genlerinin ifade desenlerinin nitelendirilmesi üzerinde çalıstık.Ev idaresi olan ve ev idaresi olmayan genlere ait ölçüleri karsılastırmak için metodolojilertanımladık. Ikinci çalısmada ise, gen çiftleri için isbirligi kuralları bulmak amacı ile büyükölçekli ve çoklu hetorejen veri kümelerinde kolayca isleyebilen yeni bir çerçeveyi, bi-k-bikümeleme çerçevesini, önerdik. Her iki çalısmada elde ettigimiz sonuçlar mevcut literatürile alaka ve uyum gösterdi. Bunun yanı sıra, elde ettigimiz sonuçlar biyologlar tarafındandeneylendirilmeyi bekleyen bazı yeni kavramlar da sagladı.
Since the initial genome sequencing projects along with the recent advances on technology, molecular biology and large scale transcriptome analysis result in data accumulation at a large scale. These data have been provided in different platforms and come from different laboratories therefore, there is a need for compilation and comprehensive analysis. In this thesis, we addressed the automatization of biological data acquisition and integration from these non-uniform data using machine learning techniques. We focused on two different mining studies in the scope of this thesis. In the first study, we worked on characterizing expression patterns of housekeeping genes. We described methodologies to compare measures of housekeeping genes with non-housekeeping genes. In the second study, we proposed a novel framework, bi-k-bi clustering, for finding association rules of gene pairs that can easily operate on large scale and multiple heterogeneous data sets. Results in both studies showed consistency and relatedness with the available literature. Furthermore, our results provided some novel insights waiting to be experimented by the biologists.