Tez No İndirme Tez Künye Durumu
238614
Induction and control of large scale gene regulatory networks / Büyük-ölçekli gen düzenleyici ağların modellenmesi ve kontrolü
Yazar:MEHMET TAN
Danışman: PROF. DR. FARUK POLAT ; PROF. DR. REDA ALHAJJ
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyoistatistik = Biostatistics
Dizin:Biyoinformatik = Bioinformatics ; Veri madenciliği = Data mining
Onaylandı
Doktora
İngilizce
2009
111 s.
Gen düzenleyici ağlar hücre içindeki etkileşimleri modellediğinden, yapılarını anlamak ve onları verimli bir şekilde kontrol edebilen mekanizmalar geliştirmek çok önemlidir. Bu tez, bu iki yönü ele almaktadır. İlk problemde, gen düzenleyici ağların yapısını öğrenmek için, çıktı kalitesini artırırken berimsel gereksinimleri azaltan, birden fazla biyolojik veri tipini birlikte kullanan ve yoğun düğümler için özel bir yöntem uygulayan yeni bir kısıt-tabanlı modelleme algoritması önerilmektedir. Kısıt-tabanlı yapı öğrenme algoritmaları, seyrek çizgeler için iyi performans gösterirler ve seyreklik de nadir görülen bir durum değildir. Bununla beraber, gen düzenleyici ağlar gibi bazı alanlarda, yoğun bölgeler içeren çizgelere rastlanabilir ve önerilen algoritma bu durumla başa çıkabilir. Algoritma, iyi bilinen bir yapı öğrenme algoritması olan PC algoritması tabanlıdır ve onu birden fazla yönde geliştirmektedir. Elimizde bir ağ olduğunda ise, ikinci problem karşımıza çıkacaktır; gen düzenleyici ağların, çeşitli uygulamalar için, temel mesele ölçeklenebilirlik olmak üzere kontrolü. Bir organizmada yüzlerce genin tek bir biyolojik aktiviteyi düzenlemede rol alması mümkündür ve Boolean modellerde bile bu, muazzam büyüklükte bir durum uzayına karşılık gelir. Bu tez, büyük-ölçekli ağlara kontrol planları bulmak için verimli yöntemler önermektedir. Bu tezde önerilen modelleme ve kontrol algoritmaları hem sentetik hem de gerçek veri kümelerinde test edilmiştir. Test sonuçları, önerilen yaklaşımların etkin ve verimli olduklarını göstermektedir.
Gene regulatory networks model the interactions within the cell and thus it is essential to understand their structure and to develop some control mechanisms that could effectively deal with them. This dissertation tackles these two aspects. To handle the first problem, a new constraint-based modeling algorithm is proposed that can both increase the quality of the output and decrease computational requirements for learning the structure of gene regulatory networks by integrating multiple biological data types and applying a special method for dense nodes in the network. Constraint-based structure learning algorithms generally perform well on sparse graphs and it is true that sparsity is not uncommon. However, some domains like gene regulatory networks are characterized by the possibility of having some dense regions in the underlying graph and the proposed algorithm is capable of dealing with this issue. The algorithm is based on a well-known structure learning algorithm called the PC algorithm, and extends it in multiple aspects. Once a network exists, we could address the second problem, namely control of the regulatory network for various applications where the curse of dimensionality is the main issue. It is possible that hundreds of genes may regulate on biological activity in an organism and this implies a huge state space even in the case of Boolean models. The thesis proposes effective methods to find control policies for large-scale networks. The modeling and control algorithms proposed in this dissertation have been evaluated on both synthetic and real data sets. The test results demonstrate the efficiency and effectiveness of the proposed approaches.