Tez No İndirme Tez Künye Durumu
318908
Efficient partially observable markov decision process based formulation of gene regulatory network control problem / Gen ağlarının kısmi gözlemlenebilir markov karar süreçleri ile modellenerek etkin olarak kontrolü
Yazar:UTKU ERDOĞDU
Danışman: PROF. DR. FARUK POLAT ; PROF. DR. REDA ALHAJJ
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2012
149 s.
Genlerin çalışma prensiplerini inceleme gereksinimi gen düzenleyici ağların (GDA) modellenmesi ve kontrolü üzerine bilimsel çalışmalar yapılmasına yol açmıştır. GDA'ları modellemek için değişik yaklaşımlar mevcuttur ve bu yaklaşımların çoğu genler arasındaki ilişkileri matematiksel modeller vasıtasıyla modellemektedir. Problemi daha zorlaştırmasına rağmen, GDA kontrol problemlerinindaha doğal ve gerçekçi çözülebilmesi için kısmi gözlemlenebilirliğin önerilmesi gerektiğini savunuyoruz.Kısmi gözlemlenebilirlik bu problemin temel bir bileşeni olmasına rağmen çoğunlukla gözardı edilmiş ve problemin çözümünde GDA'nın tüm durumlarının mükemmel olarak bilinebileceği varsayımı yapılmıştır, yani problem tam gözlemlenebilir kabul edilmiştir. Bir yandan da literatürdeki kısmi gözlemlenebilirliği dikkate alan yöntemler sınırlı adımdan oluşan bir problem tanımı ile GDA kontrol problemini çözen algoritmalarüretmeye çalışmaktadır. Bu çalışmada problemin kısmi gözlemlenebilir bir kurgu ile tanımlanması üzerinde çalışılmakta ve Kısmi Gözlemlenebilir Markov Karar Süreçleri (POMDP) bu kurguda kullanılmaktadır. Bu çalışmada problemin sonsuz adımdan oluşan bir hali problem POMDP modeline uygun bir şekilde tanımlanarak sunulmaktadır. POMDP problemlerinin boyutlardan kaynaklanan problemler yaşamasından dolayı POMDP problemlerin birbirinden bağımsız parçalarını ayırıp problemi otomatik olarak parçalayan ve bu parçaları çözerek problemin çözümünü bulan bir çözüm yaklaşımı da bu çalışmada sunulmuştur. Bu çalışmada ayrıca POMDP kontrol problemine girdi olarak verilen gen ifade verisini zenginleştirmek için de bir metot sunulmaktadır. Gen ifade verilerinde binlerce gen olmasına rağmen genelde onlarca, nadir olarak da yüz mertebesinde örneklem bulunduğundan böyle bir metot gerekli ve faydalıdır. Sunulan metot varolan veri kümesini kullanarak birden fazla model oluşturur; her modelden yeni veri noktaları üretikten sonra üretilen veri noktalarını veri kümesinin uygunluğunu, farklılığını ve genişliğini ölçen metrikler yardımıyla filtreyerek kullanıma hazır bir veri kümesi oluşturur.
The need to analyze and closely study the gene related mechanisms motivated the research on the modeling and control of gene regulatory networks (GRN). Different approaches exist to model GRNs; they are mostly simulated as mathematical models that represent relationships between genes. Though it turns into a more challenging problem, we argue that partial observability would be a more natural and realistic method for handling the control of GRNs. Partial observability is a fundamental aspect of the problem; it is mostly ignored and substituted by the assumption that states of GRN are known precisely, prescribed as full observability. On the other hand, current works addressing partially observability focus on formulating algorithms for the finite horizonGRN control problem. So, in this work we explore the feasibility of realizing the problem in a partially observable setting, mainly with Partially Observable Markov Decision Processes (POMDP). We proposed a POMDP formulation for the infinite horizon version of the problem. Knowing the fact that POMDP problems suffer from the curse of dimensionality, we also proposed a POMDP solution method that automatically decomposes the problem by isolating different unrelated parts of the problem, and then solves the reduced subproblems. We also proposed a method to enrich gene expression data sets given as input to POMDP control task, because in available data sets there are thousands of genes but only tens or rarely hundreds of samples. The method is based on the idea of generating more than one model using the available data sets, and then sampling data from each of the models and finally filtering the generated samples with the help of metrics that measure compatibility, diversity and coverage of the newly generated samples.