| Tez No |
İndirme |
Tez Künye |
Durumu |
| 305723
|
|
Mining microarray data for biologically important gene sets / Biyolojik önem taşıyan gen listelerinin bulunması için mikrodizi veri madenciliği
Yazar:GÜLBERAL KIRÇİÇEĞİ YOKSUL
Danışman: PROF. DR. MEHMET VOLKAN ATALAY
Yer Bilgisi: ORTA DOĞU TEKNİK ÜNİVERSİTESİ / FEN BİLİMLERİ ENSTİTÜSÜ / Bilgisayar Mühendisliği Bölümü
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Anahtar Kelime:Kümeleme = Clustering ; Mikrodizilim analizi = Microarray analysis
|
Onaylandı
Doktora
İngilizce
2012
193 s.
|
|
|
Mikrodizi teknolojisi ara¸stırmacıların aynı anda birçok gen ifade seviyesini ölçerekgenler arasındaki ilişkileri anlamalarını, yolakları bulmalarını ve genel olarak hastalıklar,hücre döngüsü gibi birçok biyolojik olayı anlayabilmelerini sağlamaktadır. Aynıanda büyük sayılarda deneyin yapılmasına olanak sağlamakla birlikte, bu büyük miktardamikrodizi verisini araştırmak ilgi çekici bir konudur. Veri hakkında öncedenfazla bilginin olmaması nedeni ile genellikle önce veriye bir bölümleme algoritmasıuygulandıktan sonra bulunan bölümler konu ile ilgili önemli genleri bulmak amacı ilearaştırmacılarca incelenir. Bu incelemeyi kolaylaştırmak için gereksiz genleri eleyerekbiyolojik olarak önemli genleri bulacak otomatik metotlar gereklidir. Bu tezde mevcutbölümleme algoritmalarını kullanan, Gen Ontolojisi ve etkileşim ağları olmak üzereiki ana biyolojik bilgi kaynağını birleştirerek mikrodizi verisindeki gereksiz bilgilerieleyen ve çıktı olarak sadece deneyle ilgili genleri içeren bir bölümleme veren genelbir metodoloji sunulmaktadır. Sunulan metodoloji birçok farklı veri üzerinde denenmiş veumut verici sonuçlar elde edilmiştir. Sonuçlar Gen Seti Zenginleştirme Metodu(GSEA) ile karşılaştırılmış ve metodoloji ile bulunan bölümlerin yüksek zenginleştirmeskorlarına sahip olduğu görülmüştür. Sonuçlar üzerinde yapılan detaylı incelemelerde debölümleme sonucunda bulunan genlerin büyük çoğunluğunun deney konusu olanbiyolojik süreç ile ilişkili olduğu tespit edilmiştir.
|
|
|
Microarray technology enables researchers to measure the expression levels of thousandsof genes simultaneously to understand relationships between genes, extractpathways, and in general understand a diverse amount of biological processes suchas diseases and cell cycles. While microarrays provide the great opportunity of revealinginformation about biological processes, it is a challenging task to mine the hugeamount of information contained in the microarray datasets. Generally, since an accuratemodel for the data is missing, first a clustering algorithm is applied and then theresulting clusters are examined manually to find genes that are related with the biologicalprocess under inspection. We need automated methods for this analysis whichcan be used to eliminate unrelated genes from data and mine for biologically importantgenes. Here, we introduce a general methodology which makes use of traditionalclustering algorithms and involves integration of the two main sources of biologicalinformation, Gene Ontology and interaction networks, with microarray data for eliminatingunrelated information and find a clustering result containing only genes relatedwith a given biological process. We applied our methodology successfully on a numberof different cases and on different organisms. We assessed the results with Gene SetEnrichment Analysis method and showed that our final clusters are highly enriched.We also analyzed the results manually and found that most of the genes that are inthe final clusters are actually related with the biological process under inspection. |