Tez No İndirme Tez Künye Durumu
343121
A framework for gene co-expression network analysis of lung cancer / Akciğer kanserinin gen ortak ifade analizi için bir yöntem
Yazar:ERHAN AKDEMİR
Danışman: DOÇ. DR. TOLGA CAN ; YRD. DOÇ. DR. YEŞİM AYDIN SON
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Biyoenformatik Bölümü
Konu:Biyoloji = Biology ; Onkoloji = Oncology
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2013
60 s.
Hastalıkla ilgili genlerin ortaya çıkarılmasını amaçlayan medikal araştırmalarda gen ortak ifade ağlarının oluşturulma biçimi önemlidir. Uygulanan benzerlik ölçüsü ve ağdaki anlamlı ortak ifadeye sahip gen çiftlerini temsil eden bağlantıların seçimi ağın öğeleri ve öne çıkarılan genleri doğrudan etkiler. Pearson korelasyon katsayısı basitliği ve diğer bir çok karmaşık yönteme karşı üstünlüğü nedeniyle genlerin ortak ifadesinin sayısallaştırılmasında sıkça kullanılan bir benzerlik ölçüsüdür. Ancak aykırı değerlerden etkilenir ve örnek sayısının azlığında güvenilir olmayabilir. Diğer yandan, genelde keyfi belirlenmiş bir eşiğin üzerindeki ortak ifadeler ağa seçilir, bu da ağı öznel yapar. Daha standart ve doğru bir analiz için benzerlik ölçüsünün güvenilirliği ve bağlantıların objektif olarak belirlenen bir eşiğe göre seçilmesi sağlanmalıdır. Burada sağlıklı ve kanser durumları arasındaki genel eş ifade farklılıklarını bulmak için kullanılabilecek, daha önce Pearson korelasyon katsayısına uygulanmış bir kararlılık ölçüsü olan korelasyon kararlılığı ile otomatik bir ağ oluşturma yöntemi olan rastlantısal matris teorisinin birleştirildiği bir ağ oluşturma sistemi önerilmektedir. Önerilen sistem akciğer adenokanserine uygulanmıştır. Analiz aşamasında genler kontrol ve hastalık ağlarındaki topolojik ve komşuluk özelliklerinin değişimine bağlı olarak öne çıkartılmıştır. Bilinen protein-protein etkileşimleri ve düzensiz proteinlerin eş ifadeleri de analiz edilmiştir. Sonuçlar eş-ifade ağlarının tekerlek benzeri bir yapıda, kontrol örneklerinin ise sağlıklıdan kanser durumuna geçiş fazında olduğunu önermektedir. Bu yüzden kanser ve sağlıklı durumları arasındaki genel eş ifade farklılıkları değerlendirilememiştir. Hem önerilen hem de kontrol amacıyla kullanılan yöntemle öne çıkarılan genler çoğunlukla geçiş fazını yansıtan hücre etkinlikleriyle ilgilidir ve daha sonra yapılacak derin analizlerle faz geçişinin dinamik özelliklerini ortaya çıkartabilir. Dahası faz geçişinin erken dönemlerinde etkisi olabilecek siliya ile ilgili bazı genler öne çıkartılmıştır. Anahtar sözcükler: gen ortak ifade ağları, korelasyon kararlılığı, rastlantısal matris teorisi, akciğer adenokanseri
Construction method of a gene co-expression network (GCN) is crucial in medical research aiming to reveal disease related genes. Applied similarity measure and selection of edges that represent significantly co-expressed gene pairs in the network affect directly the elements of a network and so the list of prioritized genes. Pearson correlation coefficient is a commonly used similarity measure to quantify co-expressions of genes due to its simplicity and performance compared to many complex methods. However, it is affected by outliers and may not be reliable with low sample size. On the other hand, selection of edges is generally based on an arbitrary cutoff which makes networks subjective. For a more standard and accurate analysis, reliability of a similarity measure must be ensured as well as an objective threshold determination for the selection of edges. Here, a framework is proposed for the construction of GCNs that combines a reliability measure, stability, previously applied to Pearson correlation coefficient to detect general co-expression differences between healthy and cancer state and an automatic threshold selection method, Random Matrix Theory for a standard network construction. The proposed framework was applied to lung adenocarcinoma. In the analysis part, genes were prioritized by using changes in topological and neighborhood properties of nodes in control and disease networks. Differential co-expressions of known interacting proteins and intrinsically disordered proteins were also analyzed. Results suggest that co-expression networks are topologically spoke-like and control samples are in transition phase from healthy to cancer. Thus, effects of stability on finding general co-expression differences between cancer and healthy states could not be assessed. Prioritized genes by both proposed and control methods are mostly enriched to relevant processes reflect the changes in cellular machinery as a result of a state shift to cancer and may reveal dynamical features of transition of cells to cancer state with a further detailed analysis. Furthermore, some genes were prioritized related with cilia which may have roles early phases of transition. Keywords: gene co-expression networks, stability of correlation, Random Matrix Theory, lung adenocarcinoma