Tez No İndirme Tez Künye Durumu
470025
Identification of cancer patient subgroups via pathway based multi-view graph kernel clustering / Kanser hasta alt gruplarının yolak esaslı çok bakışlı çizge çekirdeği gruplaması ile belirlenmesi
Yazar:ALİ BURAK ÜNAL
Danışman: YRD. DOÇ. DR. ÖZNUR TAŞTAN OKAN
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2017
102 s.
Yeni nesil dizi analizi teknolojisi ile hasta genomik değişimlerin nitelendirilmesi kanser alt tiplerinin belirlenmesinde yeni olanaklar ortaya çıkarıyor. Farklı omik verileri, tümörlerin moleküler biyolojilerine farklı bakış açıları sağlar; bununla birlikte, tümör hücreleri yüksek seviyede heterojenlik sergiler, ve farklı hastalar farklı kombinasyonlarda moleküler değişikliklere sahiptir. Öte yandan, farklı değişiklikler aynı biyolojik yolakları bozabilir. Bu çalışmada, yeni bir çizge çekirdeği aracılığıyla hastaların alterasyon profillerinden yolaklar üzerindeki benzerliklerini nicelleştiren yeni bir kümeleme prosedürü öneriyoruz. Her bir yol ve hasta çifti için, hastanın moleküler değişiklikleri ve yolak etkileşimlerine dayanarak düğümleri etiketlenmiş yönsüz bir çizge oluşturulur. Önerilen dağıtılmış en kısa yol çizge çekirdeği (smSPK), bir yolağa göre hasta çiftlerinin düğümleri etiketli çizgelerini karşılaştırarak benzerliklerini değerlendirir. Gruplama prosedürümüz iki adımdan oluşur. İlk adımda, her yol ve veri tipi için smSPK çekirdek matrisleri, hasta çiftleri için birden çok çekirdek matrisi oluşturmak üzere hesaplanır ve sonraki adımda, bu çekirdek matrisleri, hastaları katmanlaştırmak için çok bakışlı çekirdek gruplandırma yaklaşımına girdi olarak verilir. Metodolojimizi 361 renal hücreli karsinoma hastasında somatik mutasyonlar, gen ve protein ifadeleri verileri kullanarak uyguluyoruz. Bu yaklaşım, hayatta kalma sürelerinde önemli farklılık gösteren hasta alt gruplarını ortaya çıkarıyor (p-değeri < 1.5 x 10^{-8}). Önerilen yöntem, diğer omik verilerin entegrasyonuna izin verir ve her hasta alt grubundaki bozuk yolaklarla ilgili fikir verir.
Characterizing patient genomic alterations through next-generation sequencing technologies opens up new opportunities for refining cancer subtypes. Different omics data provide different views into the molecular biology of the tumors. However, tumor cells exhibit high levels of heterogeneity, and different patients harbor different combinations of molecular alterations. On the other hand, different alterations may perturb the same biological pathways. In this work, we propose a novel clustering procedure that quantifies the similarities of patients from their alteration profiles on pathways via a novel graph kernel. For each pathway and patient pair, a vertex labeled undirected graph is constructed based on the patient molecular alterations and the pathway interactions. The proposed smoothed shortest path graph kernel (smSPK) assesses similarities of pair of patients with respect to a pathway by comparing their vertex labeled graphs. Our clustering procedure involves two steps. In the first step, the smSPK kernel matrices for each pathway and data type are computed for patient pairs to construct multiple kernel matrices and in the ensuing step, these kernel matrices are input to a multi-view kernel clustering algorithm to stratify patients. We apply our methodology to 361 renal cell carcinoma patients, using somatic mutations, gene and protein expressions data. This approach yields subgroup of patients that differ significantly in their survival times (p-value < 1.5 x 10^{-8}). The proposed methodology allows integrating other type of omics data and provides insight into disrupted pathways in each patient subgroup.