Tez No İndirme Tez Künye Durumu
436323
Software tools for analysis of cancer genomics data in the context of pathways / Kanser genomik bilgisinin yolaklar dahilinde analizini sağlayan yazılım araçları
Yazar:İSTEMİ RAHMAN BAHÇECİ
Danışman: PROF. DR. UĞUR DOĞRUSÖZ
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2016
100 s.
Information visualization is concerned with effective visual presentation of abstract information, which reinforces human cognition. Graphs are structures that are well suited to represent relational information. Graph visualization is vital since the underlying relational information of the graph provides fine analysis and comprehension opportunities. Biological pathway visualization is one of the most popular areas, where graph visualization is highly favored. Interactive analysis and visualization of cancer related pathways in the context of genomic data, such as those available through the TCGA project, might reveal valuable information for scientists about disease conditions and potential causes. As the size and complexity of such cancer pathways and associated genomic data increase, exchangeable in-silico representations and their effective, enhanced visualizations, and complexity management become crucial for effective analysis of such data to potentially discover cause-effect relations. In this thesis, we designed and implemented software solutions to visualize cancer genomics data in the context of networks from simple gene interaction networks to process description diagrams within the cBioPortal for Cancer Genomics (cBioPortal). cBioPortal is a popular web portal, getting about 60.000 visits globally per month, providing visualization, analysis and download of large-scale cancer genomics data sets. The network view in cBioPortal presents neighborhood of genes of interest. The alteration data is overlaid on the network with numerous ways to filter and manage complexity of the network (e.g. by alteration percentage or by type or source of the interactions). Upon demand, the user can obtain a more detailed, mechanistic view of the interactions among gene pairs, from Pathway Commons database with a live query using the SBGN process description notation. Finally, we also developed a new pathway visualization component, specifically for cancer pathways, using a uniform notation found in TCGA cancer publications. This tool also facilitates curation of pathways from scratch with support for collaborative editing.
Veri Görselleme soyut olarak temsil edilmiş bilginin, insan algısını destekleyecek, etkili bir biçimde görsel olarak temsil edilmesini hedefler. Çizgeler ilişkisel bilginin temsil edilmesi için tercih edilen uygun yapılardır. Bir çizgenin görsellenmesi çizgenin yapısındaki ilişkisel bilginin daha iyi anlaşılması ve çözümlenmesi bakımından fayda sağladığı için önemlidir. Biyolojik yolak görselleme¸ Çizge görsellenmesinin yaygın olarak kullanıldığı bir alandır. Kanser ile ilişkili yolakların ilgili kanser genomik bilgisi dahilinde interaktif bir biçimde çözümleme ve görsellenmesi, örn: TCGA projesi dahilinde erişilebilen yolaklar, araştırmacılar için hastalıkların olası nedenlerini anlamak, neden sonuç ilişkilerini gözlemlemek adına değerli bilgiler sunar. Bu yolakların boyutu ve karmaşıklığı ve de ilgili genomik datanın boyutu arttıkça, daha etkili karmaşıklık yönetim teknikleri, etkili ve gelişmiş çizge görsellemeleri, bilgisayar ortamında kolay olarak paylaşıma olanak sağlayan bilgi temsilleri araştırmacıların neden sonuç ilişkilerini daha iyi çözümlemesine imkan sağlar. Bu tez çalışması kapsamında genomik datanın yolaklar dahilinde görsellenmesini sağlayan yazılım bileşenleri tasarlanmış ve gerçekleştirilmiştir. Bu yazılım bileşenleri özel olarak cBioPortal for Cancer Genomics (cBioPortal) isimli, kanser araştırmalarında yaygın olarak kullanılan web tabanlı bir yazılım dahilinde genlerin birbirleriyle ilişkilerini gösteren düzenleyici yolakları ve moleküler seviyede prosesleri görselleyebilmek için hayata geçirilmiştir. cBioPortal dünya çapında aylık olarak yaklaşık 60.000 kişi tarafından ziyaret edilen, büyük çapta kanser genomik bilgisinin görsellenmesi¸ çözümlenmesi ve indirilmesi hizmetleri veren web tabanlı bir yazılımdır. cBioPortal dahilinde geliştirilen çizge görselleme bileşeni, verilen bir gen listesinin , bir kanser tipi dahilinde etkileştiği diğer genleri içeren komşuluk yolaklarını kanser genomik bilgisiyle beraber etkili bir biçimde görselleyebilmektedir. Buna ek olarak çeşitli filtreleme ve karmaşıklık yönetimi olanakları da ( örn: genomik alterasyona göre çizge köşelerini filtreleme, gen etkileşimlerini alındığı veri tabanına göre filtreleme) bu yazılım bileşeni dahilinde hayata geçirilmiştir. Istenildiği takdirde gen etkileşimleri daha detaylı bir şekilde, moleküler seviyede prosesler dahilinde Systems Biology Graphical Notation (SBGN) diye ad- landırılan bir notasyonla görsellenebilmektedir. Bu detaylı proses seviyesinde olan yolak bilgisi Pathway Commons isimli yolak veritabanından bir sorguyla, SBGN proses dili diye adlandırılan bir dilde alınmaktadır. Son olarak, özellikle TCGA yayınlarında sıkça rastlanan ve yaygın olarak kullanılan bir notasyonda yolakların görsellenmesi ve oluşturulması amacıyla yeni bir yolak görselleme aracı tasarlanmış ve geliştirilmiştir. Bu yazılım aracı standard bir çizge görselleme ve oluşturma aracından farklı olarak, ortak olarak bir TCGA yolağının araştırmacılarca oluşturulmasına olanak sağlamaktadır.