Tez No İndirme Tez Künye Durumu
807400
Integration and analysis of biological data for computational drug discovery / İşlemsel ilaç keşfi için biyolojik verinin entegrasyonu ve analizi
Yazar:HEVAL ATAŞ GÜVENİLİR
Danışman: PROF. DR. MEHMET VOLKAN ATALAY ; DOÇ. DR. TUNCA DOĞAN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Sağlık Bilişimi Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2023
179 s.
İlaç keşfi ve geliştirme süreci, biyomoleküler hedeflere karşı biyoaktif bileşiklerin tanımlanması ve etkinlik ile güvenliklerinin değerlendirilmesini içeren yavaş ve maliyetli bir süreçtir. Hesaplamalı ilaç/bileşik-hedef/protein etkileşimi (İHE/BPE) tahmin yaklaşımları, bu süreci hızlandırmak ve maliyetleri azaltmak için değerli araçlar olarak ortaya çıkmıştır. Son yıllarda, İHE tahmininde yapay zeka (YZ) temelli yöntemlerin entegrasyonu önem kazanmıştır, ancak mevcut yaklaşımlardaki sınırlamalar ve bu biyolojik problemin karmaşıklığı nedeniyle İHE tahminindeki zorluklar devam etmektedir. Bu tez çalışması, mevcut sorunları ele alarak ve yenilikçi İHE tahmin modelleri geliştirerek YZ' nin ilaç keşfi alanında etkili bir şekilde kullanımına katkıda bulunmayı amaçlamaktadır. Temel hedef, sağlam ve endüstriye uygun hesaplamalı sistemlerin tasarımı için güvenilir bir standart oluşturmaktır. Çalışma, problemin farklı yönlerini ele alan üç bölümden oluşmaktadır. İlk bölümde, daha iyi veri temsilleri elde etmek ve daha başarılı öğrenme sağlamak amacıyla makine öğrenmesi temelli İHE tahmini için kapsamlı bir karşılaştırma yapılmış ve adil ve güvenilir bir kıyaslama için yüksek kaliteli biyoaktivite veri setleri oluşturulmuştur. İkinci bölümde, heterojen biyolojik veriyi daha etkili bir şekilde kullanarak ilaç keşfini iyileştirmek için bilgi çizgesi (BÇ) veri yapısından yararlanılmış ve çeşitli biyomedikal olgular arasındaki temel ilişkileri bir araya getiren biyolojik veri entegrasyon sistemimizin (CROssBAR) BÇ modülü oluşturulmuştur. Son bölümde ise, CROssBAR BÇ' leri üzerinden çok katmanlı biyomedikal veride gömülü bilgiyi ortaya çıkarmak için modern çizge tabanlı temsil öğrenme algoritmalarını kullanan HetCPI adlı sistem düzeyinde bir BPE temsil ve tahmin yapısı geliştirilmiş ve zorlu senaryolarda önemli bir performans artışı elde edilmiştir. Bu tezin çıktılarının, biyomedikal bilimlerdeki -özellikle ilaç keşfi ve yeniden konumlandırmada- deneysel ve hesaplamalı çalışmalar için oldukça faydalı olması beklenmektedir.
Drug discovery and development is a slow and costly process that comprises identifying bioactive compounds against biomolecular targets and evaluating their efficacy and safety. Computational drug/compound–target/protein interaction (DTI/CPI) prediction approaches have emerged as valuable tools to streamline this process and minimize expenses. In recent years, the integration of artificial intelligence (AI) based methods in DTI prediction has gained considerable attention, but challenges persist due to limitations in existing approaches and the complex nature of this biological problem. This thesis study aims to contribute to the effective utilization of AI in drug discovery by addressing current obstacles and developing innovative DTI prediction models. The main goal is to establish a reliable standard for designing robust and industry-applicable computational systems. The study is divided into three parts, each addressing a different aspect of the problem. In the first part, we performed a comprehensive benchmark for machine learning-based DTI prediction to achieve better data representations and more successful learning, and proposed high-quality bioactivity datasets for a fair and reliable comparison. In the second part, we utilized the knowledge graph (KG) data structure to leverage heterogeneous biological data for improved drug discovery, and constructed the KG module of our biological data integration system (CROssBAR) by incorporating essential relationships among multiple types of biomedical entities. In the last part, we proposed HetCPI, a systems-level CPI representation and prediction framework, which utilizes cutting-edge heterogeneous graph representation learning algorithms to extract hidden knowledge from multi-layered biomedical data, i.e., CROssBAR KGs, and demonstrates a considerable performance improvement in challenging scenarios. The outputs of this thesis study are expected to aid experimental and computational work in biomedical sciences, especially in drug discovery and repurposing.