Tez No İndirme Tez Künye Durumu
523465
Biyomedikal bilgi çizgeleri için makine öğrenmesi tabanlı anlamsal bağ tahmini / Machine learning based semantic link prediction for biomedical knowledge graphs
Yazar:REMZİ ÇELEBİ
Danışman: DR. ÖĞR. ÜYESİ ÖZGÜR GÜMÜŞ
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Anlamsal ağlar = Semantic networks ; Bilgi tabanlı = Knowledge base ; Makine öğrenmesi yöntemleri = Machine learning methods ; Yapay sinir ağları = Artificial neural networks ; Yapay zeka = Artificial intelligence
Onaylandı
Doktora
Türkçe
2018
114 s.
Son zamanlarda, gerçek dünyadaki varlıklar ve bunların birbiriyle ilişkileri hakkında milyonlarca gerçekler (ifadeler) içeren büyük bilgi tabanlarının oluşturulması oldukça ilgi görmektedir. Günümüzde biyomedikal alandaki bir çok verinin Anlamsal Web teknolojileri ile erişebilir olması sayesinde bu bilgi tabanları Bağlı Veri formunda olan bilge çizgeleri olarak sunulmaktadır. Bilgi çizgeleri, veriyi tanımlamada güçlü bir model sunmakta ve aynı zamanda altında yatan çizge yapısı sayesinde çizge madenciliği algoritmalarının uygulanmasını mümkün kılmaktadır. Bu tezde büyük bilgi çizgelerinde eksik bağlantıları keşfetmek ve yeni bağlantıları tahmin etmek için çeşitli yaklaşımlar sunulmuştur. Bu tez kapsamında biyolojik ve biyomedikal bilgi ağlarında varlıklar arasında yeni bağları keşfetmek için bilgi çizgeleri kullanarak makine öğrenmesi temelli melez bir yaklaşım önerilmiştir. Yeni ilişkilerin tahmini için çizgenin yapısal ve anlamsal özelliklerine dayanan iki öznitelik grubu, yerel ve global öznitelikler, kullanılmıştır. Yerel öznitelikler, ağ yakınlıklarına ve global öznitelikler ise anlamsal çizgenin vektör temsiline dayanır. Bu iki öznitelik grubu ile eğitilen makine öğrenmesi modelleri, ayrı ayrı ve bütünleştirilerek bağ tahmini için kullanılmıştır. Ayrıca bağ tahmini yöntemlerinin değerlendirilmesinde göz ardı edilen durumlar için test senaryoları geliştirilmiş ve bu test senaryoları için önerilen yöntemin başarısı denenmiştir. Önerilen yaklaşımların yararlılığı biyomedikal alanda ilaç keşfi ve halk sağlığı için önemli olan iki problem, yeni ilaç-ilaç etkileşimi tahmini ve yeni ilaç endikasyonu tahmini, için başarılı bir şekilde uygulanarak gösterilmiştir. Yöntemin mevcut yaklaşımlara üstünlüğü böylece kanıtlanmıştır.
The construction of large knowledge bases which contain large volumes of data about real world objects and their relationships has been an object of great interest in recent times. Nowadays, many databases in the biomedical field are accessible through Semantic Web technologies, so these databases have been presented as knowledge graphs in the form of Linked Data. The knowledge graphs are powerful models for defining data which also enable the application of graph mining algorithms thanks to the underlying graph structure. A number of approaches for the discovery of missing links and prediction of new links in large knowledge graphs is presented within this thesis. A hybrid approach based on machine learning which uses knowledge graphs to discover new links between entities in biological and biomedical information network is proposed. Two groups of features, local and global features, based on structural and semantic properties of the knowledge graphs, are used for the link prediction. Local features are based on network proximity and global features are based on vector representation of the semantic graph. The machine learning models trained with these two feature groups were evaluated separately and jointly. In addition, test scenarios were developed for cases that were often ignored in evaluating link prediction methods, and the proposed methods applied to these scenarios were tested. The utility of the proposed approaches was demonstrated by successfully applying them on two important problems for the drug discovery process in the biomedical field; predicting new drug-drug interactions and predicting novel drug indications. The method's superiority over existing approaches were thereby demonstrated.