Tez No İndirme Tez Künye Durumu
295645
Fizyolojik süreçlerde model tabanlı yeni öğrenme yaklaşımları / Model based learning algorithms based on physiological processes
Yazar:UĞUR AYAN
Danışman: PROF. DR. GALİP CANSEVER
Yer Bilgisi: Yıldız Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik Mühendisliği Ana Bilim Dalı / Kontrol ve Otomasyon Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyoistatistik = Biostatistics ; Biyomühendislik = Bioengineering
Dizin:Biyomedikal uygulamalar = Biomedical applications
Onaylandı
Doktora
Türkçe
2010
149 s.
Bu tezde; fizyolojik veriler üzerinde önerdiğimiz yeni çekirdek tabanlı gözetimli öğrenme algoritmaları örnek olarak dizi çekirdekleri ve artımlı azalımlı çekirdek modelleri, çizge tabanlı yeni yarı gözetimli öğrenme modelleri, gürültülü ve aykırı verilerden kurtulmak için iki farklı öznitelik kalitesini ölçen methodu birleştirdiğimiz bir boyut indirgeme modeli, protein yapı tahmininde ve fonksiyon tanımada kullanılabilecek Saklı Markov Modeli baz alınarak oluşturulan yeni bir çekirdek modeli önerilmiş olup, önerilen modeller fizyolojik veriler üzerinde uygulanmıştır.Bu çalışmada ilk olarak ilaç tasarımı ile ilgili veri kümeleri, yapılan çalışmalar, ve akademik yazımdaki bilgisayarlı ilaç tasarımı ile ilgili yöntemler hakkında bilgi verilmiş olup, hemen devamında kullanılan diğer protein veri bankaları, hastalık ve kanser veri kümeleri ile akademik yazımdaki bazı yüksek boyutlu veriler tanıtılmıştır. Sonraki bölümde ise kısaca öğrenme modelleri ele alınmıştır. Dördüncü bölümde, gözetimli öğrenme yöntemlerinden çekirdek tabanlı DVM modellerinden doğrusal ayrılabilen ve doğrusal olarak ayrılamayan öğrenme yöntemlerinin matematiksel alt yapısı tanıtılmış ve yeni önerilen modeller iki temel başlıkta: metin tabanlı çekirdek öğrenme ile artımlı çekirdek öğrenme algoritmaları, detayları ile verilmiş ve başarımları ikinci bölümde tanıtılan veri kümeleri üzerinde incelenmiştir. Özellikle bu bölümde önerilen yeni çekirdek modellerinin başarımlarını fizyolojik verilerin haricinde diğer makine öğrenme verileri üzerindede denenmiş ve başarımları incelenmiştir. Bir sonraki bölümde ise deneylerimizde karşılaştırmak için kullanılan üç faklı yarı gözetimli öğrenme modeli ve etkin öğrenme ile birleştirdiğimiz etkin yarı gözetimli öğrenme modeli detayları ile ele alınmıştır. Son olarak ele aldığımız yöntem ise akademik yazımda protein yapılarının sınıflandırılmasında sıkça kullanılan Saklı Markov Modeli ile dinamik programlama modellerinden yola çıkılarak proteinlerin SMM yapısı üzerinden eşleşen durumlara dayanan, protein dizilerinin metinsel yapısı yerine sonlu durumları kullanılarak geliştirilen ikili saklı Markov durumlarının skorlaması ile oluşturulan PHA-çekirdek modelinin matematiksel alt yapısı tanıtılmıştır.Önerilen tüm algoritmalarda, çekirdek düzenlileştirme sabiti, ceza parametresi gibi farklı çekirdek paremetreleri ele alınarak başarımları karşılaştırmalı olarak verilmiştir. Algoritmaların, bilimsel yazındaki diğer birçok yöntemle eğitim ve test hataları açısından karşılaştırılmıştır.
In this thesis, new kernel based supervised learning algorithms such string kernels, incremental kernel learning moedels, new graph based semi-supervised learning models, a feature reduction model which is combination of different feature selaction methods measuring the quality of features in order to get rid of noisy and redundant data and Hidden Markov Model based new kernel machine method to predict the structure of protein and function classification is proposed.Firstly, four different drug datasets, methodologies and the studies related with computer aided drug design are given, and immediately other protein databases, disease data, cancer datasets, some high-dimensional data on literature are presented. In the next section, the learning models is discussed briefly. In fourth chapter, matematical background of linearly separable and soft margin kernel based Support Vector Machines are introduced. Newly proposed kernel models are given in two areas as string kernels and incremental kernel learning algorithms. The performance of these methods on above datasets introduced in the second chapter is examined in details. Especially in this chapter, the performance of the proposed kernel models on other machine learning repository is also tested and analyzed. In the next chapter, three main semi-supervised learning model to compare in our experiments and new active semi-supervised learning model dealt with details. Finally, PHA-kernel, Pairwse Hidden Markov Models Alignment kernel which is based on Hidden Markov Models mostly used in protein classification and alignment scoring by dynamic programming is mathematically defined. We use finite state machines instead of using protein sequence structures in this model.The accuracy of all proposed learning models are given by using different kernel regularization parameter, penalty parameter, slack variables and other kernel parameters Training and test errors of our algorithms are compared with other learning models in details.