Tez No İndirme Tez Künye Durumu
394551
İlişkili genom dizilim kümeleri arasındaki bağıntıların analizi için yapay öğrenme yöntemleri / Machine learning methods for analysing correlations among sets of related genome sequences
Yazar:NAZİFE ÇEVİK
Danışman: DOÇ. DR. OLCAY KURŞUN
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Bilim ve Teknoloji = Science and Technology
Dizin:
Onaylandı
Doktora
Türkçe
2015
126 s.
Biyoinformatik çalışmalarda, sekans analizi, DNA, RNA veya peptit sekansların özelliklerini, fonksiyonlarını, yapılarını ya da evrimsel gelişimini analiz etmek amacıyla yapılmaktadır. Sekans hizalama, biyolojik veritabanı incelenmesi ve diğer başka yöntemler sekans analizi için kullanılan en yaygın yöntemler arasındadır. Ancak, örnekler ya da genler arasındaki bağlantıları araştırmanın en hızlı yolu ise korelasyon analizi yapmaktır. Bu çalışmada, ilişkili genom dizilim kümelerinde bağıntıların analizi çeşitli makine öğrenmesi yöntemleri ile gerçekleştirilmiştir. Aynı sınıf altında bulunan türlerin ortak miRNA sayılarının farklı sınıf altında bulunan türler arasındaki ortak miRNA sayılarından daha fazla olduğu görülmüştür. Yapılan korelasyon analizinde, CCA ve ECCA yöntemleri kullanılarak elde edilen sonuçlar karşılaştırıldığında, CCA ve ECCA yöntemleri arasında birkaç durumda fark gözlenmekle beraber, pearson korelasyon katsayısı ile elde edilen korelasyondan daha yüksek bir sonuç elde edildiği görülmüştür. Türlerin ortak miRNA sekansları arasındaki genetik mesafeler incelendiğinde ise türlerin birbirlerine olan yakınlık ya da uzaklıkları ile ilgili yorum yapılabildiği görülmüştür. Kullanılan RI ve CRN yöntemlerinde ise genetik mesafe ile RI arasında korelasyonun olduğu görülmüştür.
Sequence analysis is used for analysing DNA, RNA and peptide sequence features, functions, structures or evolutionary developments in bioinformatic studies. Sequence alignment and other methods are most popular methods for examination of biological databases for sequence analysis. However, the fastest way for investigation of relationships between samples and genes is to make correlation analysis. In this study, correlation analysis of relations among genomic sequences is carried out by machine learning methods. As a result, it is seen that species that are under the same class in biological tree have more common miRNAs than species that are under different class in biological tree. Correlation analysis shows that when CCA and ECCA results are compared, there is some significant difference between CCA and ECCA methods and CCA and ECCA methods presents high correlation coefficient than pearson correlation. When genetic distances between species that share common miRNA sequences, it is possible to comment about the closeness and remoteness of the species. RI and CRN methods show a correlation between genetic distance and RI.