Tez No |
İndirme |
Tez Künye |
Durumu |
724891
|
|
DNA dizi analizinde hizalamasız karşılaştırma için yeni yaklaşımlar / Novel approaches to alignment-free comparison in DNA sequence analysis
Yazar:EMRE DELİBAŞ
Danışman: PROF. DR. AHMET ARSLAN
Yer Bilgisi: Konya Teknik Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Dizi analizi-DNA = Sequence analysis-DNA
|
Onaylandı
Doktora
Türkçe
2020
114 s.
|
|
Teknolojinin hızlı gelişiminin bir sonucu olarak ortaya çıkan büyük boyutlardaki biyolojik verinin işlenmesinde geleneksel biyolojik ve istatistik metotlarının yetersiz kalması, konuyu bilgisayar biliminin çalışma alanları arasında odak noktalarından biri haline getirmiştir. Benzerlik, hesaplamalı biyoloji ve biyoinformatikte DNA dizi analizinin anahtar süreçlerinden biridir. Evrimsel ilişkileri, gen fonksiyon analizini, protein yapı tahminini ve dizi eşleşmelerini araştıran neredeyse tüm araştırmalarda, benzerlik hesaplamaları yapmak gerekmektedir. Yüksek hesaplama maliyetiyle sonuçlanan hizalamaya dayalı dizi karşılaştırma yöntemlerine bir alternatif olarak, diziyi farklı bir uzayda sayısallaştırarak, tanımlanan yeni matematiksel tanımlayıcılarla benzerliği hesaplayan hizalamasız yöntemler ortaya çıkmıştır. Bu tez çalışmasında hizalamasız DNA dizi benzerlik analizinde yeni yaklaşımlar önerilmiştir. Önerilen metotlarla DNA dizileri arasındaki benzerliklerin tespitinde kullanılmak üzere özellik çıkarım süreçleri tasarlanmıştır. Uzunluktan bağımsız olarak çalışan metotların farklı uzunluktaki DNA dizileri üzerindeki etkisini test etmek üzere, literatürde kullanılmış üç farklı veri seti ele alınmıştır. Elde edilen özellik vektörlerinin benzerlik metrikleri ile ilişkileri tanımlanmış ve referans olarak kullanılan filogenetik ağaçlarla karşılaştırılmıştır. Testler neticesinde önerilen metotların elde ettiği sonuçların başarılı ve kabul edilebilir oldukları görülmüştür.
|
|
The fact that traditional biological and statistical methods are insufficient in the processing of large-scale biological data, which has emerged as a result of the rapid development of technology, has made the subject one of the focal points of the field of computer science. Similarity is one of the key processes of DNA sequence analysis in computational biology and bioinformatics. In nearly all research that explores evolutionary relationships, gene function analysis, protein structure prediction, and sequence retrieving, it is necessary to perform similarity calculations. As an alternative to alignment-based sequence comparison methods that have high computational costs, alignment-free methods have emerged that by digitizing the sequence in a different space, calculate the similarity with the new mathematical identifiers utilized. In this thesis, novel approaches are proposed in alignment-free DNA sequence similarity analysis. With the proposed methods, feature extraction processes are designed to be used to determine similarities between DNA sequences. Three different datasets used in the literature are discussed to test the effect of methods analysing independently of length on different sequences of DNA. The relations of the feature vectors obtained with similarity metrics are defined and compared with phylogenetic trees used as reference. As a result of the tests, it is seen that the results obtained by the proposed methods are successful and acceptable. |