Tez No İndirme Tez Künye Durumu
642820
Gatekeeper-: GPU accelerated pre-alignment filtering in short read mapping / Gatekeeper-GPU: Kısa okuma haritalaması için hızlandırılmış ön-hizalama filtresi
Yazar:ZÜLAL BİNGÖL
Danışman: DR. ÖĞR. ÜYESİ CAN ALKAN ; PROF. DR. ÖZCAN ÖZTÜRK
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2020
77 s.
Yüksek verimli dizilemede (HTS) son zamanlarda elde edilen gelişmeler çok sayıda DNA parçasının (okumanın) hızlı üretimini kolaylaştırmaktadır. Her geçen gün, bu bağlamda veri üretimi daha az masraflı hale gelmesine rağmen mevcut veriyi bir bütün olarak hizalama programında işlemek hala bilgisayımsal açıdan pahalıdır. Hizalamanın son evresinde, kısa okumaların referans genomu üzerindeki aday pozisyonları, ilgili referans kısmıyla aralarındaki farka bağlı olarak hata payını en aza indirecek şekilde doğrulanmaktadır. Bu bakımdan, okumalar ve referans genomu kısımları arasında karşılaştırma yapmak, geleneksel olarak devirgen programlama algoritmaları içeren yaklaşık karakter dizgisi eşleştirme tekniklerini gerektirmektedir. Herbir okuma ve referans kısmı için devirgen programlama uygulamak, hizalamayı, haritalama işleminin bilgisayımsal olarak pahalı aşaması haline getirmektedir. Bu yüzden, bu aşamayı hızlandırmanın bütün olarak hizalama performansını işletim zamanı açısından iyileştirmesi beklenmektedir. Bu tezde, doğrulama öncesi, devirgen programlama üzerindeki bilgisayımsal yükü azaltmak için belirli bir hata eşiğinin üzerinde olan dizi çiftlerini eleyen bir ön-hizalama filtresi olan GateKeeper-GPU'yu sunuyoruz. Filtreleme için GateKeeper algoritmasını seçiyoruz. GateKeeper'ı geliştiriyoruz ve onu, bilgisayımsal açıdan ağır işi, yüksek oranda paralel milyonlarca izlekle yapmaktan kaynaklanan fayda ile performansı artırmak için CUDA çatısı ile GPGPU (genel kullanım grafik işleme ünitesi) platformuna adapte ediyoruz. GateKeeper-GPU, mrFAST ile entegre edildiğinde doğrulama aşamasına 2.9 kata kadar ve hizalama işleminin bütününe 1.4 kata kadar hızlandırma sağlarken asıl GateKeeper'a göre 52 kata kadar daha az yanlış kabul edilen dizi çifti üretmektedir.
Recent advances in high throughput sequencing (HTS) facilitate fast production of short DNA fragments (reads) in numerous amounts. Although the production is becoming inexpensive everyday, processing the present data for sequence alignment as a whole procedure is still computationally expensive. As the last step of alignment, the candidate locations of short reads on the reference genome are verified in accordance with their difference from the corresponding reference segment with the least possible error. In this sense, comparison of reads and reference segments requires approximate string matching techniques which traditionally inherit dynamic programming algorithms. Performing dynamic programming for each of the read and reference segment pair makes alignment, a computationally-costly stage for mapping process. So, accelerating this stage is expected to improve alignment performance in terms execution time. Here, we propose, GateKeeper-GPU, a fast pre-alignment filter to be performed before verification to get rid of the sequence pairs, which exceed a predefined error threshold, for reducing the computational load on the dynamic programming. We choose GateKeeper as the filtration algorithm, we improve and implement it on a GPGPU platform with CUDA framework to obtain benefit from performing compute-intensive work with highly parallel and independent millions of threads for boosting performance. GateKeeper-GPU can accelerate verification stage by up to 2.9x and provide up to 1.4x speedup for overall read alignment procedure when integrated with mrFAST, while producing up to 52x less number of false accept pairs than original GateKeeper work.