Tez No İndirme Tez Künye Durumu
479824
Web tarama robotu ve sonuç sıralama algoritmasının geliştirilmesi / Development of web crawler and ranking algorithm
Yazar:MOHAMMED RASHAD BAKER BAKER
Danışman: PROF. DR. MUHAMMET ALİ AKCAYOL
Yer Bilgisi: Gazi Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2017
144 s.
Günümüzde Web tarama robotları ve sonuç sıralama algoritmaları, özellikle Web arama motorlarının performansı açısından çok önemlidir. Bu tez çalışmasında öncelikli kuyruk yapısına dayalı yeni bir Web tarama robotu algoritması geliştirilmiştir. Geliştirilen algoritma ile ziyaret edilen Web sayfalarında bulunan bilgiler veritabanına kaydedilerek indeksleme yapılmaktadır. İndeksleme işlemi sırasında ziyaret edilen Web sayfalarının meta-tag ve sayfa içeriğinde bulunan kelimeler ayıklanarak veritabanına kaydedilmektedir. Geliştirilen yeni sıralama algoritmasında Web sayfaları etiket ve sayfa içeriğine dayalı sıralanmaktadır. Yeni geliştirilen Web sıralama algoritması, PageRank ve HITS algoritmaları ile kesinlik ve duyarlık ölçütleri kullanılarak karşılaştırılmıştır. Deneysel sonuçlar geliştirilen sıralama algoritmasının PageRank ve HITS algoritmalarına göre daha başarılı sıralama yaptığını göstermiştir.
Today, Web crawlers and ranking algorithms are very important, especially in terms of the performance of Web search engines. In this thesis, a new Web crawler algorithm structure has been developed based on priority queue. Using the developed algorithm, the information in the visited web pages is stored in the database and indexed. During the indexing process, the meta-tags and the words in the page content of the visited Web pages are extracted and stored in the database. In the new developed ranking algorithm, Web pages are ranked based on the tag and page content. The developed Web ranking algorithm has been compared with PageRank and HITS algorithms using precision and recall. Experimental results show that the developed ranking algorithm performs better ranking than PageRank and HITS algorithms.