Tez No İndirme Tez Künye Durumu
479932
TOJDE Dergisi üzerinde LDA ile konu modelleme / Topic modelling of TOJDE Journal with LDA
Yazar:YUSUF
Danışman: DOÇ. DR. ÖZGÜR YILMAZEL
Yer Bilgisi: ANADOLU ÜNİVERSİTESİ / FEN BİLİMLERİ ENSTİTÜSÜ / BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Anahtar Kelime:
Onaylandı
Yüksek Lisans
Türkçe
2017
38 s.
Çeşitli bilgilerin kayıt altına alınması hususunda bilgisayar sistemlerinin güvenlik, maliyet, erişilebilirlik gibi konularda sağladığı avantajlar ile birlikte içinde bulunulan bilgi çağında hızla büyüyen verilere erişimin sağlanması, bu veriler içerisinden aranılan bilginin çıkarılması konusu, üzerinde çalışılması güç problemler doğurmuştur. Latent Dirichlet Allocation gibi konu modelleme algoritmaları ve bu algoritmalar üzerine geliştirilmiş konu modelleme araçları binlerce kayıt arasında sıklıkla bahsedilen konuların saptanmasını sağlayabilmektedir. Bu tez kapsamında yapılan çalışma, The Turkish Online Journal of Distance Education (TOJDE) dergisi tarafından kayıt altına alınmış makalelerin araştırılabilir biçime çevrilmesi ve bu metin veriler üzerinde Latent Dirichlet Allocation algoritması ile konuların algılanmasını amaçlamaktadır. Konuların algılanması ile birlikte kullanıcı tarafından anlaşılır görsel analiz sonuçları sunan bir sistem ortaya koyarak yıllara göre konu dağılımlarını gösteren grafiklere ulaşılmıştır. Çalışmanın gerçekleştirilmesi için elde edilen metin veriler Latent Dirichlet Allocation algoritması ile analiz edilmeden önce makale arşivinde yer alan metinlerde geçen kelimeler, kök bulma gibi işlemlerle sadeleştirilerek konu algılama işleminin başarısının arttırılması sağlanmıştır.
In order to record various information, advantages of computer systems such as security, cost, accessibility as well as the provision of access to rapidly growing data in the information age, the issue of extracting the information sought from these data has caused difficulties. Topic modeling algorithms such as Latent Dirichlet Allocation and topic modeling tools developed on these algorithms is often used to determine the topics mentioned between thousands of documents. In this thesis, the study aims to generates searchable texts from the articles registered by The Turkish Online Journal of Distance Education (TOJDE) journal and perceive the topics with using Latent Dirichlet Allocation algorithm on these searchable texts. Along with the detection of the topics, a system that presents visual user-friendly analysis charts developed and reached graphical outputs which show the distribution of the topics according to years. The words in the article archive have been simplified with operations such as stemming before analyzing texts with the Latent Dirichlet Allocation, thereby increasing the success of the topic modelling process.