Tez No İndirme Tez Künye Durumu
386141
Enformasyon sistemlerinde saklı Markov modeli ve Bayes tabanlı sınıflandırıcılar ile bilgi modellerinin geliştirilmesi / Development of information models with the hidden Markov model and Bayes-based classifiers in information systems
Yazar:ADEM DOĞANER
Danışman: DOÇ. DR. SİNAN ÇALIK
Yer Bilgisi: Fırat Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; İstatistik = Statistics
Dizin:Veri madenciliği = Data mining
Onaylandı
Doktora
Türkçe
2015
117 s.
Bilgi teknolojilerinin gelişmesi ile birlikte bilgisayar ve internet ortamında çok sayıda metin yığını oluşmuştur. Kullanıcılar, bu yoğunluktaki metin yığınları karşısında istedikleri bilgiyi elde etmek için zorluklar ile karşılaşmaktadırlar. Kullanıcılar çoğu kez bu verileri incelemek için zaman bulamamaktadır. Mevcut enformasyon sistemleri ise bu yoğunluktaki kitlelerden enformasyon sağlamada yetersiz kalmaktadır. Çalışmada bilgisayar ve internet ortamındaki metin içeriklerinden otomatik olarak enformasyon sağlayacak model geliştirilerek büyük boyutlardaki metin kitlelerinden, bilgisayar ortamında otomatik olarak enformasyonun elde edilmesi amaçlanmaktadır. Çalışmada aşamalı işlemlerden oluşan kompleks bir model geliştirilmiştir. Modelde Türkçe'nin sondan eklemeli dil yapısı dikkate alınarak kelimeleri eklerinden ayırma işlemleri için algoritma oluşturulmuştur. Modelin teorik yapısını oluşturan Saklı Markov modeli ve Bayes tabanlı sınıflandırıcılar ile kelimeler türlerine göre sınıflandırılmıştır. Kelimeler ile bu kelimelere ilişkin veriler ve alanlar, varlık ilişki modeli ile incelenerek veritabanına aktarılmış ve yapısal sorgulama dili (SQL) ile enformasyon çıkarım işlemleri gerçekleştirilmiştir. Modelin internet ortamından elde edilen 584 kelimelik Türkçe metin içeriğine uygulanması sonucunda, kelimeleri türlerine göre sınıflandırma başarısı % 90,8 olarak elde edilmiştir. Ayrıca model 584 kelimelik metin kitlesinden otomatik olarak 13 kelimelik anlamlı ve metni temsil yeteneği yüksek bir enformasyon sağlamıştır. Türkçe Dili'nde yazılmış metin içeriklerinden enformasyon sağlamak için geliştirilen model, kelimeleri türlerine göre sınıflamada ve otomatik enformasyon elde etme konusunda başarılı sonuçlar sağladığı gözlemlenmiştir.
Along with the developments in information technologies, a large number of texts accumulated in the computer and Internet environments. The users are faced with difficulties in accessing the information they seek in the face of such dense accumulation of texts. Mostly, the users cannot find the time to go through such data. The existing information systems remain inadequate in providing information from such dense masses of data. The present study aims to develop a model that will automatically provide information from text content in the computer and Internet environments, thereby enabling automatic access to information from large-scale masses of texts in the computer environment. The study resulted in the development of a complex multiphase model. The model was prepared by taking into consideration the agglutinative structure of Turkish and through the development of an algorithm for the separation of words from suffixes. The Hidden Markov Model and Bayes-based classifiers, that constituted the theoretical structure of the model, were used to classify the words with respect to word types. Words and their associated data and fields were examined through the entity-relationship model and subsequently transferred to the database. This was followed by the extraction of information through the Structured Query Language (SQL). Once the model was applied to the content of a Turkish text of 584 words retrieved from the Internet environment, a success rate of 90.8% was achieved in the classification of words by type. In addition, the model enabled a body of meaningful and representative information of 13 words to be obtained automatically from the textual mass of 584 words. Developed with the aim of providing information from textual content in Turkish, the model was observed to offer successful results in classifying words by type and obtaining information automatically.