Tez No İndirme Tez Künye Durumu
728665
Soru yanıtlama sistemleri için hibrid makine öğrenmesi tekniklerine dayalı bir yöntem tasarımı ve gerçekleştirimi / The design and implementation of a method for question answering systems based on hybrid machine learning techniques
Yazar:SİNEM ÇINAROĞLU
Danışman: DOÇ. DR. HASAN BULUT
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Derin öğrenme = Deep learning ; Soru yanıtlama sistemleri = Question answering systems ; Öznitelik seçimi = Attribute selection
Onaylandı
Doktora
Türkçe
2022
176 s.
Doğal dilde insan-bilgisayar etkileşiminin başlıca araştırma alanlarından biri olan Soru Yanıtlama Sistemleri, doküman uzayını kullanarak doğal dilde insanlar tarafından sorulan sorulara otomatik olarak cevaplar vermek için geliştirilen bir mimaridir. Ancak, Doğal Dil İşleme'de kullanılan öznitelik uzayının seyrekliği, yüksek boyutluluğu ve gereksiz özniteliklerin varlığı, kullanıcı sorularına doğru cevabı sunma konusunda önemli bir problem teşkil etmektedir. Bu zorluklarla mücadele etmek için sıklıkla başvurulan çözümlerin başında Makine Öğrenmesi yöntemleri gelmektedir. Bu tez çalışması kapsamında da, verileri en doğru şekilde temsil edecek, makine öğrenmesi tekniklerine dayalı etkin bir öznitelik seçim yöntemi önerilmiştir. Ayrıca bilinen çalışmalardan farklı olarak, soru yanıtlama problemi, sınıflandırma problemi olarak ele alınmış, bu problemin çözümü için derin öğrenme tabanlı soru yanıtlama sistemlerini kullanan melez bir sistem tasarımı geliştirilmiştir. Daha sonra, önerilen bu yöntemler soru yanıtlama çalışmalarında sıklıkla kullanılan TREC ve SQuAD veri seti üzerinde test edilmiş, temel makine öğrenmesi yöntemlerinin bireysel performansları ile karşılaştırılmıştır. Geliştirilen yöntemlerin performansı doğruluk ve F1-Skor ölçütleri kullanılarak değerlendirilmiştir. Yapılan deneysel çalışmalar sonucunda, geliştirilen yöntemler ile temel makine öğrenmesi yöntemlerinin soru yanıtlama ve sınıflandırma üzerindeki başarılarının arttırıldığı gözlemlenmiştir.
Question Answering Systems is one of the main research areas of human-computer interaction in natural language. These systems are architectures that use document space and generate automatic answers of questions asked by people in natural language. Nevertheless, the sparseness, high dimensionality and redundancy of a feature space used in Natural Language Processing cause a significant problem in serving the correct answer to user questions. At this point, machine learning methods emerge as one of the most frequently used solutions to cope with this difficulty. Within the scope of this thesis, an effective feature selection method based on machine learning techniques has been proposed to represent the data in the most accurate way. In addition, unlike the known studies, the question answering problem is handled as a classification problem, and a hybrid system design using deep learning-based question answering systems is developed to solve this problem. Then, these proposed methods are tested on the TREC and SQuAD datasets, which are frequently used in question answering studies, and compared with the individual performances of classical machine learning methods. The performance of the developed methods is evaluated using the Accuracy and F1-Score metrics. As a result of experimental studies, it has been observed that the proposed methods increase the successes of classical machine learning methods on both question answering and classification tasks.