Tez No İndirme Tez Künye Durumu
779797
Türkçe metinlerde çıkarım tabanlı otomatik metin özetleme / Extractive based automatic text summarization in Turkish texts
Yazar:ERTÜRK ERDAĞI
Danışman: DR. ÖĞR. ÜYESİ VOLKAN TUNALI
Yer Bilgisi: Maltepe Üniversitesi / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Cümle = Sentence ; Metin özetleme = Text summarization ; Ses bilgisi = Phonetic ; Sınıflandırma = Classification ; Çıkarım = Inference
Onaylandı
Doktora
Türkçe
2023
107 s.
Tez çalışmasında çıkarım tabanlı metin özetleme yönteminin Türkçe metinlerde kullanımına ilişkin cümle derecelendirme yöntemleri deneysel çalışma olarak yürütülmüş, literatürde bulunan yöntemlere ek olarak yeni yöntemler önerilmiştir. Ulusal haber sitelerinde bulunan içeriklerden elde edilen haber metinleri veri seti olarak kullanılmış, bu veri setinde üç farklı kullanıcının özet çalışması yapılmış ve bu özet çalışmaları daha sonra tek bir sonuca indirgenmiştir. Kontrol veri seti olarak tanımlanan bu kısım oluşturulacak özet ile başarımın değerlendirilmesi için kullanılmıştır. Literatürde mevcut olan cümle derecelendirme yöntemlerine ek olarak büyük ünlü uyumu, küçük ünlü uyumu ve bu iki kuralın birlikte denendiği hibrit bir model önerilmiştir. Önerilen üç yöntemin değerlendirilmesi ROUGE ve BLEU metrikleri ile ölçümlenmiş ve sonucunda geleneksel yöntemlerden daha iyi sonuç verdiği gözlemlenmiştir. İki metrik ile değerlendirmenin yanı sıra özetleme çalışması bir sınıflandırma problemi olarak ele alınmış, literatürde bulunan dört farklı sınıflandırma algoritması bu çalışmada kullanılmıştır. Çalışma önerilen yöntemlerin salt kullanımı, geleneksel yöntemlerin salt kullanımı ve her iki yöntemin birlikte kullanıldığı hibrit yöntem üç ayrı başlıkta değerlendirilmiş ve önerilen yöntemlerin üç algoritmada en iyi sonucu, bir algoritmada ise hibrit yöntemin en iyi sonucu verdiği gözlemlenmiştir.
In this thesis study, sentence grading methods related to the use of extractive text summarization method in Turkish texts were carried out as an experimental study, and new methods were proposed in addition to the methods found in the literature. The news texts obtained from the contents of the national news sites were used as a data set, a summary study of three different users was carried out in this data set, and these summary studies were later reduced to a single result. This part, defined as the control data set, was used to evaluate the performance with the summary to be created. In addition to the sentence grading methods available in the literature, major vowel harmony, minor vowel harmony, and a hybrid model in which these two rules are tested together were proposed. Evaluation of the three proposed methods was measured with ROUGE and BLEU metrics, and it was observed that it gave better results than the traditional methods. The summarization study was handled as a classification problem in addition to the evaluation with two metrics, and four different classification algorithms in the literature were used in this study. In the study, the use of only the proposed methods, the use of only the traditional methods and the hybrid method in which both methods are used together were evaluated in three different sections and it was observed that the proposed methods gave the best result in three algorithms and the hybrid method gave the best result in one algorithm.