Tez No İndirme Tez Künye Durumu
619018
Metin çizgelerinde entropi ve optimizasyon tabanlı çıkarımsal metin özetleme / Entropy and optimization based extractive text summarization in text graphs
Yazar:CENGİZ HARK
Danışman: PROF. DR. ALİ KARCI
Yer Bilgisi: İnönü Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2020
91 s.
Metin boyutlarında meydana gelen artış, otomatik belge özetleme araçlarına duyulan ihtiyacı arttırmaktadır. Tez çalışmasında, metin belgelerinin özetlenmesi için iki yeni metodoloji; Karcı Özetleme, Çok Amaçlı Modifiye Fidan Gelişim Algoritması (ÇA-FGA) sunulmaktadır. Benzersiz bir yaklaşımla, bir belge özetleme çalışmasında Karcı Entropi kullanılmış ve literatüre kazandırılmıştır. Önerilen sistem, eğitim verisi gerektirmemektedir. Optimizasyon teknikleri özetleme çalışmalarında sık kullanılan bir başka tekniktir. Ancak bu çalışmalarda, birbirleri ile çelişen farklı amaçlar genelde ağırlıklandırılarak veya birleştirilerek tek amaçlı probleme dönüştürülmektedir. Bu dönüşüm çözüm kalitesini doğrudan etkilemektedir. Tez çalışmasında Karcı Özetleme'ye ek olarak zengin bir özetin iki temel niteliği olan maksimum kapsam ve minimum fazlalığın optimizasyonun amaçları olarak modellendiği bir yaklaşım sunulmaktadır. Eklenen budama aşaması ile Fidan Gelişim Algoritması bir adım ileri taşınmış ve ÇA-FGA tanıtılmıştır. Sunulan yaklaşım kapsamında gerçek bir eşzamanlı optimizasyon uygulanmaktadır. Sunulan yaklaşımların sonuçları açık erişimli veri setleri (DUC 2002-2004) ile test edilmişlerdir. Yaklaşımların performansları, Recall-Oriented Understudy for Gisting Evaluation (ROUGE) ölçekleri kullanılarak incelenmiştir. Deneysel sonuçlar her iki yaklaşımında gelecek vaat eden teknikler olduğunu ortaya koymaktadır.
The increase in text sizes requires the increasing the need for automatic document summarizing tools. In the thesis, two new methodologies for summarizing text documents; Karcı Summarization, Multi-Objective Sapling Growing Up Algorithm (MO-SGA) are offered. Karcı Entropy was used in a document summarizing study with a unique approach and it was introduced to the literature. The proposed system does not require training data. Optimization techniques are another technique commonly used in summarizing studies. However, in these studies, the different contradictory objectives are often weighted or combined into a single-purpose problem. This conversion directly affects the quality of the solution. In addition to Karcı Summarization, the thesis presents an approach in which the two main characteristics of a rich summary, maximum coverage and minimum redundancy, are modeled as the objectives of optimization. With the added pruning step, the Sapling Growing Up Algorithm was moved one step further and MO-FGA was introduced. A simultaneously optimization is implemented within the scope of the presented approach. The results of the proposed approaches were tested with open access data sets (DUC 2002-2004). The performances of the approaches were examined using Recall-Oriented Understudy for Gisting Evaluation (ROUGE) criteria. Experimental results reveal that there are promising techniques in both approaches.