Tez No İndirme Tez Künye Durumu
538709
Parallel proposition bank construction for Turkish / Paralel Türkçetümce bankasının oluşturulması
Yazar:KORAY AK
Danışman: PROF. DR. OLCAY TANER YILDIZ
Yer Bilgisi: Işık Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Elektronik bilgi kaynakları = Electronic information resources
Onaylandı
Doktora
İngilizce
2019
134 s.
PropBank yüklem-argüman bilgisi ve anlambilimsel rol ve argümanlar için el ile açıklanmış bütünceyi içeren bir tümce bankasıdır. Sözdizimsel açıklamaya anlambilimsel bir bilgi katmanı ekleyerek bilgi bulgetir, makine çevirisi, bilgi ayıklama ve soru cevaplama gibi doğal dil işleme uygulamalarını geliştirmek için kapsamlı bir veri kümesini sunmayı amaçlar. Eklenen bu anlambilimsel katman ile verimliliği arttıran ve uygulama performansını geliştiren sözdizimsel ayrıştırıcı geliştirmeleri elde edilebilir. Bu çalışmada Türkçe tümce bankasının oluşturulması amaçlanmıştır. Bildiğimiz kadarıyla şu ana kadar Türkçe dilinde tümce bankası çalışması kapsamında birkaç çalışma yapılmıştır ve bu çalışma Türkçe dili için öncü niteliği taşıyacak bir çalışma olacaktır. Bu çalışmada el ile işaretlenmiş bir tümce bankası hazırlanmış, diğer çalışmalar incelenip, üretilen tümce bankası ile karşılaştırılmış, Türkçe için hem paralel cümle ağaçları kullanılarak hemde ağaç yapısında olmayan paralel cümleler ile otomatik tümce bankaları oluşturma incelenmiş ve otomatik tümce bankaları oluşturulmuştur.
PropBank is the bank of propositions which contains hand-annotated corpus for predicate-argument information and semantic roles or arguments. It aims to provide an extensive dataset for enhancing NLP applications such as information retrieval, machine translation, information extraction, and question answering by adding a semantic information layer to the syntactic annotation. Via the added semantic layer, syntactic parser re nements can be achieved which increases the efficiency and improves application performance. The aim of this thesis is to construct proposition bank for Turkish Language. Only preliminary studies were carried out in terms of Turkish PropBank. This study is one of the pioneers for the language. In this study, a hand annotated Turkish PropBank is constructed from the translation of the parallel English PropBank corpus, other PropBank studies for Turkish language examined and compared with the proposition bank constructed, automatic PropBank construction for Turkish from both parallel sentence trees and phrase sentences is analyzed and automatic proposition banks generated for Turkish.