Tez No İndirme Tez Künye Durumu
A computational model for anaphora resolution in Turkish based on the centering theory / Türkiye için merkezleme tabanlı anafor çözümlemesi yapan bilgisayısal bir model
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Yüksek Lisans
103 s.
TÜRKÇE İÇİN MERKEZLEME TABANLİ ANAFOR ÇÖZÜMLEMESİ YAPAN BİLGİSAYISAL BİR MODEL ÖZET Bu çalışmada Türkçe cümlelerdeki bazı adılların işaret ettiği varlıkların tespit edilmesini sağlayan bir bilgisayısal model dizayn edilmiştir. Bu modelin geliştirilmesinden önce konuya ilişkin Türkçe Dili üzerine yapılan buluş ve çalışmalar üzerine yoğun bir araştırma yapılmıştır. Yapılan araştırmalar neticesinde böyle bir uygulama için kullanılabilecek bir yaklaşım olarak Merkezleme Teorisine dayalı bir algoritma temel olarak seçilmiştir. Bu yaklaşımı temel alan bu uygulamanın üreteceği sonuçların gözlemlenmesi amacıyla modeli oluşturan modüllerin bir çoğu da gerçeklenmiştir. Bu teori genel olarak cümleler içerisindeki baskın varlıkların belirli kurallarla bir sonraki cümleye taşındığını iddia eder. Bu teoriyi temel alan yaklaşımda, cümle içerisindeki adıllar, önceki cümlelere taşınan bu baskın varlıkları işaret etmektedir. Merkezleme teorisi cümleler içerisinde varlık belirten ifadeler arasında bir üstünlük hiyerarşisine ihtiyaç duyduğundan, böyle bir hiyerarşinin kullanılan dil için belirlenmesi gerekir. Bu nedenle bu yaklaşımı temel alan önceki çalışmalarda ortaya atılan hiyerarşilerin Türkçe Dili için uygunluğu çeşitli deneylerle test edilmiştir. Bunun yanı sıra bu yaklaşımı temel almayan ancak benzer konularda baskınlığı inceleyen başka çalışmaların da bu amaç için kullanılabilirliği de incelenmiştir. Elde edilen ilk sonuçlarda tam bir uygunluk sağlayan hiyerarşi bulunamadığından bu çalışma içerisinde üstünlüğü belirleyecek bir hiyerarşi önerilmiş ve bu hiyerarşi üzerine el yordamıyla hazırlanmış veriler üzerinde bazı testler uygulanmıştır. Elde edilen son veriler incelendiğinde önerilen hiyerarşinin tatmin edici sonuçlar ürettiği gözlemlenmiştir. Önerilen bu hiyerarşi tasarlanan modelin gerçeklenen modülleri içerisinde kullanılarak, Türkçe için adıl çözümlemesi yapan bir uygulama geliştirilmiştir. Genel olarak, tasarlanan bu uygulama modüler yapıda olduğundan daha sonradan geliştirilmeye uygundur. Ayrıca temelinde çok detaylı bilgileri ele almaya uygun olarak tasarlanan veri tabanı yapısı sayesinde, uygulamanın daha sonra sadece Anaphora Resolution değil başka alanlarda yapılacak dilbilim çalışmalarında da kullanılmaya uygun halde olduğu düşünülebilir.
A COMPUTATIONAL MODEL FOR ANAPHORA RESOLUTION IN TURKISH BASED ON THE CENTERING THEORY ABSTRACT In this study, a computational model which provides defining the pronouns and their antecedents in previous sentences is designed. Before designing the model, an intensive research on especially Turkish studies, theories and linguistic findings has been completed. As a result of these reseaches, an algorithm based on the Centering Theory has been thought suitable to use in this application. For the purpose of observing the results, many of the modules form the application have been implemented. In general, The Centering Theory claims that the salient entities are carried to the next sentences in a discourse. A new approach which bases on this theory, claims that pronouns in the sentences actually references to more salient antecedents which are located in previous sentences. Since the Centering Theory needs an hierarchy to define the salience factor between the entities, it should be presented for the natural language to be used. For this reason, the suitability of the presented hierarchies for Turkish based on this approach has been tested by a number of experiments. On the other hand, some other approaches which are not based on this approach but tries to define another type of hierachies has also been tested whether they can be used in this aspect. Since the sufficient success could not be achieved from the results of these tests, a new hierarchy is suggested and tested on a number of manually prepared data. Having the final results, it is observed that the hierachy is completed the sufficient evaluations. Using this hierarchy in the completed modules, an application has been developed for Anaphora Resolution on Turkish Language. Since the general structure of this model is modular, it is able to be improved easily. And also, it can be thought that the application can be used on some applications that are different than the anaphora resolution since the basic database is constructed with very detail segments. XI