Tez No İndirme Tez Künye Durumu
177358
Türkçe derlemlerdeki artgönderimlerin tümdengelimli ve tümevarımlı yöntemlerle çözümlenmesi / Resolving anaphora in Turkish text using inductive and deductive methods
Yazar:SAVAŞ YILDIRIM
Danışman: YRD. DOÇ. DR. YILMAZ KILIÇASLAN
Yer Bilgisi: Trakya Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Bilim ve Teknoloji = Science and Technology
Dizin:
Onaylandı
Doktora
Türkçe
2008
122 s.
Bu tez çalışmasında Türkçe Artgönderim Problemi çeşitli yaklaşımlar ışığında ele alınmıştır. Bilgi tabanlı tümdengelimli yöntemlerle, öğrenme tabanlı tümevarımlı yöntemler birbirleriyle çeşitli açılardan karşılaştırılmıştır. Belirginlik Tabanlı yaklaşım ile Merkezleme Algoritması, bilgi tabanlı yöntemleri değerlendirmek için ele alınmıştır. Makine Öğrenme algoritmalarından karar ağaçları, na\"ive Bayes algoritması, k-en yakın komşu algoritması, Destek Vektör makineleri ve algılayıcılar artgönderim problemine uygulanmıştır. Bazı Türkçe metinlerdeki artgönderimsel ilişkiler bilgisayarlı bu modellerle az bilgi kullanılarak çözümlenmiş ve deney sonuçlarına dayanarak birçok bulgu sunulmuştur. Bu alanda Türkçe için yapılan çalışmaların azlığı sebebiyle araştırmacılar tarafından kullanılan ortak bir derlem bulunamamıştır. Bu nedenle 10000 kelime kapasiteli 1114 adıl içeren bir derlem yaratılmıştır. Çeşitli deneylerle bu derlem üzerindeki gönderimsel ilişkilerin davranışı analiz edilmiştir. Deney sonuçlarını değerlendirebilmek için derlemdeki gönderimsel ilişkiler elle işaretlenmiştir. Kapsam olarak adılsal artgönderim, dönüşlü artgönderim, boş artgönderim ve karşlılıklı artgönderim tipleri ele alınmıştır. Bu tezin temel amacı Türkçe \textbf{Artgönderim Çözümlemesi} için az bilgili ve bilgisayarlı yaklaşımlar sunmak, bu yaklaşımları birbirleriyle kıyaslamak ve bu problemin bilgisayarlı çözümlenmesi için bir tartışma başlatmaktır.
In this study, the problem of anaphora resolution in Turkish is addressed in the light of various approaches. Knowledge-based deductive methods and learning-based inductive methods are compared from various points of view. The salience-based approach and the centering algorithm are chosen as examples of knowledge-based methods to evaluate. Of machines learning algorithms, decision trees, the na\"ive Bayes algorithm, the k-nearest neighbor classifier, support vector machines, and the voted perceptron are chosen and applied to the problem of anaphora resolution. Anaphoric relations in some Turkish texts are resolved by means of these computational techniques in a knowledge-poor framework and numerous findings are presented as results of the experiments.Since there is no publicly released corpus on which we can conduct our experiment, we needed to create a Turkish corpus- with the capacity of 10000 tokens and of 1114 pronouns- in which anaphoric relations are mannually annotated. Pronominal anaphora, reflexive anaphora, null pronoun, and reciprocals are in the scope of this study. So, main goal of the study is to provide a computational resolution for the turkish language, to compare deductive and inductive approaches, and to start a discussion about the problem.