Tez No |
İndirme |
Tez Künye |
Durumu |
245434
|
|
Türkçe için sözdizim tabanlı bir adıl çözümleme sistemi / A syntax-based pronoun resolution system for Turkish
Yazar:PINAR TÜFEKCİ
Danışman: DOÇ. DR. YILMAZ KILIÇASLAN ; YRD. DOÇ. DR. RAFET AKDENİZ
Yer Bilgisi: Trakya Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
Türkçe
2009
139 s.
|
|
Bu tez, sözdizim bilgisi kullanarak Türkçe'deki üçüncü kişi adıllarını çözümlemeye çalışan bir sistem sunar. Sistem, verilen bir metinde tümcelerin sadece sözdizim yapılarını kullanan Hobbs'un Naif Yaklaşımı (Hobbs, 1976, 1978) ile sözdizimsel kuram ve dil işleme modelleri içinde temel bir rol oynayan Chomsky'nin Bağlama Kuramına (Chomsky, 1981, 1995) dayanmaktadır. Algoritma, çeşitli metinlerden çıkartılmış, tümceler içeren bazı söylem parçacıklarına uygulanmıştır. Türkçe'deki üçüncü kişi adıllarını çözümlemek için oluşturulan bu model, derin söylem analizi yapmadan metinden çıkartılabilen basit sözdizimsel bilgi ve dünya bilgisini kullanmaktadır.Algoritma Hobbs'un Naif Algoritmasında olduğu gibi belirli bir dilbilgisi kuralları tarafından üretilmiş, ayrıştırma ağaçları biçimindeki tümcelere uygulanmaktadır. Algoritma, adılların olası aday öncüllerini kendi yerel alanları dışında, ilgili ayrıştırma ağaçları üzerinden giderek araştırmak için Chomsky'nin Bağlama Kuramı'ndan çıkartılmış sözdizimsel kısıtlamalarını kullanmaktadır. Tüm olası aday öncüller arasından en iyi öncülün belirlenmesinde önemli bir rol oynayan etkili bazı faktörler, bir kısıtlar ve tercihler listesi şeklinde tanımlanmıştır.Bu çalışmada önerilen sistem, iki farklı dayanak algoritması ve Türkçe için kişi adıl çözümlemesi yapan az bilgili bir sistem (Küçük ve Turhan-Yöndem, 2007) ile karşılaştırılmıştır. Asıl sistem, bu dayanak algoritmaları ve az-bilgili sisteme karşı, farklı kaynaklardan iki örnek metin üzerinde denenmiştir. Bu tezin temel amacı Bilgisayarlı Türkçe Adıl Çözümlemesi yapmak ve elde edilen sonuçları Türkçe için bu alanda yapılmış bir başka önemli çalışma olan az-bilgili sistem ile kıyaslayarak gelecek için bir tartışma başlatmaktır.
|
|
This thesis presents a system intended to resolve third personal pronouns in Turkish using syntactic information. The system is based on Hobbs? Naïve Algorithm (Hobbs, 1978), which exploits only the surface syntax of sentences in a given text and Chomsky?s Binding Theory (Chomsky, 1981, 1995), which has played a central role in both syntactic theory and models of language processing. The algorithm is applied to some discourse fragments which consist of sentences extracted from various texts. The model for third personal pronoun resolution in Turkish utilizes simple syntactic information, which can be extracted from the text without deep discourse analysis and world knowledge.The algorithm is applied to the sentences which are presented as parse trees produced by a particular grammar like that used in Hobbs? Naïve Algorithm. The algorithm focuses on syntactic restrictions which are derived from Chomsky?s Binding Theory to search for the possible candidate antecedents of the pronouns outside their local domain by traversing the relevant parse trees. Some effective factors, which come into play in order to determine the best antecedent among all possible candidates, are defined as a list of constraints and preferences.The system proposed in this study is compared with two different baseline algorithms and a knowledge-poor pronoun resolution system for Turkish (Kucuk and Turhan-Yöndem, 2007). The original system is tested against these baseline algorithms and the knowledge-poor system on two sample Turkish texts from different sources. Thus, the main goal of the study is to provide a computational implemented system for resolving third personal pronouns in Turkish and to compare the results produced by our syntax-based system with the knowledge-poor system, which is an another important work about the same topic for Turkish, and to start a discussion about it. |