Tez No İndirme Tez Künye Durumu
259038
Building a lexical functional grammar for Turkish / Türkçe için sözcüksel işlevsel gramer geliştirilmesi
Yazar:ÖZLEM ÇETİNOĞLU
Danışman: PROF. DR. KEMAL OFLAZER
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Dil bilgisi = Grammar ; Doğal dil işleme = Natural language processing ; Söz dizim = Syntax ; Söz dizimi çözümleyicisi = Syntax analyzer
Onaylandı
Doktora
İngilizce
2009
210 s.
Zengin yapısal gösterimli sonuçlar sunan büyük ölçekli derin gramerler, bir dilin dilbilimselolaylarını araştırmak için olduğu kadar bilgisayar insan etkileşimindeki karmaşıkaraçlar için de temel kaynaklardandır. Bu tezde, Türkçe için Sözcüksel İşlevsel Gramerkuramı içinde gerçeklenmiş büyük ölçekli bir gramer sunuyoruz.Büyük ölçekli bir gramer geliştirmek hem dilbilim hem de bilgisayar bilimleri açısından çözülmesi gereken bir çok konuyu beraberinde getirir. Çalışılan dil Türkçe olduğunda, zengin biçimbilimsel yapılar, gösterimin temelini oluşturmakta önemli bir rol oynar.Gramerimizi geliştirirken, dil olaylarını formel ve doğru bir şekilde ifade edebilmekamacıyla, biçimbirimlerden büyük ancak sözcüklerden de küçük yapıtaşları kullandık.Gerçeklediğimiz sistemde kurallar, sıfat, zarf, edat öbekleri gibi temel bileşenlerden,isim-fiiller, zarf-fiiller, sıfat-fiiller gibi daha karmaşık türemiş yapılara kadar geniş biralanı kapsamaktadır. İsim öbegi alt grameri sistemin esas bileşenidir. Cümle çeşitleri,serbest sözcük dizilişi, bağlaç öbekleri gramerimizin çözümlediği diğer önemli yapılardır.Ayrıca daha önce geliştirilmiş bir tarih-zaman çözümleyicisi de sistemimize eklenmiştir.Etken yapılar, edilgen yapılar, isim ve fiilden oluşan fiiller, ve ismin belirtme halinialmayan nesneler gibi sıklıkla karşılaştığımız dil olayları, teorik açıdan da önemlidirler.Bu yapıların önce dilbilmsel gösterimleri incelenmiş, sonra çeşitli testler yapılarak etkenyapılar ve ismin belirtme halini almayan nesnelerin farklı türleri ayrıntısıyla çözümlenmiştir.Daha sonra çözümlerin gerçeklenme detayları sunulmuştur.Gramerin değerlendirilmesi için gerçek metin belgeleri üzerinde testler yapılmıştır.Sonuçlar isim öbeklerinde %85.5 oranında başarım olduğunu göstermektedir. Sistemimiz,LingBrowser adlı araca da eklenmiştir.
Large-scale, deep grammars with structurally rich output are basic resources forcomplex tools in human-computer interaction and also for exploring the linguistic phenomenaof a language. In this thesis, we introduce a large scale grammar for Turkishimplemented in the Lexical Functional Grammar formalism.Developing a large scale grammar requires that several issues be solved, both linguisticallyand computationally. As the language to be dealt with is Turkish, richmorphological structures play an important role in constructing the basis of the representation.We follow an approach based on building units that are larger than amorpheme but smaller than a word, in encoding rules of the grammar to explain thelinguistic phenomena in a more formal and accurate way.Our implementation covers rules ranging from basic constituents such as adjective,adverbial, or prepositional phrases to more complex types with derivations such assentential complements, sentential adjuncts, and relative clauses. The noun phrasesubgrammar is the core of the system. Other important rules deal with several typesof sentence structures, free word order, and coordination. Also, a date-time grammardeveloped earlier is integrated into our system.Some of the frequently occuring phenomena, such as causatives, passives, noun-verbcompounds, and non-canonical objects, are also important from a theoretical perspective.We first examine their linguistic representation and then analyze the details ofdifferent types of causatives and non-canonical objects by conducting several tests. Wethen provide their implementation.To evaluate our grammar we have experimented with real world data. Resultsshow that we have a reasonably high coverage in noun phrases (85.5%). We have alsointegrated our system into a tool called LingBrowser.