Bu tezde Türki dillerden biri olan Kazakçanın biçimbilimsel (morfolojik) ve sözdizimsel analizi yapılmıştır. Tezin ilk aşaması olan biçimbilimsel analizde iki düzeyli morfoloji modeli kullanılmıştır. Bu modelde yazım kuralları iki düzeyli kurallar şeklinde yazılır ve dilin morfotaktik kuralları (dilde bulunan eklerin sıralamasını gösteren kurallar) Sonlu Durum Makinaları olarak kodlanır. Kazakçanın iki düzeyli morfolojisinin test edilmesi için dilden bağımsız ve açık kaynaklı morfolojik çözümleyici ve makine çevirisi sistemi olan Nüve kullanılmıştır. Kazakçanın biçimbilimsel çözümlemesi (morfolojik üretim ve analizi) web ortamına taşınarak kullanıcılara açık hale getirilmiştir (https://nuvestudio.com/). Tez
çalışmasının ikinci adımında Kazakçanın sözdizimsel analizi yapılarak Kazakçanın grameri CFG (Context Free Grammar) kuralları ile ifade edilmiştir. Bu analiz sırasında Kazakçanın tüm cümle türleri ve kelime grupları (isim tamlaması, sıfat tamlaması, sıfat-fiil, isim-fiil, zarf-fiil vb.) ayrı ayrı çalışılmıştır. Daha sonra Kazakça gramer kuralları Nüve sözdizimsel çözümleyicisinde gerçeklenmiş ve test edilmiştir. Nüve sözdizimsel çözümleyicisi, verilen Kazakça bir cümleyi Kazakça gramer kurallarına göre ögelerine ayrıştırarak olası tüm çözümleri üretebilmekte ve üretilen çözümleri bir ağaç olarak görüntüleyebilmektedir. Kazakça gramer kurallarının testi için yaklaşık 1100 cümleden oluşan bir veri hazırlanmış ve veri setini bir bütün olarak test edebilme özelliği Nüve'ye bir modül olarak eklenmiştir.
|
In this thesis, the morphological and syntactic analysis of Kazakh, a Turkic languages, is studied. In the morphological analysis, which is the first part of the thesis, a two-level morphology model is used. In this model, orthographic rules are written as two-level rules and morphotactics rules (the rules that show the order of the suffixes) are encoded as Finite State Machines. Nuve, a language-independent and open-source morphological analyzer and machine translation system, is used to implement two-level morphology of Kazakh. The morphological generation and parsing of Kazakh language is made available on the web (https://nuvestudio.com/). In the second part of the thesis, the syntactic analysis of Kazakh
language is studied and the grammar of Kazakh is expressed with CFG (Context Free Grammar) rules. In this analysis, all sentence types and word groups (noun complement, adjective complement, verbal adjective, verbal noun, verbal adverb etc.) of Kazakh are studied. Later Kazakh grammar rules are implemented and tested on Nuve syntactic analyzer. Nuve can generate all possible solutions of a given Kazakh sentence into its syntactic parts according to Kazakh grammar rules and display the solutions as trees. A dataset consisting of nearly 1100 sentences was prepared for testing of Kazakh grammar rules and a testing module was added to Nuve to testing dataset as a whole. |