Tez No İndirme Tez Künye Durumu
698045
Kazakça'nın biçimbilimsel ve sözdizimsel analizi / Morphological and syntactic analysis of Kazakh
Yazar:ZÜLEYHA YİNER
Danışman: DOÇ. DR. ATAKAN KURT
Yer Bilgisi: İstanbul Üniversitesi-Cerrahpaşa / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2021
89 s.
Bu tezde Türki dillerden biri olan Kazakçanın biçimbilimsel (morfolojik) ve sözdizimsel analizi yapılmıştır. Tezin ilk aşaması olan biçimbilimsel analizde iki düzeyli morfoloji modeli kullanılmıştır. Bu modelde yazım kuralları iki düzeyli kurallar şeklinde yazılır ve dilin morfotaktik kuralları (dilde bulunan eklerin sıralamasını gösteren kurallar) Sonlu Durum Makinaları olarak kodlanır. Kazakçanın iki düzeyli morfolojisinin test edilmesi için dilden bağımsız ve açık kaynaklı morfolojik çözümleyici ve makine çevirisi sistemi olan Nüve kullanılmıştır. Kazakçanın biçimbilimsel çözümlemesi (morfolojik üretim ve analizi) web ortamına taşınarak kullanıcılara açık hale getirilmiştir (https://nuvestudio.com/). Tez çalışmasının ikinci adımında Kazakçanın sözdizimsel analizi yapılarak Kazakçanın grameri CFG (Context Free Grammar) kuralları ile ifade edilmiştir. Bu analiz sırasında Kazakçanın tüm cümle türleri ve kelime grupları (isim tamlaması, sıfat tamlaması, sıfat-fiil, isim-fiil, zarf-fiil vb.) ayrı ayrı çalışılmıştır. Daha sonra Kazakça gramer kuralları Nüve sözdizimsel çözümleyicisinde gerçeklenmiş ve test edilmiştir. Nüve sözdizimsel çözümleyicisi, verilen Kazakça bir cümleyi Kazakça gramer kurallarına göre ögelerine ayrıştırarak olası tüm çözümleri üretebilmekte ve üretilen çözümleri bir ağaç olarak görüntüleyebilmektedir. Kazakça gramer kurallarının testi için yaklaşık 1100 cümleden oluşan bir veri hazırlanmış ve veri setini bir bütün olarak test edebilme özelliği Nüve'ye bir modül olarak eklenmiştir.
In this thesis, the morphological and syntactic analysis of Kazakh, a Turkic languages, is studied. In the morphological analysis, which is the first part of the thesis, a two-level morphology model is used. In this model, orthographic rules are written as two-level rules and morphotactics rules (the rules that show the order of the suffixes) are encoded as Finite State Machines. Nuve, a language-independent and open-source morphological analyzer and machine translation system, is used to implement two-level morphology of Kazakh. The morphological generation and parsing of Kazakh language is made available on the web (https://nuvestudio.com/). In the second part of the thesis, the syntactic analysis of Kazakh language is studied and the grammar of Kazakh is expressed with CFG (Context Free Grammar) rules. In this analysis, all sentence types and word groups (noun complement, adjective complement, verbal adjective, verbal noun, verbal adverb etc.) of Kazakh are studied. Later Kazakh grammar rules are implemented and tested on Nuve syntactic analyzer. Nuve can generate all possible solutions of a given Kazakh sentence into its syntactic parts according to Kazakh grammar rules and display the solutions as trees. A dataset consisting of nearly 1100 sentences was prepared for testing of Kazakh grammar rules and a testing module was added to Nuve to testing dataset as a whole.