Tez No İndirme Tez Künye Durumu
720693
Özbekçe'nin biçimbilimsel ve sözdizimsel çözümlemesi ve Özbekçe-Türkçe makine çevirisi sistemi / A morphological and syntactic analysis of Uzbek and an Uzbek-Turkish morphological machine translation system
Yazar:AHMET ERALP KÜÇÜK
Danışman: DOÇ. DR. ATAKAN KURT
Yer Bilgisi: İstanbul Üniversitesi-Cerrahpaşa / Lisansüstü Eğitim Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Biçimbilimsel işlemleme = Morphological processing ; Doğal dil işleme = Natural language processing ; Söz dizimi çözümleyicisi = Syntax analyzer
Onaylandı
Doktora
Türkçe
2022
145 s.
Bu tezde, doğal dil işlemenin konularından biçimbilimsel çözümleme, biçimbilimsel belirsizlik giderme ve sözdizimsel çözümleme üzerine Özbekçe için çalışmalar yapılmıştır. Bu çalışmada önerilen yöntemlerin uygulama ve testleri çalışma kapsamında geliştirilen ve düzenlenen uygulama araçlarıyla tamamlanmıştır. Özbekçenin biçimbilimi (morfolojisi), iki düzeyli yazım kuralları ve sonlu durum makineleri ile ifade edilmiştir. Özbekçenin iki düzeyli morfolojisi bu tez için geliştirilen Nuve Studio (www.nuvestudio.com) ile test edilerek uygulaması yapılmıştır. Biçimbilimsel çözümleme sonrası ortaya çıkan belirsizlik durumlarının çözümlenmesi için yinelemeli sinir ağı modeli kullanan bir yöntem ile Özbekçenin biçimbilimsel belirsizlik giderme konusu araştırılıp, uygulaması yapılmıştır. Özbekçenin biçimbilimsel çözümlemesi ve belirsizlik giderme sonrasında elde edilen veri seti kullanılarak, sözdizimsel çözümlemesi yapılmıştır. Sözdizimsel çözümleme kapsamında Özbekçe grameri bağlamdan bağımsız gramer kuralları ile ifade edilmiştir. Cümle yapıları, kelime grupları ve gramer kuralları kullanılarak bu çalışma için geliştirilen Nuve Parser ile uygulama ve testleri yapılmıştır. Özbekçenin biçimbilimsel çözümlemesi, biçimbilimsel belirsizlik giderme ve sözdizimsel çözümlemesinde bu tez için hazırlanan 30.000 kelimeden oluşan bir veri seti kullanılarak, tekniğin bilinen durumuna göre kabul edilebilir sonuçlar sağlanmıştır.
In this thesis, morphological analysis, morphological disambiguation and syntactic analysis which are the subjects of natural language processing have been studied for Uzbek. In this study the proposed methods have been completed via the application tools developed and modified within the scope of the study. Uzbek morphology is described with two level orthography rules and finite state machines. Two level morphology of Uzbek is tested and applied via Nuve Studio (www.nuvestudio.com) which is developed for this thesis. Morphological disambiguation is required after morphological analysis which produce more than one morphological analysis for a word. Morphological disambiguation of Uzbek has been investigated and applied with a method which uses recurrent neural network model. Syntactic analysis of Uzbek language is implemented by using dataset which is obtained after morphological analysis and disambiguation. Uzbek grammar is expressed with context free grammar rules. The application and tests are made with Nuve Parser which is developed for this study by using Uzbek sentence strucutres, word groups and grammatical rules. In the morphological analysis, morphological disambiguation and syntactic analysis of Uzbek, acceptable results are obtainened according to state-of-the art by using a dataset consists of 30.000 words prepared for this thesis.