Tez No |
İndirme |
Tez Künye |
Durumu |
178147
|
|
Türkçe metinlerdeki anlam belirsizliği olan sözcüklerin bilgisayar algoritmaları ile anlam belirginleştirmesi / Sense disambiguation of ambiguous words in Turkish texts by machine learning algorithms
Yazar:ZEYNEP ORHAN
Danışman: DOÇ. DR. SABRİ ARIK
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Anlam bilim = Semantics ; Doğal dil işleme = Natural language processing ; Öğrenme algoritmaları = Learning algorithms
|
Onaylandı
Doktora
Türkçe
2006
138 s.
|
|
Sözcük anlamı belirginlestirme, anlam belirsizliği olan sözcüğün belirli bir kullanımalanında en uygun anlamının kullanıldığı tümcedeki diğer elemanları da göz önünealarak belirlenmesi islemidir.Bu çalısmada, Türkçe metinlerde anlam belirsizliği olan sözcüklerin anlamlarınınbelirginlestirilmesini sağlayacak en uygun algoritmaların ve özelliklerin belirlenmesi elealınmıstır. Türkçe için SAB çalısmalarında kullanılabilecek sözcükler ve anlam sınıflarıolusturulmus, algoritmalarda kullanılacak metinlerin elle isaretlenmesi gerçeklestirilmisve kavramsal bir sözlük hazırlanarak bu alanda yapılacak arastırmalara önemli birkatkıda bulunulmustur.?lk bölümlerde öncelikle doğal dil isleme çalısmaları genel olarak ele alınmıs ve bunaparalel olarak Türkçe doğal dil isleme çalısmaları hakkında bilgi verilmistir. Doğal dilislemede SAB uygulama alanları, kullanılan bilgi tipleri ve kaynakları, uygulananyöntemler ve karsılasılan problemler incelenmistir. Çalısma ile yakından iliskili olanSenseval projesinin amacı, uygulamaları ve elde edilen sonuçları ayrıntılı olarakirdelenmistir.Yapılan çalısmanın asamaları içerisinde Türkçe için derleme metin seçimi, sözcükanlamlarının olusturulması, sözcük anlamlarına etki eden özelliklerin seçimi, kullanılanyöntemler, yazılımlar ve değerlendirme kriterleri hakkında bilgi verilmistir.Son üç yıl içerisinde çalısmanın bütün asamalarında elde edilen sonuçlar grafikler vetablolar seklinde sunulmustur. En son bölümde sonuçların ifade edildiği veyorumlandığı, gelecekte yapılabilecek yeni çalısmalar üzerinde durulduğu genel birdeğerlendirme bulunmaktadır.
|
|
Word sense disambiguation is the process of selecting the most suitable sense of anambiguous word in the given sentence by considering the other contextual featuresIn this study, determination of the most convenient algorithms and features that maylead to the successful disambiguation of the ambiguous words in Turkish texts havebeen discussed. Ambiguous words and their sense classifications that can be used forTurkish word sense disambiguation studies have been established, a limited ontologyhas been prepared and by providing manually sense tagged corpora, an importantcontribution has been achieved for the researches in this domain.In the first chapters of the thesis, a brief introduction for natural language processinghas been given and in parallel to this topic, important work on Turkish have beensummarized. Then, the application areas of word sense disambiguation in naturallanguage processing, knowledge types and sources, approaches in the literature and theproblems of word sense disambiguation have been examined in the following sections.The objectives, applications and the results of the Senseval project, which is closelyrelated to the thesis topic, have been exhaustively scrutinizedCorpora selection, sense classification, effective features determination, testedalgorithms, software and evaluation criterion that have been utilized during the phasesof the study have been explained.The results obtained in the last three years from all phases of the study have beenpresented by graphics and tables. In the last section, a general evaluation and conclusionhave been provided for commenting on the results and future work. |