Tez No İndirme Tez Künye Durumu
625530
Automatic synset detection from Turkish dictinary using confidence indexing / Güven endeksi kullanılarak Türkçe sözlükten eş anlam kümelerinin otomatik tespiti
Yazar:ERHAN TURAN
Danışman: DOÇ. DR. UMUT ORHAN
Yer Bilgisi: Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2020
112 s.
In this study, a Turkish semantic network is designed from a non-machine-readable monolingual dictionary. Dictionary lemmas and definitions are extracted and processed into a Lemma-Sense weighted bipartite graph model and analyzed for semantic relations. Primary semantic relations of a general semantic network as hypernym, synonym and antonym analyzed based on Lemma-Sense dictionary and added to the semantic network at sense level. Synonym relations are tagged with a confidence level for an improved synset detection. Also, morpho-semantic relations added between the lemmas and their derived and compound lemmas. N-Gram analysis is used to find patterns of any additional semantic relation. These additional semantic relations are supplemented to the semantic network. Finally, synonyms are clustered to form the synsets with a spanning-tree based synset detection algorithm. Synset results are compared with an up-to-date and notable Turkish wordnet.
Bu çalışmada, bir Türkçe anlamsal ağı, bilgisayar okunabilirliği olmayan tek dilli sözlükten tasarlanmıştır. Sözlük madde başları ve tanımları ağırlıklı iki parçalı çizge modeline işlenmiş ve anlamsal ilişkiler açısından analiz edilmiştir. Genel anlamsal ağının üst anlamlı, eş anlamlı ve karşıt anlamlı olarak birincil anlamsal ilişkileri Madde Başı-Anlam sözlüğüne göre analiz edilmiş ve anlam düzeyinde anlamsal ağa eklenmiştir. Eş anlamlı ilişkiler, geliştirilmiş bir eş anlamlılar kümesi tespiti için bir güven seviyesi ile etiketlenir. Ayrıca, madde başları ile bu madde başlarından oluşturulmuş olan türemiş ve bileşik madde başları arasında biçim-anlamsal ilişkiler eklenmiştir. Ayrıca N-Gram analizi, herhangi bir ek anlamsal ilişkinin örüntülerini bulmak için kullanılmış ve örüntüleri bulunan ek anlamsal ilişkiler, anlamsal ağa eklenmiştir. Son olarak, eşanlamlılar, kapsayan ağaç tabanlı eş anlamlılar kümesi algılama algoritması ile eş anlamlılar kümesi oluşturmak için kümelenmiştir. Elde edilen eş anlamlılar kümesi, güncel ve kapsamlı bir Türkçe wordnet ile karşılaştırılmıştır.