Tez No İndirme Tez Künye Durumu
758409
Cross-level typing the logical form for open-domain semantic parsing / Açık alan anlambilimsel ayrıştırma için mantıksal forma düzeyler arası tür atanması
Yazar:İSMET ADNAN ÖZTÜREL
Danışman: PROF. DR. HÜSEYİN CEM BOZŞAHİN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Bilişsel Bilim Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Dilbilim = Linguistics
Dizin:Bilgisayarlı dil bilim = Computerized linguistics ; Derlem dil bilim = Corpus linguistics
Onaylandı
Doktora
İngilizce
2022
136 s.
Bu tez Söylem Gösterim Yapısı (SGY) anlam temsillerine tür atamak için yeni bir yaklaşım sunmaktadır. Dilbilimsel analiz açısından, kullandığımız tür atama yöntemi, geleneksel olarak farklı katmanlara ait olduğu düşünülen görüngülerin temsilini aynı analiz düzeyinde bir araya getirmektedir. Tezde, sözcük altı, sözcük, tümce ve söylem düzeyindeki olguların (zaman kipi, sözcük anlamı, adlandırılmış ̧ varlık sınıfı, tematik rol ve retorik yapı gibi) yüzey oluşumlarının aynı tür kategoriye ait deg ̆erlerin varyasyonları olarak temsil edilebileceğini ileri sürmekteyiz. Yaklaşımımızın Doğal Dil Anlama görevlerinden biri olan anlamsal ayrıştırma bağlamında, Birleşenli Ulamsal Dilbilgisi kullanarak, hesaplamalı modellemeye ilişkin etkilerini göstermekteyiz. Düzeyler arası tür atanmış ̧ mantıksal formların, sıkıştırılmış sözlük temsilleri sağladığını ve yalnızca sözdizimsel ayrıştırmada kullanılan Süper Etiketleme gibi arama alanını kısıtlayan görevlerin anlamsal analizin bir parçası olarak biçimlendirilmesine yardımcı olduğunu sunmaktayız. Ayrıca, önceden eğitilen modellerde mantıksal formların maskelenmesine dayanan bir hedef kullanmanın yeniden kullanılabilir sözcük temsilleri elde etmedeki etkinliğini göstermekteyiz. Sonuçlarımız, Transformer gibi bir kodlayıcı-kod çözücü modelin gömme katmanının sunduğumuz hedef kullanılarak önceden eğitilmis ̧ bir modelden damıtılmış ̧ ağırlıklarla başlatılmasının, açık alan metinlerinin SGY'ye ayrıştırılmasında model performansını arttırdığını göstermektedir.
This thesis presents a novel approach to assigning types to expressive Discourse Representation Structure (DRS) meaning representations. In terms of linguistic analysis, our typing methodology couples together the representation of phenomena at the same level of analysis that was traditionally considered to belong to distinctive layers. In the thesis, we claim that the realisation of sub-lexical, lexical, sentence and discourse-level phenomena (such as tense, word sense, named entity class, thematic role, and rhetorical structure) on the surface can be represented as variations of values that belong to the same typed category within our cross-level typing technique. We show the implications of our approach on the computational modelling of natural language understanding (NLU) using Combinatory Categorial Grammar, specifically in the context of one of the core NLU tasks, semantic parsing. We present that cross- level type-assigned logical forms deliver compact lexicon representations and help re-formalise search space constraining tasks, such as Supertagging, as part of the semantic analysis, whereas such approaches were only used in syntactic parsing. We empirically demonstrate the effectiveness of using a training objective that is based on masking the typed logical forms in pre-training models to obtain re-usable lexical representations. Our results indicate that improved model performance on parsing open-domain text to DRS is possible when the embedding layer of an encoder-decoder model such as Transformer is initialised with weights that are distilled from a model that is pre-trained using our objective.