Tez No İndirme Tez Künye Durumu
409183
A study on alternative lexicalizations in Turkish discourse bank / Türkçe söylem bankasındaki bağlaçsıların çalışması
Yazar:FİKRET GÜNAY
Danışman: PROF. DR. DENİZ ZEYREK BOZŞAHİN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Bilişsel Bilim Ana Bilim Dalı
Konu:Dilbilim = Linguistics
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2015
77 s.
Söylem bağıntıları iki öğeyi birbirine bağlar ve bu iki öğe arasındaki ilişkiyi gösterir. Söylem bağıntıları gizli ya da açık olarak ifade edillir. Bu tezin amacı, Türkçe'de gizli söylem bağıntı çeşitlerinden biri olan bağlaçsıların Türkçe Söylem Bankası'nda derlem çalışmasıyla tespit edilmesi ve tanımlanmasıdır. Bu çalışma, bağlaçsı çeşitlerini ortaya çıkararak Türkçe'deki söylem kavramına katkıda bulunmaktadır. Bağlaçsıların tanımlanması için üç yöntem kullanılmıştır. a) Türkçe Söylem Bankası'ndaki (TSB) bağlaçsılar işaretlenmiştir. Bu aşamada, TSB'nin %10'unundan oluşan kısımda (20 dosya = yaklaşık 20000 kelime) bağlaçsılar işaretlenmiş ve bulunan bağlaçsılar tüm TSB'de işaretlenmiştir. Ayrıca, işaretlemelerin güvenilirliğini ölçmek için işaretleyiciler arası uyum hesaplanmıştır. b) Bağlaçsılar için sözlüksel ve sözdizimsel sınıflandırma yapılmıştır, Türkçe'deki bağlaçsılar üç gruba ayrılmıştır; kapalı, kısmen açık, açık bağlaçsılar. c) Açık bağlaçsı sayısı çok az olduğundan dolayı, daha çok açık bağlaçsının tanımlanması için bir Java kodu geliştirilmiştir. Bu yöntemlerle, toplam 94 tür/297 türce bağlaçsı tanımlanmıştır. Bu bağlaçsılar, Türkçe Söylem Bankası'ndaki işaretlemelerin atrmasına ve yeni araştırma alanlarına yol açacaktır.
Discourse relations connect two pieces of discourse and represent a relationship between these two arguments. Discourse relations can be expressed both explicitly and implicitly. The objective of the present thesis is to identify alternative lexicalizations (ALTLEXs) in Turkish (which is a type of implicit relations) in Turkish Discourse Bank, or TDB by means of a corpus-based approach. The thesis contributes to our understanding of Turkish discourse by revealing a set of ALTLEXs. Three methods are employed: a) An annotation process of ALTLEXs is undertaken in TDB. In this procedure, first, 10% of the entire TDB (20 files, approximately 20000 words) are doubly annotated; then, the discovered ALTLEXs are searched and annotated in the entire TDB. Inter-annotator agreement (IAA) is calculated to check the reliability of annotations. b) A lexico-syntactic classification of Turkish ALTLEXs is done, where the ALTLEXs are classified into three groups; i.e. the closed class, the partially open class, and the open ended category. c) Since the open-ended category had too few instances, an automatic extraction method is developed to extract more possible open-ended ALTLEXs. Using all these methods, the thesis finds a total of 94 types (297 tokens) of ALTLEXs in Turkish. This set of ALTLEXs will contribute to the enrichment of TDB with more annotations and help pave the way to new research.