Ulusal Tez Merkezi

Tez No	İndirme	Tez Künye	Durumu
79323	Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.	An Information based approach to punctutation / Noktalamaya enformasyon modelli bir yaklaşım Yazar:BİLGE Danışman: PROF. DR. VAROL AKMAN Yer Bilgisi: İHSAN DOĞRAMACI BİLKENT ÜNİVERSİTESİ / MÜHENDİSLİK VE FEN BİLİMLERİ ENSTİTÜSÜ / BİLGİSAYAR BİLİMLERİ VE MÜHENDİSLİĞİ ANABİLİM DALI Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control Anahtar Kelime:Dil bilim = Linguistics ; Doğal dil işleme = Natural language processing ; Noktalama işaretleri = Punctuation marks	Onaylandı Doktora İngilizce 1998 112 s.

ÖZET NOKTALAMAYA ENFORMASYON TEMELLİ BİR YAKLAŞIM Bilge Say Bilgisayar ve Enformatik Mühendisliği Doktora Tez Yöneticisi: Prof. Dr. Varol Akman Kasım 1998 Yazılı dilin anlamsal ifadesinde noktalama işaretleri özel bir önem taşır. Geoffrey Nunberg'in yazılı cümlede noktalama işaretlerinin oluşturduğu metin grameri üzerine 1990 tarihli kitabı bu konudaki betimleyici ve buyurucu yaklaşımları birleştirmiştir. Bu yapıt yakın geçmişte Doğal Dil işleme (DDI) alanında noktalama işaretlerine yaklaşımların çoğuna esin kaynağı olmuştur. Daha sonra geliştirilen sözdizimsel ayrıştırıcılar çözümleme hata ve belirsizliklerinin noktalama işaretlerinin göz önüne alınmasıyla azaldığını göstermiştir. Keza Nunberg'in noktalama işaretlerinin (ve metin düzenleme araçlarının) sunumuna getirdiği yaklaşım doğal dil üretme dizgeleri tarafın dan değerlendirilmiştir. Ancak noktalama işaretlerinin anlamsal ve söylemsel etkileri ve bunların hesapsal kullanımı hakkında çok az çalışma yapılmıştır. Bu tezin amacı noktalama işaretlerinin anlamsal ve söylemsel yönlerini Hans Kamp ve Uwe Reyle"nin Söylem Gösterim Kuramını (SGK) (ve Nicholas Asher'in bunun üzerine geliştirdiği Bölümlü Söylem Gösterim Kuramını (BSGK)) kullanarak incelemek ve DDI dizgeleri için gerekli sonuçları çıkarmaktır. Uygulanan yöntem elektronik metinlerden dört yaygın noktalama işareti (uzun tire, noktalı virgül, iki nokta üstüste ve parentez) ile vıVII ilgili örüntüleri çıkararak, biçimsel bir model ve bilgisayarda küçük bir uygulama elde et mek olarak özetlenebilir. Gözlem ve sonuçlarımız anafora çözümleme ve varsayım gibi dil- bilimsel olguların noktalama işaretleri ile ilgisi hakkında ilginç bağlar ortaya çıkarmıştır. BSGK çerçevesinde bu örneklemeler genel söylem yapısına bağlanmıştır. Önerilen model DDİ için yazılım geliştirenlerin noktalama işaretlerini daha etkili kullanabilmesi için bir şablon olarak alınabilir. Tez genelde noktalamanın yazılı metin aracılığıyla okuyucuya aktarılan enformasyona yaptığı katkıyı betimlemektedir. Anahtar Sözcükler: Noktalama, Söylem, (Bölümlü) Söylem Gösterim Kuramı [(B)SGK]. Enformasyon Yapısı, Külliyat, Doğal Dil işleme (DDI)

ABSTRACT AN INFORMATION-BASED APPROACH TO PUNCTUATION Bilge Say Ph.D. in Computer Engineering and Information Science Supervisor: Prof. Varol Akman November 1998 Punctuation marks have special importance in bringing out the meaning of a text. Ge offrey Nunberg's 1990 monograph bridged the gap between descriptive treatments of punctuation and prescriptive accounts, by spelling out the features of a text-grammar for the orthographic sentence. His research inspired most of the recent work concentrat ing on punctuation marks in Natural Language Processing (NLP). Several grammars incorporating punctuation were then shown to reduce failures and ambiguities in pars ing. Nunberg's approach to punctuation (and other formatting devices) was partially incorporated into natural language generation systems. However, little has been done concerning how punctuation marks bring semantic and discourse cues to the text and whether these can be exploited computationally. The aim of this thesis is to analyse the semantic and discourse aspects of punctuation marks, within the framework of Hans Kamp and Uwe Reyle's Discourse Representation Theory (DRT) (and its extension by Nicholas Asher, Segmented Discourse Representa tion Theory (SDRT)), drawing implications for NLP systems. The method used is the extraction of patterns for four common punctuation marks (dashes, semicolons, colons. ivand parentheses) from corpora, followed by formal modeling and a modest computa tional prototype. Our observations and results have revealed interesting occurrences of linguistic phenomena, such as anaphora resolution and presupposition, in conjunction with punctuation marks. Within the framework of SDRT such occurrences are then tied with the overall discourse structure. The proposed model can be taken as a template for NLP software developers for making use of the punctuation marks more effectively. Overall, the thesis describes the contribution of punctuation at the orthographic sen tence level to the information passed on to the reader of a text. Keywords: Punctuation, Discourse, (Segmented) Discourse Representation Theory [(S)DRT]. Information Structure, Corpora, Natural Language Processing (NLP)