Tez No İndirme Tez Künye Durumu
276627
Ontology based information extraction on free text radiological reports using natural language processing approach / Serbest metin radyoloji raporlarından, doğal dil işleme yaklaşımları kullanarak ontoloji temelli enformasyon çıkarımı
Yazar:ERGİN SOYSAL
Danışman: DOÇ. DR. İLYAS ÇİÇEKLİ ; PROF. DR. NAZİFE BAYKAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Sağlık Bilişimi Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Doğal dil = Natural language ; Doğal dil işleme = Natural language processing ; Ontoloji = Ontology ; Radyoloji = Radiology ; Türkçe = Turkish
Onaylandı
Doktora
İngilizce
2010
121 s.
Bu tez, serbest metin Türkçe radyoloji raporlarını işleyerek, var olan bilgiyi çıkartıp, yapılandırılmış bilgi modeline dönüştüren bir bilgi çıkarım sistemini tanımlar. Sistem, doğal dil işleme tekniklerini, bir alan ontolojisi ile birlikte kullanarak, sözel olarak yapılmış tanımlamaları hedef bilgi modeline çevirir ve böylece bilgi, bilgisayar tarafından işlenebilir hale getirilmiş olur. Geliştirilen alan ontolojisi, bilgi çıkarımı sırasında, varlık tanımlama ve ilişki çıkarılması aşamalarında etkili olarak kullanılmıştır. Ontoloji, çıkarım kurallarının tasarımında esneklik sağlar. Ontolojinin yapısı, çıkarılan semantik bilginin yapısın da tanımlayan bilgi modelini belirler. Ek olarak, ontoloji cümlelerde yer alması gereken, ancak, bilindiği var sayıldığı için ifade edilmeyen varlıkların saptanmasını sağlar. Bu tezin temel katkılarından biri, ontolojinin bilgi çıkarım kuralları içerisinde kullanılarak ifade gücünü artırması ve cümlelerdeki kayıp varlıkların saptanmasını sağlamasıdır. Sistem Türkçe metinler için geliştirilen ilk bilgi çıkarım sistemidir. Türkçe, morfolojik olarak zengin bir dil olduğu için, sistem bir morfolojik analizör kullanır ve çıkarım kuralları da bu morfolojik özelliklerden faydalanır. Sistem, performans değerlendirmesinde, %93 geri çağırma ve %98 duyarlık değerlerine ulaşmıştır.
This thesis describes an information extraction system that is designed to process free text Turkish radiology reports in order to extract and convert the available information into a structured information model. The system uses natural language processing techniques together with domain ontology in order to transform the verbal descriptions into a target information model, so that they can be used for computational purposes. The developed domain ontology is effectively used in entity recognition and relation extraction phases of the information extraction task. The ontology provides the flexibility in the design of extraction rules, and the structure of the ontology also determines the information model that describes the structure of the extracted semantic information. In addition, some of the missing terms in the sentences are identified with the help of the ontology. One of the main contributions of this thesis is the usage of ontology in information extraction that increases the expressive power of extraction rules and helps to determine missing items in the sentences. The system is the first information extraction system for Turkish texts. Since Turkish is a morphologically rich language, the system uses a morphological analyzer and the extraction rules are also based on the morphological features. TRIES achieved 93% recall and 98% precision results in the performance evaluations.