Tez No İndirme Tez Künye Durumu
385057
A TV content augmentation system exploiting rule based named entity recognition method / Kural tabanlı varlık ismi tanıma yöntemi kullanarak televizyon içeriğini zenginleştirme sistemi
Yazar:YUNUS EMRE IŞIKLAR
Danışman: PROF. DR. FEHİME NİHAN ÇİÇEKLİ
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2014
96 s.
Bu tezde, kural tabanlı varlık ismi tanıma yönteminden yararlanan bir televizyon içeriği zenginleştirme sistemi önerilir. Sistem televizyon programlarının içeriklerini, bağlamla ilgili verileri alarak, otomatik olarak artırmaya ve bunları kullanıcılara başka bir cihaz ihtiyacı olmaksızın sunmaya çalışır. Sistemin kavramsal tanımının yanı sıra, bir prototip uygulaması geliştirilmiş ve önceden tanımlanmış televizyon kanalları ile birlikte gösterilmiştir. Uygulama kişi, yer, organizasyon gibi varlık isimlerini çıkarmak için web kaynaklarından taranmış elektronik program rehberi bilgisinden faydalanır. Bu amaçla, Türkçe için kural tabanlı bir varlık ismi tanıma algoritması geliştirilmiştir. Semantik anlam ayrımından sonra, çıkarılan varlık isimlerinin detaylı bilgisi Vikipedi'den bulup getirilir ve özet hali kullanıcıya gösterilir. Kural tabanlı varlık ismi tanıma algoritmasının performansını ve televizyon içeriği zenginleştirme sisteminin davranışını değerlendirmek için iki farklı veri seti üzerinde bir dizi deney yürütülmüştür. Deney sonuçları, varlık ismi tanıma yöntemleriyle beraber içerik zenginleştirme sisteminin özellikle haber ve dizi yayınlayan kanallarda oldukça başarılı olduğunu göstermektedir. Anahtar Kelimeler: İçerik Zenginleştirme, İnternet Bağlantılı Televizyonlar, EPG (Elektronik Program Rehberi), Varlık İsmi Tanıma (NER), Semantik Anlam Ayrımı
In this thesis, a TV content augmentation system taking the advantage of named entity recognition methods is proposed. The system aims to automatically enhance TV program contents by retrieving context related data and presenting them to the viewers without any necessity of another device. In addition to conceptual description of the system, a prototype implementation is developed and demonstrated with predefined TV programs. The implementation utilizes Electronic Program Guide (EPG) data of programs crawled from web resources in order to extract named entities such as person names, locations, organizations, etc. For this purpose, a rule based Named Entity Recognition (NER) algorithm is developed for Turkish texts. Detailed information about the extracted entities is retrieved from Wikipedia after semantic disambiguation and its summarized form is presented to the users. A set of experiments have been conducted on two different data sets in order to evaluate the performance of the rule based NER algorithm and the behavior of the TV content augmentation system. The experimental results show that the content augmentation with NER methods is quite successful in TV domain especially for channels broadcasting news and series. Keywords: Content Augmentation, Connected TV, EPG (Electronic Program Guide), Named Entity Recognition (NER), Semantic Disambiguation