Tez No İndirme Tez Künye Durumu
526854
Varlık bağlama sisteminin dizi öğrenme yöntemi ile bilgi tabanı kullanılarak geliştirilmesi / Developing entity linking system with sequence learning by using knowledge bases
Yazar:EMRAH İNAN
Danışman: PROF. DR. OĞUZ DİKENELLİ
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2018
109 s.
Son zamanlardaki Toplu Varlık Bağlama çalışmaları genellikle, anlamsal gömme ve çizge tabanlı yaklaşımlar kullanarak aynı metinde yer alan tüm eşlenmiş varlıkların küresel tutarlılığını sağlamaya çalışmaktadır. Çizge tabanlı yaklaşımlar başarılı sonuçlar gösterse de dayandıkları genel veri kümeleri için hesaplama açısından uzun süreli yaklaşımlardır. Ayrıca, anlamsal gömmeye dayanan çalışmalar dizileri düşünmeden sadece varlık çiftleri arasındaki ilişkiyi dikkate almaktadır. Bu tez kapsamında, bahsedilen problemlerin üstesinden gelebilmek için iki aşamalı bir yapay sinir modeli kullanarak ele alınmaktadır. İlk olarak, kolay söz-varlık çiftlerini eşleştirip, daha yakın atıfa sahip aday varlıkları filtrelemek için bu çiftin alan bilgisi kullanılmaktadır. İkinci aşamada iki taraflı Uzun Kısa Süreli Bellek ve küresel varlık anlamsızlığı için dikkat mekanizması kullanarak daha fazla anlam karmaşıklığı olan atıf-varlık çiftleri çözülmektedir. Bu tez kapsamında önerilen sistem oluşturulan alana özgü değerlendirme veri kümelerinde modern teknoloji sistemlerden daha iyi performans göstermektedir.
Recent collective Entity Linking studies usually promote global coherence of all the mapped entities in the same document by using semantic embeddings and graph-based approaches. Although graph-based approaches are shown to achieve remarkable results, they are computationally expensive for general datasets. Also, semantic embeddings only indicate relatedness between entity pairs without considering sequences. In this paper, we address these problems by introducing a two-fold neural model. First, we match easy mention-entity pairs and using the domain information of this pair to filter candidate entities of closer mentions. Second, we resolve more ambiguous pairs using bidirectional Long Short-Term Memory and attention mechanism for the global entity disambiguation. Our proposed system outperforms state-of-the-art systems on the generated domain-specific evaluation dataset.