Tez No İndirme Tez Künye Durumu
255312
An ILP-based concept discovery system for multi-relational data mining / Çok ilişkili veri madenciliği için tümevaran mantıksal programlama tabanlı konsept tanımlama sistemi
Yazar:YUSUF KAVURUCU
Danışman: YRD. DOÇ. DR. PINAR ŞENKUL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2009
136 s.
Yapısal kümelerde problem tanımlamalarını tek bir bağıntı ile yapmanıngetirdiği sınırlamalar ve verileri ilişkisel veri tabanlarında saklamaeğilimine bağlı olarak, Çok İlişkili Veri Madenciliği popülerhale gelmiştir. Bununla birlikte, bilgi örüntüleri birden fazla ilişkiiçermeye başladıkça, olası örüntü arama uzayı kolay işlenemeyecek kadarbüyümüştür. Söz konusu problemi çözmek için, farklı arama stratejileri,varsayımları ve örüntü dil kısıtları kullanan birçok çok-ilişkili bilgiçıkaran sistem geliştirilmiştir.Bu tezde, Tümevaran Mantık Programlama (TMP) tabanlı konsept bulmasistemleri çalışılmış ve TMP ile APRIORI tekniklerini kullanan bir hibridmetodoloji baz alınarak Doğruluk-tabanlı Konsept Bulma ve KonseptKural Tümevarım Sistemi isimli iki sistem anlatılmıştır.Doğruluk-tabanlı Konsept Bulma ve Konsept Kural Tümevarım Sistemimetotlarındaki asıl amaç, katı bildirim kısıtları ve kullanıcı-tanımlıözellikleri gevşetmektir. Ayrıca, bu yeni metod doğrudan ilişkiselveritabanları üzerinde çalışmaktadır. Buna ek olarak, ilişkisel veritabanlarıaçısından yapılan geleneksel doğruluk tanımı, Kapalı Dünya Varsayımınıbirinci-derece mantıkla açıklamak için modifiye edilmiştir. Geliştirilmiştanım üzerinde yeni bir doğruluk-tabanlı budama metodu APRIORI örüsüneuygulanmıştır. Ayrıca, arama uzayındaki kalıpların kalitesini açıklamak için,yeni bir hipotez değerlendirme kriteri kullanılmıştır. Buna ilave olarak,geliştirilmiş genelleme metodu kullanılarak KonseptKural Tümevarım Sistemi algoritmasında üretilen kuralkalitesi iyileştirilmiştir.Sonuç olarak, önerilen metodun literatürdeki benzer sistemlere oranlaperformansını doğruluk ve kapsama açısından değerlendirmek maksadıyla,gerçek problemler üzerinde bazı deneyler yapılmıştır.
Multi Relational Data Mining has become popular due to thelimitations of propositional problem definition in structureddomains and the tendency of storing data in relational databases.However, as patterns involve multiple relations, the search spaceof possible hypothesis becomes intractably complex. In order tocope with this problem, several relational knowledge discoverysystems have been developed employing various search strategies,heuristics and language pattern limitations.In this thesis, Inductive Logic Programming (ILP) based conceptdiscovery is studied and two systems based ona hybrid methodology employing ILP and APRIORI, namelyConfidence-based Concept Discovery and Concept Rule InductionSystem, are proposed.In Confidence-based Concept Discovery and Concept Rule InductionSystem, the main aim is to relax the strong declarative biasesand user-defined specifications. Moreover, this new method directly workson relational databases. In addition to this, the traditional definitionof confidence from relational database perspective is modified to expressClosed World Assumption in first-order logic. A new confidence-basedpruning method based on the improved definition is applied in the APRIORIlattice. Moreover, a new hypothesis evaluation criterion is used for expressingthe quality of patterns in the search space. In addition to this, in ConceptRule Induction System,the constructed rule quality is further improved by using an improvedgeneralization metod.Finally, a set of experiments are conducted on real-world problemsto evaluate the performance of the proposed method with similar systemsin terms of support and confidence.