Tez No İndirme Tez Künye Durumu
535871
Büyük ontolojilerin eşlenmesi için çizge tabanlı yaklaşımlar geliştirilmesi / Developing graph-based approaches for to match large ontologies
Yazar:FATMANA ŞENTÜRK
Danışman: DOÇ. DR. VECDİ AYTAÇ
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2019
118 s.
Ontolojiler, bir alanın özelliklerini, örnek verilerini içeren ve bu özellikler arasındaki ilişkileri açıklayan alana özgü meta verilerdir. Aynı alan içerisinde farklı isimlerde veya özelliklerde tanımlanabilmektedirler. Mevcut ontolojiler arasındaki benzerliklerin bulunması ve tanımlama kaynaklı farklılıkların ortadan kaldırılması ontoloji eşleme algoritmaları ile sağlanmaktadır. Ontoloji eşleme algoritmaları özellikle, veri entegrasyonu, mevcut ontolojilerin yeniden kullanımı ve bilgi çıkarımı gibi farklı amaçlar için kullanılmaktadır. Hızla artan veri boyutları ve bilgi teknolojilerinin gelişmesi ontolojilerin boyutlarının da büyümesine sebep olmuştur ve bu artış ontoloji eşleme algoritmalarının işletilmesini de zorlaştırmıştır. Ayrıca mevcut eşleme yöntemleri arasında ontolojileri yapısal olarak eşleyen algoritmaların az sayıda olması, çizge tabanlı ontoloji eşleme mimarileri geliştirilmesi fikrini desteklemektedir. Bu çalışmada, büyük ontolojilerin eşlenmesi için çizge tabanlı bir mimari önerilmiştir. Bu mimari ile, öncelikli olarak büyük ontolojilerin alt parçalara ayırılması daha sonra elde edilen alt parçaları çizge madenciliği algoritmalarını kullanarak eşlenmesi amaçlanmıştır. Ontolojilerin alt parçalara ayrılmasında, Karger algoritması ve Kümeleme Perkülasyonu algoritması kullanılmıştır ve her iki algoritma ontolojiler üzerinde ilk kez uygulanmıştır. Tez çalışmasının bir sonraki aşamasında ise, alt çizge madenciliği algoritmaları kullanılarak elde edilen bu alt parçalar eşlenmiştir. Çizge madenciliği algoritmaları olarak GraMi ve gSpan algoritmaları seçilmiş olup, ontoloji eşleme alanında ilk defa kullanılmışlardır. Önerilen mimari; AML ve Falcon-AO eşleme algoritmaları ile eşleme doğruluğu ve zaman performansı bakımından karşılaştırılmıştır. Elde edilen sonuçlara göre; GraMi algoritması, eşleme doğruluğu bakımından karşılaştırılan algoritmalardan daha iyidir.
Ontologies are domain-specific metadata that describes relationships between properties of a field, sample data, and properties developed for many different purposes. But, they can be described in different names or properties even within the same domain. Elimination of definition differences and finding the similarities between existing ontologies are provided by ontology matching algorithms. Ontology matching algorithms are used especially for data integration, reuse of ontologies and information extraction. Rapidly increasing data sizes and the development of information technologies have led to the growth of ontologies and so this development makes the ontology mapping algorithms difficult to work. Because of existing the small number of structural-based ontology matching algorithms among methods supports the idea of ​​developing graph-based ontology mapping architectures. In this study, a graph-based architecture was proposed to match large ontologies. With this architecture, it is primarily aimed to divide the large ontologies into small pieces and then matches them using sub-graph mining algorithms. Karger algorithm and clique percolation algorithm were used to divide large ontologies and both algorithms were applied to ontologies for the first time. In the next step of the thesis, these sub--parts obtained by using sub--graph mining algorithms are matched. GraMi and gSpan algorithms were selected as sub-graph mining algorithms and were first used in ontology matching field. The proposed model is compared to AML and Falcon-AO matching algorithms in terms of accuracy and time performance. According to obtained the results, it is seen that GraMi algorithm is better than matching algorithms for matching accuracy.