Tez No İndirme Tez Künye Durumu
285076
Semantik bilginin analizi ve modellenmesi / Analysis and modeling of semantic information
Yazar:SELMA TEKİR
Danışman: DOÇ. DR. AHMET KOLTUKSUZ ; PROF. DR. ŞABAN EREN
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Eğrilik = Curvature ; Jeodezik = Geodesic ; Manifoldlar = Manifolds
Onaylandı
Doktora
Türkçe
2010
94 s.
Bilgi, insanın nitel ve nicel gözlemler sonucunda doğrudan elde ettiği veri ve/veya bu veriyi işleyerek, analiz ederek dolaylı ve/veya dolaysız olarak ulaştığı sonuçlar ve kanılardır. Yapılan analizin niteliği, bilginin soyutlama seviyesini belirler. Semantik analiz, doğrudan ölçülebilen bilgi niteliklerinden dolaylı, daha üst seviyede yer alan bilgi niteliklerine erişilmesini sağlayan yöntemlerdir ve semantik analiz sonucunda erişilen bilgi de semantik bilgidir. Semantik analiz bir yöntemler bütünüdür, bu alanda tek, genel geçer bir yaklaşımdan bahsedilemez.Bu tez çalışmasının amacı, bilgiyi semantik seviyede temsil edecek bir bilgi modelinin altyapısı hakkında bir değerlendirme yapmaktır.Semantik bilgi bir manifold üzerinde modellenebilir. Manifold, varolan modellerde kullanılan metrik uzaylardan daha genel bir çerçeve sunarken, konum özelleştirmesi yolu ile özelleşmiş bilgilerin de aynı zamanda karşılanmasını sağlar. Spesifik olarak, uzunluk metriğine ek olarak eğrilik metriğinin kullanımını mümkün hale getirir.Çalışma kapsamında, bilginin manifold üzerinde modellenmesi fikrini doğrulamak üzere Öklidyen olmayan geometri temelli bir semantik analiz yöntemi önerilmektedir. Önerilen yaklaşım manifold üzerindeki jeodezik uzunluk kavramına dayanmaktadır. Yapılan uygulamada jeodezik uzunluklar dokümanlar arasındaki benzerliği ölçmek üzere kullanılmaktadır.Önerilen jeodezik benzerlik ölçüsü metin tabanlı bağlı veri seti Wikipedia XML Corpus üzerinde denenmektedir. Wikipedia bağ çizgesi üzerinden hesaplanan kümelenme katsayısı değerleri eğrilik değerleri olarak kabul edilmekte ve metinden hesaplanan Cosine benzerlik ölçüsü değerleri ile çember üzerindeki jeodezik formülü kullanılarak birleştirilmektedir. Deneysel çalışma kümelenme bağlamında gerçekleştirilmiş ve sonuçlar kümelenme metrikleri üzerinden yorumlanmıştır.Çalışma, bilgi modellemesinde manifold fikrini ortaya koyması ve bu fikrin geçerliliğini manifold fikrine dayanan bir semantik analiz yöntemi ve uygulaması sunarak test etmesi açısından özgündür. Bu niteliği ile gelecekte yürütülecek çalışmalara öncülük etmektedir.
Information has a broad meaning. It can be interpreted as raw material that is directly acquired via observations. At a higher level, information is the results and opinions that are reached directly and/or indirectly through data processing and analysis. In fact, the level of analysis determines the information abstraction level. The semantic analysis can be defined as the methods by which the high-level information characteristics can be addressed in terms of the low-level, directly measurable information attributes. The semantic analysis is a suite of methods, there exists no unique semantic solution.In this thesis, in order to represent semantic information, the information modeling requirements are considered.Semantic information can be modeled on a manifold. Manifold is a generalized space than the metric space but through the local properties it provides specialization at the same time. The specialization comes from the position dependence by which curvature metric becomes available in addition to ordinary distance metric.As part of the work, a manifold based semantic analysis method is proposed in order to support the idea of modeling semantic information on a manifold. The proposed approach is based on the concept of geodesic distance on a manifold. The aim is to utilize geodesic distances for making similarity measurements.The proposed geodesic similarity measure is tested on the Wikipedia XML Corpus, which is a text-based linked data set. The clustering coefficient values that are computed using the link graph are substituted as curvature values by the assumption that clustering coefficients are rough estimates of curvatures. Then, the curvatures are combined with the Cosine text similarity measure in the formula of geodesic distance. The experimental work is conducted in the clustering context and clustering metrics are used in order to evaluate the experimental results.Finally, the work's originality comes from the fact that it proposes the manifold structure for representing information, develops and tests a manifold-based semantic analysis method to justify the information manifold idea. Thus, it opens a new research area and motivates similar approaches for future research.