Tez No İndirme Tez Künye Durumu
420533
Açık bağlı veri sistemlerinde köken bazlı erişim gerçekleştirimi / Provenance-aware query execution in open linked data systems
Yazar:FATİH TEKBACAK
Danışman: PROF. DR. OĞUZ DİKENELLİ
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2015
119 s.
Köken, vebdeki verinin güven ve kalite değerlendirilmesi sürecine yön veren bir kavram olarak ortaya atılmıştır. Bağlı veriyi üreten veya tüketen uygulamalar, köken üstverisi yardımı ile güvene dair tanımlamalar sunmaktadır. Tezde köken üstverisine sahip verisetleri üzerinde yapılan sorgulardan elde edilen filtrelenmiş veri üzerinde durulmaktadır. Güvenin arttırılması için köken üstverisi kullanılarak sorgulanacak verisetlerinden en uygun olanlarının filtrelenmesi ve dağıtık sorgu motoruna aktarılması üzerinde çalışılmıştır. Tezin ilk katkısı, köken farkında bir bağlı veri sorgulama altyapısı ortaya koymaktır. Köken üstverisinin gösterimi ve bağlı verinin organizasyon tarafından sorgulanması sırasında işleyecek süreç altyapı içerisinde tanımlanmaktadır. Tezin ikinci katkısı, mevcut verisetleri arasından köken üstverisine göre en uygun olanları filtrelemektir. Çalışma içinde filtreleme yapılırken verisetleri hakkındaki üstveri kullanılmaktadır. Organizasyonel tercihler, veriseti üstverisi ve geliştirilen ontolojilerden yararlanılan bir mimari sunulmaktadır. Tezin üçüncü katkısı, bağlı veri literatürüne İç Veri ve Dış Veri kavramlarını katmasıdır. Bağlı veriye organizasyonel perspektiften bakıldığında, vebde erişilebilecek anlamsal olan veya olmayan tüm veri ile bu verilerin üstverileri Dış Veri olarak adlandırılmıştır. İç Veri ise organizasyon verisi, organizasyonel tercihler ve organizasyonel veri kaynağı üstmodel ambarı olarak Dış Veri'de erişilecek verisetlerinin üstverisini içerir. Tezin dördüncü katkısı, Dış Veri'ye ait olan veriseti üstverisine eklenebilecek köken üstverisini ifade etmektir. Verisetinin ham hali, anlamsal hali ve üstverisi ile ilgili köken tanımları netleştirilmiştir. Tezin beşinci katkısı, İç Veri'yi oluşturan organizasyonel kavramlar ile kökeni beraberce gözönüne alan bir ontoloji oluşturmaktır. Ontoloji, çalışma alanından bağımsız olarak kökeni sorgulamak için terimler içermektedir. Ayrıca organizasyonların birbirleri hakkında fikir sahibi olmasına olanak sağlamaktadır. Tezin altıncı katkısı, organizasyonların köken tercihlerini gösteren bir ontoloji oluşturmaktır. Köken boyutları ve ilgili köken tercihleri çeşitlenmekle beraber farklı durumları kapsayan örnek tercih boyutları ele alınmıştır. Bu doğrultuda organizasyonel tercihlerin nasıl oluşturulabileceği örneklendirilmiştir. Tezin son katkısı, İç Veri, Dış Veri ve oluşturulan ontolojilerden yararlanarak köken kuralları meydana getirmektir. Mevcut verisetleri üzerinde kuralların yürütülmesi ile sorgu motorunun kullanacağı veriseti listesinin son halinin elde edilmesi sağlanmaktadır.
Provenance is suggested as a concept which directs the trustworthiness and quality assurance process of data on the Web. The applications publishing and consuming linked data represent definitions about trust with the help of provenance metadata. In the thesis, filtered data obtained from queries concerning metadata of datasets is elaborated. To enhance trustworthiness, it is worked on filtering most suitable datasets with provenance metadata to be queried and transferring these datasets to federated query engine. The first contribution of this thesis is to introduce a provenance-aware linked data querying infrastructure. In the infrastructure, the representation of provenance metadata and the process during querying linked data by the organization is described. The second contribution of this thesis is to filter most appropriate datasets between available datasets towards provenance metadata. In the work, metadata about datasets are used for filtering. An architecture benefited from metadata and required vocabularies is represented byconsidering organizational preferences and dataset-based requirements. The third contribution of this thesis is to append Interior Data and Exterior Data concepts to the linked data literature. When observing linked data from organizational perspective, whole accessible raw or semantic data on the web and the metadata of those data is called as Exterior Data. Interior Data is the aggregation of organization data, organizational preferences and metadata of accessible datasets on the web which is referred to organizational data source metamodel warehouse. The fourth contribution of this thesis is to express provenance metadata for extending dataset metadata which belongs to Exterior Data. Provenance definitions related to raw dataset, semantic dataset and dataset metadata are clarified. The fifth contribution of this thesis is to build an ontology that considers organizational and provenance concepts constructing Interior Data. The ontology includes terms for querying provenance independent of the domain. Additionally, it helps organizations to have ideas about each other. The sixth contribution is to build another ontology that represents provenance preferences of the organizations. While there are different provenance dimensions and related different provenance preferences, sample preference dimensions involving different conditions are handled. Accordingly, method of creating organizational preferences are exemplified. The last contribution of this thesis is to generate rules by the help of Internal Data, External Data and built ontologies. Final list of datasets used by query engine are obtained by enforcing rules on available datasets.