Tez No İndirme Tez Künye Durumu
787539
Data provenance visualization methodologies / Veri provenansı görselleştirme methodolojileri
Yazar:İLKAY MELEK YAZICI
Danışman: DOÇ. DR. MEHMET SIDDIK AKTAŞ
Yer Bilgisi: Yıldız Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2023
128 s.
Veri provenansı son kullanıcıların veri ya¸sam döngülerini yönetmek ve analiz etmek için yeni teknolojilerin geli¸stirilmesi gere˘gini do˘gurmu¸stur. Veri boyutu arttıkça, veri kayna˘gı ve verilerin ya¸sam döngüsüne ili¸skin meta veri boyutu da aynı oranda artar. Bu nedenle veri provenansı üzerinde analiz ve madencili˘gi destekleyen innovasyonlara ihtiyaç duyulmaktadır. Bu tez çalı¸smasında bilimsel i¸s süreç verisinin grafikler ¸seklinde çıkarılması ve grafik kıyaslama, özetleme, ileriye-geriye yönelik ba˘gımlılık sorgulama gibi bilim adamlarının ihtiyaç duyaca˘gı görselle¸stirme yakla¸sımlarının ara¸stırılması ve geli¸sirilmesi hedeflenmektedir. Çalı¸sılan görselle¸stirme metodolojileri ve sunulan algoritmaların uygulanabilirli˘gini gözlemlemek ve de˘gerlendirmek için W3C PROV provenans spesifikasyonunun kullanıldı˘gı bir görselle¸stirme aracı geli¸stirilmi¸stir. Ayrıntılı bir Sistematik Literatür Taraması ile bu alanda yapılmı¸s geçmi¸s çalı¸smaların belirlenen parametreler do˘grultusunda de˘gerlendirilmesi yapılmı¸stır. Sunulan yakla¸sımlar geni¸s ölçekli bir kullanılabilirlik çalı¸sması ile sistematik bir ¸sekilde de˘gerlendirilmi¸s ve SUS metrikleri referans alınarak kullanılabilirli˘ginin ba¸sarısı raporlanmı¸stır. Elde edilen sonuçlar sunulan metodolojilerin görselle¸stirme ihtiyaçları için uygulanabilir oldu˘gunu ve i¸slem yükünün önemsiz oldu˘gunu ispatlamaktadır.
Data provenance has created a growing need for methodologies that enable end-users to analyze the data life cycle and take appropriate action. In the era of big data, businesses' global data output grows daily. As data rises, so are the metadata on the data's source and life cycle. As a result, this calls for technologies that might improve data understanding and interpretation through data provenance. The difficulty of collecting graph-based data from scientific workflows and enabling necessary visualization techniques like graph comparison, data summarization, backward and forward dependency querying, and streaming data visualization are addressed in this paper. A visualization tool is used to implement the W3C-PROV-O provenance standard and evaluate the applicability of suggested techniques. A detailed Systematic Literature Review study was conducted intensively. The performance of the suggested methods is investigated using a sizable provenance data set. This study also goes into great depth on a thorough usability analysis of the prototype visualization tool. According to the results, the processing overhead of the suggested visualization approaches is negligible and they can be used.