Tez No İndirme Tez Künye Durumu
517148
Relevance feedback and sparsity handling methods for temporal data / Zamansal veriler için ilgililik geri bildirimi ve seyreklik ele alma metotları
Yazar:BAHAEDDİN ERAVCI
Danışman: PROF. DR. ÖZGÜR ULUSOY ; PROF. DR. HAKAN FERHATOSMANOĞLU
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2018
107 s.
Zamansal ilişkiye sahip veriler, artan önemi ve çok sayıda uygulaması ile birçok doğal ve dijital süreçte ortaya çıkar. Bu çalışma hem tek başına hem de seyrek ve ağ ilişkili durumlarda zaman serilerinin analizinde veri madenciliği problemlerine çözümler sunmaktadır. İlk olarak kullanıcı derecelendirmesine dayanan, yeni zaman serisi sorguları oluşturarak zaman serisi veri depolarını taramak için bir yöntem geliştirdik. Sonuç kümesi, ilgililik geri bildirim mekanizmasının etkinliğini arttırmak için çeşitlilik içeren seçim yöntemleri kullanılarak oluşturulmuştur. Geri bildirime ek olarak, zaman dizisi verilerinin benzersiz bir yönü göz önünde bulundurularak, el ile yapılabilecek bir seçimin aksine, kullanıcı açıklamalarına dayanan çeşitli dönüşümler arasında üstün performans gösteren temsil türüne yakınsamak için temsil geri bildirim yöntemleri önerilmektedir. Bu yöntemler, her bir temsil başarımına göre sonuç kümesinin bölümlendirilmesine ve birden çok temsilin farklı özelliklerini kuvvetlendiren bir ağırlık yaklaşımına dayanmaktadır. Daha sonra, hem işlem yükünü azaltmak hem de doğruluğunu arttırmak için, zaman serilerini veri bağımlı seyrek temsillere indirgemek için oto-kodlayıcıların kullanımını önermekteyiz. çok çeşitli gerçek veri kümeleri üzerinde yapılan deneyler, önerilen yöntemlerin doğruluğu önemli ölçüde geliştirdiğini kanıtlamakta olup veriye duyarlı temsiller, verileri ve hesaplama yükünü azaltırken, benzer başarım kaydetmiştir. Daha zorlu bir durum olarak, zaman serisi veri kümesi noksan olup, veri madencilik tekniklerini uygulayabilmek için interpolasyon yaklaşımlarına ihtiyaç duyulabilir. Bu bağlamda, zamana bağlı değişen bir ağ ile ilişkili seyrek bir zaman dizisi verisini analiz ediyoruz. Gürültülü ve seyrek araç izlerini kullanarak bir yol ağı zaman serisi veri kümesi oluşturmak için bir metodoloji geliştirdik ve en kısa yol çözümlerini kullanarak değerlendirdik.
Data with temporal ordering arises in many natural and digital processes with an increasing importance and immense number of applications. This study provides solutions to data mining problems in analyzing time series both in standalone and sparse networked cases. We initially develop a methodology for browsing time series repositories by forming new time series queries based on user annotations. The result set for each query is formed using diverse selection methods to increase the effectiveness of the relevance feedback (RF) mechanism. In addition to RF, a unique aspect of time series data is considered and representation feedback methods are proposed to converge to the outperforming representation type among various transformations based on user annotations as opposed to manual selection. These methods are based on partitioning of the result set according to representation performance and a weighting approach which amplifies different features from multiple representations. We subsequently propose the utilization of autoencoders to summarize the time series into a data-aware sparse representation to both decrease computation load and increase the accuracy. Experiments on a large variety of real data sets prove that the proposed methods improve the accuracy significantly and data-aware representations have recorded similar performances while reducing the data and computational load. As a more demanding case, the time series dataset may be incomplete needing interpolation approaches to apply data mining techniques. In this regard, we analyze a sparse time series data with an underlying time varying network. We develop a methodology to generate a road network time series dataset using noisy and sparse vehicle trajectories and evaluate the result using time varying shortest path solutions.