Tez No İndirme Tez Künye Durumu
604292
Ağ bağlantılı veriler için gözetimsiz ikili öznitelik oluşturma yöntemi / Unsupervised binary feature construction method for networked data
Yazar:ARZU KAKIŞIM
Danışman: PROF. DR. İBRAHİM SOĞUKPINAR
Yer Bilgisi: Gebze Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2019
112 s.
Ağ verileri, ağ nesnelerinden ve bağlantılardan oluşan verilerdir. Ağ nesneleri, yüksek boyutlu özniteliklerle ve bu nesneler arasındaki ilişkileri gösteren bağlarla karakterize edilir. Bununla birlikte, geleneksel öznitelik seçimi ve öznitelik çıkarma yöntemleri, yalnızca bu ağlara ait öznitelik bilgisini dikkate almaktadır. Bu nedenle, bu yöntemler ağa ait bağlantı bilgisini göz ardı etmektedir. Bu tezde, ağ verilerine ait bağlantı ve öznitelik bilgisi birlikte kullanılarak, ağ verileri için yeni bir öznitelik çıkarım yöntemi geliştirilmiştir. Ağın bağlantı bilgisinden yararlanarak her ağ nesnesi için öznitelikleri yeniden yapılandıran bir denetimsiz ikili özellik oluşturma yöntemi (NetBFC) geliştirilmiştir. Ağdaki benzer nesneleri birbirleri ile ilişkilendirerek, yöntemimiz aynı grupta olma olasılığı yüksek nesneler arasındaki benzerlikleri artırır. Sunulan yöntem, ağa bağlı verilerin seyrekliğinden kaynaklanan zorluğun üstesinden gelmek için nesneleri, kendisine benzerlik gösteren nesneler ile gruplandırarak ve bu grup içerisinde sıklıkla gözlemlenen nitelikler ile ilişkilendirerek her bir nesne için yerel öznitelik zenginleştirmesini ve yerel öznitelik seçimini mümkün kılar. Ek olarak, bu yöntem, kümeleme algoritmalarının performansını düşüren alakasız ve gereksiz nitelikleri ortadan kaldırmak için bir öznitelik eleme aşaması uygular. Gerçek dünyadaki verileri üzerinde gerçeklenen deneyler sonucunda, NetBFC'nin temel yöntemlere kıyasla daha iyi performans sağladığı gözlemlenmiştir.
Networked data is data composed of network objects and links. Network objects are characterized by high dimensional attributes and by links indicating the relationships among these objects. However, traditional feature selection and feature extraction methods consider only attribute information, thus ignoring link information. In the presented work, we propose a new unsupervised binary feature construction method (NetBFC) for networked data that reconstructs attributes for each object by exploiting link information. By exploring similar objects in the network and associating them, our method increases the similarities between objects with high probability of being in the same group. The proposed method enables local attribute enrichment and local attribute selection for each object by aggregating the attributes of similar objects in order to deal with the sparsity of networked data. In addition, this method applies an attribute elimination phase to eliminate irrelevant and redundant attributes which decrease the performance of clustering algorithms. Experimental results on real-world data sets indicate that NetBFC significantly achieves better performance when compared to baseline methods.