Tez No İndirme Tez Künye Durumu
596012
Provenance use in social media software to develop methodologies for detection of information pollution / Provenans kullanılarak sosyal medya yazılımlarında bilgi kirliliğinin ve telif hakları ihlallerinin tespiti için yöntemler geliştirilmesi
Yazar:MOHAMED JEHAD BAETH
Danışman: DOÇ. DR. MEHMET SIDDIK AKTAŞ
Yer Bilgisi: Yıldız Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2019
164 s.
Sosyal Medya, iletişim kurmak ve sosyalleşmek için, geleneksel medyanın (gazeteler, televizyonlar vb.) sunamadığı büyük ölçekli ve kolay kullanımlı araçlardan oluşan bir platform sunmaktadır. Bu platform, Internet kullanıcılarının ortaklaşa ve paylaşarak yarattığı sistemi tanımlayan Web 2.0.'ın teknolojik temellerine dayanmaktadır ve kullanıcı tarafından oluşturulan içeriklerin paylaşılmasına olanak veren bir grup yazılım olarak tanımlanmaktadır. Sosyal Medya kullanıcıları bu platformları kullanırken iki önemli problem ile karşı karşıyadır. Birinci problem; kullandıkları sosyal medya yazılımı üzerinden bir veri (başka kullanıcı tarafından oluşturulan içerik) aldıkları zaman, bu verinin kalitesi hakkında tam olarak bilgi sahibi olamamaktadır. Dolayısıyla, kullanıcılar, veri hakkında yeterince bilgiye sahip olmadan ve veriye ne kadar önem verilmesi gerektiği konusunda emin olamadan, verinin yayılmasına olanak sağlayabilmektedir. Bunun sonucunda da bilgi kirliliği durumu ortaya çıkabilmektedir. İkinci problem; Sosyal Medya yazılımlarının gizlilik politikalarını zaman içinde değiştirebilmeleri ve kullanıcıların bu yazılımların gizlilik ayarlarını, talep ettikleri gizlilik derecesine göre, tam olarak düzenleyememeleri yüzünden kaynaklanmaktadır. Bu gizlilik politikaları kullanıcının paylaştığı verilerin kullanılması ve yayılması ile ilgili hakları belirlemektedir. Kullanıcının sadece arkadaşları arasında paylaştığı veriler, yeniden paylaşma yöntemiyle sosyal medya üzerinden yayılabilmektedir. Kullanıcılar, kendi verilerinin gerçekte kimler tarafından görüntülenebildiğini ve üzerinde kimlerin işlem yapılabildiğini takip edememektedir. Bunun sonucunda da telif hakları ihlalleri ortaya çıkabilmektedir. Bu iki problemin çözülebilmesi için, kullanıcılar verinin hayat döngüsü bilgilerine ihtiyaç duymaktadır. Provenans, veri hakkında köken, doğruluk, gerçeklik, kalite, mülkiyet gibi hayat döngüsü bilgileri sağlayan bir üst-veri olarak tanımlanmaktadır. Günümüzde, Sosyal Medya yazılımlarında, "bilgi kirliliği durumlarının" ve "kullanıcı verilerinin telif haklarının ihlal edilip edilmediğinin" tespitine yönelik yöntemlerin eksikliği görülmektedir. Bu projenin başlıca amacı, Sosyal Medya yazılımlarında yayınlanan verilere ait provenans bilgilerini toplayan, saklayan, sorgulayan; bu bilgilerinden, provenans çizge yapıları oluşturan; provenans çizgeleri üzerinde "bilgi kirliliği durumları tespiti" ve "kullanıcı verilerinin telif haklarının ihlal edilip edilmediğinin tespiti" amaçlı tasarlanacak algoritmaları içeren yöntemler geliştirmektedir. Bu temel amaç kapsamında algoritmalar geliştirilmiş ve testleri yapılmıştır. Sonuçlar, önerilen algoritmaların başarılı olduğunu ortaya koymuştur.
Social media delivers its users a large-scale easily usable and foolproof platform to communicate and to socialize that cannot be delivered using traditional media (such as newspapers and television). This platform is based on the technological foundations of Web 2.0 to define collaboration and data sharing among Internet users and operates as a group of software that allows the sharing of user-generated content. Social media users face two important problems when using this platform. The first problem is the following: when social media users receive data (user-generated content) via social media software, they might not know the exact quality of the data. Therefore, they may not be sure about the reliability and correctness of the data, how much emphasis it should be given, and whether they should help to disseminate the data. As a result, situations like information pollution can arise. The second problem is the following: social media software may change their privacy policies over time. As a result, users may not be able to set their privacy settings precisely according to the privacy measures that they demand. These policies determine the copyrights of the user's shared data. User's data intended to be disseminated among friend circle, may be disseminated via re-sharing within social media. Users are not aware of who actually can see his/her data or apply a process to it. As a result, problems like copyright violations can arise. In order to solve the two problems, users need information on the lifecycle of social media data. Provenance is defined as metadata that describes the origin, validity, quality, and ownership of data. Nowadays, we observe a lack of methodologies for detecting information pollution and copyright violations of users' shared data. The goal of this project is to develop methodologies that collect, store, pose queries and conduct analysis on the provenance of social media with a focus on the development of algorithms and methods for detecting information pollution and copyright violations of shared data. To begin to reach this goal, we developed algorithms and evaluated their correctness. We studied multiple provenance-quiring and storing systems to measure their abilities in aspects of scalability and performance with data of high magnitude. We proceeded by creating an abstract provenance data model that can be used to describe social interactions on different social network platforms by extending the PROV-O ontology. Using this model, we created a large-scale synthetic social provenance dataset, which we used to evaluate and test the proposed algorithms. We also tested our misinformation detection algorithm prediction capabilities against a real-life dataset. The results indicated the proposed algorithms shows promising outcomes.