Tez No |
İndirme |
Tez Künye |
Durumu |
442737
|
|
Yapısal olmayan verilerin büyük veri analiz yöntemleri ile işlenmesi ve yapısal olan verilerle ilişkilendirilmesine yönelik bir platform: Sosyal medya temelli tavsiye motoru geliştirme / A platform for processing non-structural data by big data analysis methods and assoaciate it with structural data: Developing a recommendation engine based on social media
Yazar:ONUR SEVLİ
Danışman: DOÇ. DR. ECİR UĞUR KÜÇÜKSİLLE
Yer Bilgisi: Süleyman Demirel Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayar yazılımları = Computer softwares ; Uygulama yazılımı = Application software
|
Onaylandı
Doktora
Türkçe
2016
139 s.
|
|
Bu çalışmada büyük veri karakteristiği taşıyan ve yapısal olmayan Twitter mesajları, büyük veri analizindeki temel tekniklerden olan MapReduce ve doğal dil işleme yöntemleri kullanılarak analiz edilmiştir. Elde edilen veriler mevcut yapısal kaynak veri setleri ile ilişkilendirilerek Twitter kullanıcılarının anlık yönelimleri tespit edilmiştir. Bu doğrultuda ilgili kullanıcıya takip edilebilecek diğer kullanıcıları tavsiye eden bir mekanizma geliştirilmiştir.
Bir Twitter kullanıcısının paylaşımları yazılımsal olarak elde edilmiş daha sonra bu paylaşımlar metin tabanlı analizler, doğal dil işleme, büyük veri işleme ve olasılıksal hesaplama süreçlerinden geçirilmiştir. Tweetler içerisindeki kullanıcının yaygın kullandığı kelimeler tespit edilerek bu kelimelerin veri tabanında yer alan kategori eşlenikleri bulunmuştur. Bu şekilde kullanıcıya ilişkin bir ilgi alanı tespiti ortaya konmuştur. Tespit edilen ilgi alanları ve yaygın kullanılan kelimeler baz alınarak takip edilebilecek diğer Twitter kullanıcılarını tavsiye olarak sunan bir mekanizma geliştirilmiştir. Bu tavsiye yöntemi hâlihazırda kullanılan yöntemlerden farklı olarak kullanıcıların gerçek zamanlı elde edilen ilgi alanları üzerine kurulu ve değişen yönelimlerine adapte olabilecek türdedir.
Çalışma bir web uygulaması olarak kullanıma sunulmuş ve çok sayıda kullanıcının test etmesi sağlanmıştır. Uygulama içerisinde profil analizi, kullanıcı karşılaştırma ve belirli bir konuyla ilgili kullanıcı arama seçenekleri bulunmaktadır. Uygulama ile iki binin üzerinde analiz işlemi gerçekleştirilmiş ve kullanıcılardan geri bildirimler alınmıştır. Test grubundaki yüz adet kullanıcı ile belirli aralıklarla birden çok analiz gerçekleştirilmiş ve düzenli aralıklı üç ayrı dönem sonucu alınan geri bildirimler doğrultusunda sistemin %86 başarılı olduğu sonucuna varılmıştır.
|
|
In this study, Twitter messages which have big data characteristic and unstructured form have been analyzed by using the MapReduce method which is one of the big data analysis techniques and natural language processing. Instant orientation of Twitter users' have been identified by associating obtained result sets with existing source data sets. In this direction a recommendation mechanism has been developed which advises to follow other associated Twitter users.
Shares of a Twitter user had been acquired and than these shares have passed through text-based analysis, natural language processing, big data processing and probabilistic evalualion. The commonly used words in tweets have been identified and conjugate categories for that words in the database was found. In this way the area of interest for the user was detected. A mechanism have been developed to advise other Twitter users that can be followed on the basis of commonly used words. Unlike the currently used methods, this recommendation method is based on the interests acquired in real-time and it can adapt to changing trends.
The system was made available as a web application and was provided to test a large number of users. There are profile analysis, user comparison and user search for a particular topic options exist in this application. Over two thousand of analysis have been performed and user's feedbacks have been taken. Periodic analysis were carried out with one hundred users in the test group of application and the conclusion that the system was successful 86% was reached according to feedbacks haved been received regulary spaced three separate periods. |