Tez No İndirme Tez Künye Durumu
442178
Spatiotemporal data mining for situation awareness in microblogs / Mikrobloglarda durum farkındalığı için lokasyon ve zaman tabanlı veri madenciliği
Yazar:ÖZER ÖZDİKİŞ
Danışman: DOÇ. DR. PINAR KARAGÖZ ; PROF. DR. MEHMET HALİT SEYFULLAH OĞUZTÜZÜN
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2016
191 s.
Mikrobloglarda yazılan mesajları kullanarak gerçek hayatta yaşanan olayların bulunması pek çok güncel çalışmanın konusu olmuştur. Bu tez çalışmasında, mikrobloglarda, özellikle de Twitter platformunda oluşturulan içeriği kullanarak olayları bulup yerlerini tahmin ederek durum farkındalığını artıran lokasyon ve zaman tabanlı veri madenciliği teknikleri araştırılmıştır. Çevrimiçi kümeleme ve olay bulma işlemlerinin doğruluk derecesini artırmak amacıyla, tweet'lerde geçen kelimeler arasındaki ilişkileri zamansal bir bağlamda ölçen ve bu ilişkileri vektör genişletme işleminde kullanan bir yöntem sunulmaktadır. Ayrıca bulunan olayların yerlerinin tahmin edilmesi için Dempster-Shafer teorisinin uygulandığı bir yöntem önerilmektedir. Bu yöntemde, coğrafi etiketi bulunan tweet'lerdeki enlem-boylam bilgisi, tweet içeriğinde geçen yer isimleri ve kullanıcı profilinde belirtilen lokasyon alanı birbirinden bağımsız üç farklı bilgi kaynağı olarak kullanılmış; ve Dempster-Shafer teorisindeki kombinasyon kuralları ile tek bir model halinde birleştirilerek ilgili olayın konumu tahmin edilmiştir. Olay bulma ve yer tahmini için önerilen çözümler Türkiye içinden gönderilen tweet'ler üzerinde uygulanarak, elde edilen sonuçlar gösterilmiştir. Yapılan deneyler, literatürdeki mevcut çözümler ile elde edilenden daha yüksek bir başarı oranına işaret etmektedir.
Detection of real-world events using messages posted in microblogs has been the motivation of numerous recent studies. In this thesis, we study spatiotemporal data mining techniques to improve situation awareness by detecting events and estimating their locations using the content in microblogs, particularly in Twitter. We present an enhancement to the clustering techniques in the literature by measuring associations between terms in tweets in a temporal context and using these associations in a vector expansion process to improve the accuracy of online tweet clustering and event detection. Moreover, we propose a method using the Dempster-Shafer theory to estimate the locations of the detected events. We utilize three basic location-related features in tweets, namely the latitude-longitude metadata in geotagged tweets, the location names mentioned in the tweet content and the location attribute in the user profile, as independent sources of evidence. We apply combination rules in the Dempster-Shafer theory to fuse them into a single model, and estimate the whereabouts of a detected event. We demonstrate the results of our experiments for event detection and location estimation using public tweets posted in Turkey. Our experiments indicate higher success rates than those obtained by the state of the art methods.