Tez No İndirme Tez Künye Durumu
181157
A new reactive method for processing web usage data / Web kullanım verilerini işlemek için sonradan aktif yeni bir metod
Yazar:MURAT ALİ BAYIR
Danışman: DOÇ. DR. İSMAİL HAKKI TOROSLU
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2006
97 s.
Bu tez, kullanıcı oturumlarının yeniden oluşturulmasını sağlayan yeni birsonradan aktif metod olan `Smart-SRA' yi öne sürmektedir. Ağ KullanımMadenciliği bir Ağ Madenciliği türü olmakla beraber kullanıcıların ağüzerinden yaptığı gezinti bilgilerine veri madenciliği metodları uygulayarakdeğerli veriler çıkartır. Veri işleme ve kalıp çıkarma klasik veri madenciliğindeolduğu gibi ağ kullanım madenciliğinde de iki temel unsurdur. Veri işleme fazıkullanıcı oturumlarının yeniden oluşturulmasını içerir ve aynı zamanda verimadenciliğinin ilk fazıdır. Kullanıcı oturumlarının yeniden oluşturulması işlemiAğ Kullanım Madenciliğinin en önemli fazıdır, çünkü bu faz Ağ KullanımMadenciliği sonucunda ortaya çıkan sık kalıpların kalitesini önemli derecedeetkilemektedir. Kullanıcı oturumlarının yeniden oluşturulması işlemi, kullanılanveri tipi ve işleme zamanına göre `sonradan aktif' ve `önceden aktif' olmak üzereikiye ayrılır. Kullanıcı istemleri sunucu tarafından yakalanıp kaydedildiktensonra işlenirse bu tekniğe `sonradan aktif', eğer aynı işlem kullanıcının interaktifolarak sayfa görüntülemesi sırasında olursa `önceden aktif' denir. `Smart-SRA'sonradan aktif bir metod olup, sunucu tarafından oluşturulan ağ kullanımverilerini ve sitenin ağ yapısını kullanır. Bu tez kapsamında `Smart-SRA' nındaha önceki `sonradan aktif' metodlarla karşılaştırılmasını sağlamak amacıylaağ kullanım ajani simülatörü geliştirilmiştir. Ağ kullanım ajanı simülatörü ağkullanıcı davranışlarını modelleyip, sunucu tarafındaki ağ erişim kayıtlarıylaaynı anda ağ kullanıcı gezintileri oluşturmaktadır. Bu yöntemle, gerçek kullanıcıoturumları tanımlanabilip, yeni metodun onceki metodlarla doğrulukperformansı karşılaştırılabilmektedir. Bu tez, `Smart-SRA' tarafından yenidenoluşturulan kullanıcı oturumlarının önceki `sonradan-aktif' metodlarınoluşturduğu oturumlara oranla daha doğru sonuçlar verdiğini göstermektedir.
In this thesis, a new reactive session reconstruction method 'Smart-SRA' isintroduced. Web usage mining is a type of web mining, which exploits datamining techniques to discover valuable information from navigations of Webusers. As in classical data mining, data processing and pattern discovery are themain issues in web usage mining. The first phase of the web usage mining is thedata processing phase including session reconstruction. Session reconstruction isthe most important task of web usage mining since it directly affects the qualityof the extracted frequent patterns at the final step, significantly. Sessionreconstruction methods can be classified into two categories, namely 'reactive'and 'proactive' with respect to the data source and the data processing time. Ifthe user requests are processed after the server handles them, this technique iscalled as `reactive?, while in `proactive? strategies this processing occurs duringthe interactive browsing of the web site. Smart-SRA is a reactive sessionreconstruction techique, which uses web log data and the site topology. In orderto compare Smart-SRA with previous reactive methods, a web agent simulatorhas been developed. Our agent simulator models behavior of web users andgenerates web user navigations as well as the log data kept by the web server. Inthis way, the actual user sessions will be known and the successes of differenttechniques can be compared. In this thesis, it is shown that the sessions generatedby Smart-SRA are more accurate than the sessions constructed by previousheuristics.