Tez No İndirme Tez Künye Durumu
222086
Web kullanıcı erişim kütüklerinden bilgi çıkarımı / Knowledge extraction from Web user access logs
Yazar:RESUL DAŞ
Danışman: DOÇ. DR. İBRAHİM TÜRKOĞLU ; PROF. DR. MUSTAFA POYRAZ
Yer Bilgisi: Fırat Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik ve Elektronik Mühendisliği Bölümü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Elektrik ve Elektronik Mühendisliği = Electrical and Electronics Engineering
Dizin:Web = Web
Onaylandı
Doktora
Türkçe
2008
151 s.
Son yıllarda İnternet'in hızlıca gelişmesi ve yaygın kullanımı ile Web, dünyada erişilebilir en geniş veri kaynağı haline gelmiştir. Internet'teki bilgi yığınları aşırı şekilde artarken, Web ziyaretçi isteklerine uygun hizmetlerin sağlanabilmesi, Web site yapısının iyileştirilmesi, geliştirilmesi ve etkin olarak kullanılması gibi amaçları sağlamak için Web Madenciliği gittikçe daha ilgi çeken bir konu olarak görülmektedir.Bu tez çalışmasında, metin tabanlı web kullanıcı erişim kütüklerinin temizlenmesine yönelik yeni bir süreç önerilmiştir. Önerilen sürecin uygulaması ve program kodlamaları JAVA tabanlı SAS Base yazılım ortamında geliştirilmiştir. Büyük boyutlardaki kütük dosyalarının temizlenmesinde geliştirilen veri temizleme süreci hız yönünden diğer yöntemlere göre üstünlük sağlamıştır.Temizlenmiş kullanıcı erişim kütüklerinden anlamlı ve ilginç bilgilerin çıkarılması için üç farklı çalışma yapılmıştır;?Yol analizi yöntemi ile web kullanıcı erişim kütük dosyalarından anlamlı ve ilginç örüntüleri içeren bilgiler çıkarılmıştır. Literatürde geçen ve başka alanlarda uygulaması yapılan yol analizi yönteminin, web kullanıcı erişim kütüklerine uygulaması yapılarak, anlamlı ve ilginç örüntüleri içeren bilgiler çıkarılmasın da başarılı bir şekilde kullanılabileceği gösterilmiştir.?Aynı veri tabanı verilerine birliktelik kuralı yöntemi uygulanarak Web sayfaları arasındaki ilişkileri belirleyen bilgiler çıkarılmıştır.?İstatistiksel analiz ile Web sitesinin üç aylık bir süre içerisindeki genel kullanımına ilişkin detaylı istatistikî bilgiler çıkarılmıştır.Gerçekleştirilen tüm uygulama çalışmaları sonucunda, elde edilen bilgiler kullanılarak web sitesinin iyileştirilmesine, geliştirilmesine, kullanılabilirliğine ve yapısal organizasyonuna katkı sağlamak için web site tasarımcılarına ve yöneticilerine öneriler sunulmuştur. Ayrıca, HTTP durum kodları analiz edilerek web sitesi ve sunucusunun başarımını arttırmaya yönelik çözüm önerileri oluşturulmuştur. Oluşturulan öneriler ziyaretçi memnuniyetini arttırmaya yönelik kazanımları da amaçlamaktadır.
Recently, by rapidly developing and common usage of the Internet, Web has been largest accessible data source in the world. While extremely growing the knowledge masses up on the Internet by passing time, Web Mining has been seeing as more attractive subject more and more to cope with goals such as improving, growing healthy and using effectiveness of web site structure and to provide appropriate web service to the web clients requests.In this thesis, a new process intended for purifying of text-based web user access logs are proposed. The implementation and code of the proposed process have been designed on Java-based SAS software environment. Purifying high dimensional data access logs, the improved data cleaned process is superior to the other methods in speed aspect.Extracting meaningful and interesting knowledge from the purified user access logs, three different implementations have been realized.?Knowledge contained the meaningful and interesting patterns from web user access log files have been extracted by using Path Analysis Method. The implementation of web user access logs of Path Analysis Method, present in the literature and implemented in different fields, has successfully shown that it can be used in extracting meaningful and interesting knowledge.?Relation knowledge between web sites by applying Association Rules Method on the same dataset is extracted.?The detailed statistical knowledge regarding three months usage of the Web site has been extracted by using Statistical Analysis Method.In the end of all implementation, web site designers and managers are given suggestions about improvement, grow healthy and being usable of the web site and to contribute its structural organization by using obtained meaningful and pure knowledge. Furthermore, some solution suggestions with relation to increase successfulness of web site and server by analyzing HTTP state codes have been formed. The formed suggestions are intended for increase the visitor pleasure.