Tez No İndirme Tez Künye Durumu
184720
Metadata-based and peronalized WEB querying / Metadataya dayalı ve kişiselleştirilmiş WEB sorgulaması
Yazar:SELMA AYŞE ÖZEL
Danışman: PROF.DR. ÖZGÜR ULUSOY
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2004
154 s.
Web'in gelişimi ile beraber, bilgiye erişim ve sorgulamada yeni problemler or-taya şıkmıştır. Coğunlukla arama motorları tarafından kullanılan anahtar süzkarşılaştırmaya dayalı sorgulama yüntemleri tek bir sorgu işin binlerce Web bel-gesi getirmekte ve bu belgelerin şoğu kullanıcıların bilgi ihtiyaşları ile ilgisiz ol-maktadır. Web kullanıcılarının bilgi arama ihtiyaşlarını iyileştirmek amacınayünelik olarak, son umut verici yaklaşım Web'in metadata ve ek aşıklama kul-lanılarak dizinlenmesidir.Bu tezde, Web arama yeteneklerini iyileştirmek işin, Web'deki bilgi kaynaklarımetadata kullanılarak modellenmekte ve sorgulanmaktadır. Web sorgulamasınınmetadata kullanılarak yapılması, daha anlamlı sorgu sonuşlarının uretilmesinisağlamaktadır. ?Web bilgi uzayı modeli? adını verdiğimiz Web veri modeli, Webtabanlı bilgi kaynaklarından (Web uzerindeki HTML/XML formundaki belgeler-den), uzman üneri veritabanlarından (bilgi kaynakları işin alan uzmanı tarafındanhazırlanmış metadatadan), ve kullanıcılarla ilgili kişiselleştirilmiş bilgiden (kul-lanıcıların uzmanlarla ilgili tercihleri ve konular hakkındaki bilgi seviyesini be-lirleyen kullanıcı profillerinden) oluşmaktadır. Uzman ünerisi, yakın zamandaünerilmiş olan konu haritaları standardı doğrultusunda, konular ve konulararasındaki ilişkiler (metalink'ler) kullanılarak tanımlanmaktadır. Konular vekonular arasındaki ilişkiler, Web'deki bilgi kaynaklarının işeriğini tanımlayanmetadata'yı oluştururlar. Uzmanlar, konulara, konular arasındaki ilişkilereve bilgi kaynaklarına onların ünem derecesini belirten sayısal değerler verir-ler. Kullanıcı profilleri kullanıcıların tercihlerini ve kullanıcıların ziyaret et-tikleri bilgi kaynaklarını işeren tarihşeyi saklamaktadırlar. Kullanıcı tercihleri,konular uzerindeki bilgi seviyeleri ve Web dolaşım tarihşesi Web'deki aramayıkişiselleştirmek ve kullanıcıya dündürülen sonucun duyarlılığını arttırmak işinkullanılır.Uzman ünerileri ve kullanıcı profilleri nesneye dayalı ilişkisel veritabanındasaklanmakta ve Web tabanlı bilgi kaynaklarını Web bilgi uzayı modeli kullanaraketkin şekilde sorgulayabilmek işin SQL dili genişletilmektedir. SQL uzantıları,i sağlayan yantümceleri, sorguyudurdurma koşulunu tanımlayan yantümceyi ve yeni işleşleri (metin benzerliğinedayalı seşim, metin benzerliğine dayalı birleşim, ve konu kapsamı) işerir. Onemdeğerinin iletimi ve sorguyu durdurma koşulu sorgu şıktısının sıralanmasını veşıktı boyutunun sınırlandırılmasını sağlar. Metin benzerliğine dayalı işleşler vekonu kapsamı işleci karmaşık sorgulama olanaklarını desteklemektedir. Bu SQLeklentilerini işleyebilmek amacıyla ?Yan Değer ureten Cebir? adı verilen yeni bircebir geliştirilmiştir.Yan değer ureten cebir tanımlandıktan sonra, metin benzerliğine dayalı yünlübirleştirme işlecinin algoritması ve bu işlecin performansı uzerine olan deney-sel sonuşlar sunulmaktadır. Tüm bunlara ek olarak, Web bilgi uzayı modeliuzerinde SQL eklentileri kullanılarak yapılan metadataya dayalı kişiselleştirilmişWeb sorgulamasının etkinliği, anahtar süz karşılaştırmaya dayalı Web aramateknikleri ile karşılaştırmalı olarak güsterilmiştir.Anahtar süzcükler : metadataya dayalı Web sorgulaması, konu haritaları, kul-lanıcı profili, kişiselleştirilmiş Web sorgulaması, Yan Değer ureten Cebir, değeryünetimi, metin benzerliğine dayalı birleştirme.
The advent of the Web has raised new searching and querying problems. Key-word matching based querying techniques that have been widely used by searchengines, return thousands of Web documents for a single query, and most of thesedocuments are generally unrelated to the users? information needs. Towards thegoal of improving the information search needs of Web users, a recent promisingapproach is to index the Web by using metadata and annotations.In this thesis, we model and query Web-based information resources usingmetadata for improved Web searching capabilities. Employing metadata forquerying the Web increases the precision of the query outputs by returning seman-tically more meaningful results. Our Web data model, named ?Web informationspace model?, consists of Web-based information resources (HTML/XML docu-ments on the Web), expert advice repositories (domain-expert-specified metadatafor information resources), and personalized information about users (capturedas user profiles that indicate users? preferences about experts as well as users?knowledge about topics). Expert advice is specified using topics and relationshipsamong topics (i.e., metalinks), along the lines of recently proposed topic mapsstandard. Topics and metalinks constitute metadata that describe the contents ofthe underlying Web information resources. Experts assign scores to topics, met-alinks, and information resources to represent the ?importance? of them. Userprofiles store users? preferences and navigational history information about theinformation resources that the user visits. User preferences, knowledge level ontopics, and history information are used for personalizing the Web search, andimproving the precision of the results returned to the user.We store expert advices and user profiles in an object relational databasemanagement system, and extend the SQL for efficient querying of Web-based in-formation resources through the Web information space model. SQL extensionsinclude the clauses for propagating input importance scores to output tuples, theclause that specifies query stopping condition, and new operators (i.e., text sim-ilarity based selection, text similarity based join, and topic closure). Importancescore propagation and query stopping condition allow ranking of query outputs,and limiting the output size. Text similarity based operators and topic closureoperator support sophisticated querying facilities. We develop a new algebracalled Sideway Value generating Algebra (SVA) to process these SQL extensions.We also propose evaluation algorithms for the text similarity based SVA direc-tional join operator, and report experimental results on the performance of theoperator. We demonstrate experimentally the effectiveness of metadata-basedpersonalized Web search through SQL extensions over the Web information spacemodel against keyword matching based Web search techniques.Keywords: metadata based Web querying, topic maps, user profile, personal-ized Web querying, Sideway Value generating Algebra, score management, textsimilarity based join.