Tez No İndirme Tez Künye Durumu
649066
A framework for information quality and coverage assessment for type 2 diabetes websites / Tip 2 diyabet web siteleri için bilgi kalitesi ve kapsam değerlendirmesi için bir çerçeve
Yazar:DİDEM ÖLÇER
Danışman: DOÇ. DR. TUĞBA TAŞKAYA TEMİZEL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Enformatik Enstitüsü / Bilişim Sistemleri Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2020
120 s.
Sağlık bilgisi arayanlar, genellikle yüksek kaliteli ve güncel bilgilere erişmek için arama motorlarını kullanırlar. Bununla birlikte, alanında uzman olmayan kişiler tarafından üretilen yüksek bilgi hacmi nedeniyle çevrimiçi yüksek kaliteli sağlık bilgisi bulmak gittikçe zorlaşmaktadır. Son kullanıcıların web sitelerinin kalitesini değerlendirmelerine yardımcı olan manuel araçlar vardır. Ancak, bu araçlar için zaman ve iş gücüne ihtiyaç vardır. Bu tez, kanıta dayalı tıbba göre sağlık web sitelerinin içerik kapsamını ve kalitesini otomatik olarak değerlendiren bir çerçeve önermeyi amaçlamaktadır. Tezin iki temel katkısı vardır. Birincisi, bilgi kalitesini ölçmek için profesyonel sağlık okuryazarlığı rehberlerinden türetilmiş kalite göstergelerini kullanan bir yöntemdir. İkinci katkı, bilgi kapsamını ve bilgi kalitesini değerlendirmek için Okapi BM25 ve MeSH terim genişletme ile hem metinsel hem de içerik tabanlı özellikleri kullanan bir yöntemi içerir. İçerik tabanlı özellikler diyabette kanıta dayalı bir uygulama rehberi olan Amerikan Diyabet Birliğinin (ADA) rehberi kullanılarak edinildi. Spesifik olarak, ADA kılavuzundan yardımcı fiilleri içeren cümleleri çıkartıldı ve iWeb korpus'u kullanarak bu cümlelerden üretilen terimlerin, 2-gram ve 3-gram terimlerin tuhaflık katsayısıhesaplandı. Sonuçlar, hem metin hem de içerik tabanlı özelliklerin kullanımının yüksek ve düşük kaliteli web sitelerinin sınıflandırılmasında etkili olduğunu göstermiştir. Ayrıca, profesyonel sağlık rehberlerinden türetilen özellikler, sınıflandırma sonuçları üzerinde önemli bir olumlu etkiye yol açmaktadır.
Health information seekers often use search engines to access high-quality and up-to-date information. However, finding online high-quality health information is increasingly getting difficult due to the high volume of information generated by non-experts in the area. There are manual tools which help end-users in assessing the quality of websites. However, they are labour-intensive. This thesis aims to propose a framework that automatically evaluates the content coverage and quality of health websites according to evidence-based medicine. The thesis has two main contributions. The first one is a method which utilizes quality indicators derived from professional health literacy guidelines to measure information quality. The second contribution includes a method which uses both textual and content-based features with Okapi BM25 and MeSH term expansion to assess information coverage and information quality. Content-based features were acquired using American Diabetes Association's (ADA) guideline, which is an evidence-based practice guideline in diabetes. Specifically, sentences containing auxiliary verbs from ADA guideline were extracted and the weirdness coefficient of terms, 2-grams and 3-grams generated from these sentences were calculated using iWeb corpus. The results showed that the use of both textual and content-based features is effective in classification of high and low-quality websites. In addition, the features derived from professional health guidelines lead to a significant positive impact in classification results.