Tez No İndirme Tez Künye Durumu
759301
Bias in search: Evaluating search results through rank and relevance based measures / Arama platformlarında ön yargı: Arama sonuçlarının sıralama ve ilgililik temelli metrikler ile değerlendirilmesi
Yazar:GİZEM GEZİCİ
Danışman: PROF. DR. YÜCEL SAYGIN
Yer Bilgisi: Sabancı Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2022
130 s.
Arama platformları hayatımızın her yerinde. İnsanlar popüler arama motorları olan Bing ve Google üzerinden olduğu gibi YouTube gibi diğer arama platformlarından da bilgi arayışı içerisindeler. Bununla birlikte, kullanıcılar arama platformlarını hiçbir ön yargı katmadan yalnızca bilgiyi sunan objektif platformlar olarak görüyorlar. Kullanıcılar farkında olmadıklarında ön yargılara karşı daha da savunmasız kalmaları sebebiyle, arama platformlarından dönen sonuçların ön yargı açısından analiz edilmesi önemli. Bu tez esasen arama motorlarında bulunan ön yargıları tartışmalı konular üzerinden, ve arama platformlarında bulunan cinsiyetçi ön yargıları da çevrimiçi eğitim odağında analiz ediyor. Arama motorlarına özgü ön yargıları analiz etmek için, üç yeni sıralama ve ilgililik tabanlı metrik önerildi. Bu metrikler kullanılarak Bing ve Google'ın arama sonuçları web dokümanlarının içeriği üzerinden tutumsal (destekliyor veya karşı) veya ön yargı ve ideolojik (muhafazakar veya liberal) ön yargı olarak iki kısımda incelendi. Ek olarak, lokasyonun bu ön yargı sonuçlarına olan etkisi incelendi. Son olarak, arama motoru sonuçları ön yargının kaynağı -- ön yargının veri setinden mi yoksa sıralama algoritmasından mı geldiğinin anlaşılması için incelendi. Cinsiyetçi ön yargının çevrimiçi eğitimde değerlendirilmesi için, bu kapsama uygun iki yeni sıralama ve ilgililik tabanlı metrik önerildi. Sonrasında YouTube'un STEM ve NON-STEM alanları ile ilgili sorgulara karşılık döndürdüğü video arama sonuçları video'daki anlatıcının bilgileri kullanılarak incelendi. Son olarak, video arama sonuçlarındaki cinsiyetçi ön yargının kaynağı bu amaca özgü bir şekilde adapte edilmiş metriklerle araştırıldı.
Search is ubiquitous. People continue to seek information through popular search engines, Bing and Google as well as online search platforms, YouTube. Nonetheless, they tend to think that these platforms are objective by only displaying information without injecting any bias. Since users are more susceptible to bias when they are unaware of it, it is important to evaluate the retrieved search results of the aforementioned platforms with respect to bias. This thesis analyses two main things as search engine bias towards controversial issues and gender bias in the context of online education. For evaluating specifically search engine bias, three novel rank and relevance-based measures have been proposed and search results of two widely-used search engines Google and Bing have been analysed through web documents' content with respect to stance (in support or against), and ideological bias (conservative or liberal). Then, the impact of geolocation on the bias has been investigated. Lastly, in the scope of search engine bias, the source of bias has been tracked, to check whether the bias (if exists) comes from the input data, or the ranking algorithm. For assessing gender bias in online education, two new rank and relevance based measures that are more suitable in the scope of gender bias have been proposed. Further, video search results returned by YouTube towards the queries in STEM and NON-STEM fields have been analysed using narrators' information. Lastly, the source of gender bias has been investigated by proposing the specifically-curated gender bias measures.