Tez No İndirme Tez Künye Durumu
787364
Algorithms for learning from online human behavior and human interaction with learning algorithms / İnsanların çevrimiçi davranışından ve öğrenme algoritmalarıyla etkileşiminden öğrenen algoritmalar
Yazar:GÖKHAN ÇAPAN
Danışman: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN ; PROF. DR. ALİ TAYLAN CEMGİL
Yer Bilgisi: Boğaziçi Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2022
134 s.
Modern dijital sistemlerde, kişiselleştirilmiş içerik sunan algoritmalar kullanıcı deneyimini şekillendirmekte; kullanıcı memnuniyetini ve kullanıcının sistemle uzun süreli ilişkisini etkilemektedir. Sistemin kullanıcıya gösterdikleri, erişilebilirlik için görünürlük çok önemli olduğundan, sisteme içerik sağlayan diğer partileri de etkilemektedir. Bu algoritmalar, kişiselleştirilmiş içerik sunmayı kullanıcı tercihleri için bir gösterge olarak geçmiş davranışlarından, örneğin, seçimlerinden, tıklamalarından, oylarından öğrenirler. Bu çalışmanın ilk kısmında kullanıcıların gösterilen içeriğe verdiği geribildirimden öğrenen yaygın modeller, katkılarımızı da içerecek şekilde incelenmektedir. Bu veri sürekli büyüdüğünden, öğrenme algoritmalarının hesaplama yönüne, ölçeklenebilir gerçekleşmeleri için yazılım kütüphanelerine ve bu alandaki katkımıza odaklanılmaktadır. Çalışmanın ikinci kısmı kullanıcıların algoritmik kişiselleştirme sistemleri ile etkileşimine odaklanmaktadır. Yararlı olsa da, davranış verisi, algoritmalara sorun teşkil edecek şekilde birçok bilişsel önyargı ve örnekleme yanılgısı içermektedir. Kullanıcılar sistemle ilişkide olduğu sürece sorun kötüleşir (algoritma gelecek gösterimlerini yanlı veriden yapar). Dahası algoritma, kullanıcı tercihleri ile ilgili yanlış inancını pekiştirir. Çalışmamız, kullanıcı önyargılarının bazılarını özetlemekte ve biriyle ilgilenmektedir: kullanıcının kendisine sunulan seçeneklerden birini seçme eğilimi. Bu eğilimi gözeten, kullanıcı tercihlerinin çıkarsanmasında onların tüm içeriğin sınırlı bir alt kümesine maruz kaldıklarını hesaba katan, Bayesçi bir seçim modeli geliştirilmiştir. Bu model, kullanıcı tercihlerini sistemle etkileşimlerinden öğrenen etkin bir çevrimiçi algoritmaya olanak vermektedir.
In modern digital systems, algorithms that deliver personalized content shape the user experience and affect user satisfaction, hence long-term engagement with the system. What the system presents also influences the parties providing content to the system since visibility to the user is vital for reachability. Such algorithms learn to deliver personalized content using data on previous user behavior, \eg, their choices, clicks, ratings, etc., interpreted as a proxy for user preferences. In the first part of this work, we review prevalent models for learning from user feedback on content, including our contributions to the literature. As such data is ever-growing, we discuss computational aspects of learning algorithms and focus on software libraries for scalable implementations, including our contributions. The second part is on learning from user interactions with algorithmic personalization systems. Albeit helpful, human behavior is subject to cognitive biases, and data sets comprising their item choices are subject to sampling biases, posing problems to learning algorithms that rely on such data. As users interact with the system, the problem worsens---the algorithms use biased data to compose future content. Further, the algorithms self-reinforce their inaccurate beliefs on user preferences. We review some of the biases and investigate a particular one: the user's tendency to choose from the alternatives presented by the system, putting the least effort into exploring further. To account for it, we develop a Bayesian choice model that explicitly incorporates in the inference of user preferences their limited exposure to a systematically selected subset of items by an algorithm. The model leads to an efficient online learning algorithm of user preferences through interactions.