Tez No İndirme Tez Künye Durumu
363037
Gerçek-zamanlı video-oküulografik bakış yönü tespit ve takip sisteminin tasarımı ve gerceklemesi / Design and implementation of a real-time video-oculographic gaze detection and tracking system
Yazar:CİHAN TOPAL
Danışman: DOÇ. DR. CÜNEYT AKINLAR
Yer Bilgisi: Anadolu Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Elektrik ve Elektronik Mühendisliği = Electrical and Electronics Engineering
Dizin:
Onaylandı
Doktora
İngilizce
2014
132 s.
Bu tez çalışması kapsamnda video tabanlı bakış noktası tespit yöontemleri üzerinde çalışılmıştır. Tam anlamyla işlevsel bir bakış noktası tespit sistemi genel olarak üç ana bileşenden oluşmaktadır. Bunlardan birincisi göz imgelerinden gerekli özniteliklerin çıkarılmasıdır. İkincisi ilk aşamada elde edilen bilgileri kullanarak belirli bir matematiksel ya da geometrik modele göre bakış noktasının tespit edilmesidir. Üçüncüsü ise gözizleme sisteminin sağlayabildiği hassasiyet miktarında bilgisayarı veya başka bir cihazı kullanabilmeyi sağlayan arayüz uygulamalarıdır. Tez çalışmaları süresince özgün ve tamamıyla işlevsel bir göz takip sistemi geliştirilmesi amaçlanmış ve bu doğrultuda göz takip sistemini oluşturan üç bileşen için de araştırma ve geliştirme faaliyetleri gerçekleştirilmiştir. İlk aşama için göz imgelerinden gürbüz ve hızlı bir şekilde gözbebeği konturunu çıkaran bir algoritma tasarlanmıştır. Bu algoritmalardan beklenen en önemli özellikler göz kapağı, kirpikler ve yansımalardan dolayı oluşan kapatmaların olduğu durumlarda bile çalışabilmeleri ve gözbebeğinin merkezini hassas bir şekilde tespit edebilmeleridir. Geliştirilen gözbebeği tesipt algoritmasında bu problemlerin çözümü amaçlanmış ve önemli ölçüde ilerleme sağlanmaştır. İkinci aşamada göz imgelerinden elde edilen öznitelikler kullanılarak bakış noktasının 3-boyutta tespit edilmesi amaçlanmıştır. Bu adımda çözülmesi gereken en önemli problem geliştirlen yöntemin baş hareketlerini telafi ederek gürbüz bir şekilde çalışabilmesidir. Önerilen sistemle bu özelliği destekleyen bir göz izleme modeli geliştirilmiştir. Bu modelle hem kalibrasyon hem de izleme aşamalarında gerçekleşen baş hareketlerinin telafisi önemli ölçüde sağlanmakta, hem de diğer 3B bakış noktası tespit yöntemleri gibi zahmetli geometrik kalibrasyon gerektirmemektedir. Son aşamada ise göz izleme sistemleriyle kullanılırken hızlı bir şekilde metin girişi sağlayabilecek özgün bir klavye arayüzü tasarlanmış ve geliştirilmiştir. Birçok farklı kullanıcıyla gerçekleştirilen deneylerin sonucunda geliştirdiğimiz arayüzün son derece başarılı olduğu ispatlanmıştır.
In this thesis, real-time video-oculographic Point of Gaze (PoG) computation methods have been investigated. A fully functional PoG system generally consists of three main components. The rst is to extract features from eye images. The second is to compute PoG based on a mathematical or geometric model using the information obtained in the rst step. The third is to design and develop a user-friendly application to operate the computer or allow fast text entry using the accuracy provided by the eye tracking system. To come up with a novel and fully functional eye tracking system at the end of the thesis, research and development for all three components of the system have been performed. In the rst step of the project, a robust and real-time algorithm has been designed to detect the boundary of the pupil in an eye image. The algorithm not only detects the pupil boundary and the center when the pupil is in clear sight, but it also succeeds even in tough occlusive cases where the pupil is partly covered by eye lashes or the eyelid. In the second step, Point of Gaze has been computed in 3D using the eye features obtained in the rst step. The major problem to solve in this step was to compensate head movements during PoG computation. An eye tracking model was developed to support this feature in the proposed system. Using the proposed solution, head movements can be tolerated by calibration and tracking for 3D PoG computation without the need for complex geometric computations. In the last step, a novel and user-friendly On Screen Keyboard (OSK) has been developed that is used together with the eye tracking system for fast textual entry. In our gaze interface, we try to enhance users' word input rates as they are typing with their glances. Experiments performed with many participants have shown that the developed OSK is easy to adapt and can signi cantly boost the text input throughput.