Tez No İndirme Tez Künye Durumu
311939
Visual attention models and applications to 3-D computer graphics / 3-B bilgisayar grafiklerinde görsel dikkat modellemeleri ve uygulamaları
Yazar:MUHAMMED ABDULLAH BÜLBÜL
Danışman: YRD. DOÇ. DR. TOLGA ÇAPIN
Yer Bilgisi: İhsan Doğramacı Bilkent Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Bölümü
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayar grafikleri = Computer graphics ; Dikkat = Attention ; Görme-binoküler = Vision-binocular ; Görsel algılama = Visual perception
Onaylandı
Doktora
İngilizce
2012
161 s.
3-B bilgisayar grafikleri, gelişen teknolojik imkanların da etkisiyle, çok yüksek seviyelere ulaştı ve günümüzde gerçeğe oldukça yakın görüntüler, bilgisayar oyunları ve diğer kullanıcı etkileşimi içeren uygulamar, gerçek zamanlı olarak üretilebiliyor. Fakat bilgisayar grafikleri alanındaki araştırmaların limitlerine ulaştığını iddia edemeyiz. Foto gerçekçi görüntüleme halen gerçek zamanlı olarak başarılamamakta olup, görsel kaliteyi artırmak ve görüntüleme maliyetlerini azaltmak araştırma alanı olarak ilgi odağı olmayı sürdürmektedir.Son zamanlarda bilgisayar grafikleri alanındaki uğraşlar, görüntüleme kalitesini artırmak amacıyla görsel algı prensiplerini kullanmaya yöneldi. Bu, bilgisayar grafiklerinde, temel değerlendirme kriterinin insanların yargıları ve dolayısıyla algıları olmasının doğal bir sonucu. Bu tezde hedefimiz, görsel algı prensiplerinin bilgisayar grafikleri için kullanımını artırmaktır. Bu tezin literatüre katkısı iki alanda incelenebilir: Birincisi, 3-B sahnelerde görsel olarak önemli, dikkat-çeker, kısımları tespit etmeye yönelik sunulan modeller; ikincisi de, dikkat-çekerlik ölçütlerinin bilgisayar grafiklerinde kullanımına yapılan katkılar.İnsanlarda görsel dikkat mekanizmasının iki kısmı vardır. İlk kısım, uyaranlara bağlı, aşağıdan yukarıya görsel dikkat olup; ikinci kısım göreve bağlı, yukarıdan aşağıya görsel dikkat olarak adlandırılmaktadır. Bu iki kısım arasındaki en önemli fark izleyicinin rolüdür. Yukarıdan aşağıya görsel dikkatte, aşağıdan yukarıya dikkatten farklı olarak, izleyicinin niyeti ve görevi sahnenin nasıl algılandığını etkiler. çalışmalarımızda daha çok, içerisinde dikkat-çekerliği de barındıran aşağıdan yukarıya görsel dikkati araştırdık.İki türlü grafiksel içerik türü için dikkat-çekerlik ölçütleri tanımladık. İlk ölçüt, 3-B hareketli grafiksel modeller için geliştirilmiş olup, modelin her düğümüne bir dikkat-çekerlik değeri atamaktadır. İkinci model ise birden çok nesne barındıran bir animasyon sahnesinde, hareketlerinden dolayı görsel olarak önemli hale gelen nesneleri tespit etmeye yöneliktir. üçüncü bir model de ise, ikinci modelde önerilen modelin ilk modelde kullanılan grafiksel içeriklere nasıl uygulanacağı gösterilmiştir.Tezde, dikkat-çekerlik ölçütlerinin yanısıra, ölçütlerin muhtemel kullanım alanları ve ikili (stereo) görüntüleme için algıya bağlı bir optimizasyon yöntemi de sunulmuştur. Bu yöntem ikili görme prensiplerine dayanmakta olup, sahnenin dikkat-çekerlik bilgisinden yararlanmaktadır.Sunulan yöntemlerin her biri, deneyler vasıtasıyla değerlendirildi. Dikkat-çekerlik ölçütlerinin değerlendirmesinde göz takip cihazı kullanıldı ve dikkat-çeker olarak belirtilen kısımlara daha çok bakıldığı tespit edildi. İkili görüntüleme için önerilen yöntem de, ayrıntılı bir kullanıcı testi ile doğrulandı.Sonuç olarak, sunulan tez görsel sisteme dair prensiplerin, özellikle dikkat-çekerlik ile ilgili olanların, 3-B bilgisayar grafiklerinde kullanımını genişletmektedir.
3D computer graphics, with the increasing technological and computational opportunities, have advanced to very high levels that it is possible to generate very realistic computer-generated scenes in real-time for games and other interactive environments. However, we cannot claim that computer graphics research has reached to its limits. Rendering photo-realistic scenes still cannot be achieved in real-time; and improving visual quality and decreasing computational costs are still research areas of great interest.Recent efforts in computer graphics have been directed towards exploiting principles of human visual perception to increase visual quality of rendering. This is natural since in computer graphics, the main source of evaluation is the judgment of people, which is based on their perception. In this thesis, our aim is to extend the use of perceptual principles in computer graphics. Our contribution is two-fold: First, we present several models to determine the visually important, salient, regions in a 3D scene. Secondly, we contribute to use of definition of saliency metrics in computer graphics.Human visual attention is composed of two components, the first component is the stimuli-oriented, bottom-up, visual attention; and the second component is task-oriented, top-down visual attention. The main difference between these components is the role of the user. In the top-down component, viewer's intention and task affect perception of the visual scene as opposed to the bottom-up component. We mostly investigate the bottom-up component where saliency resides.We define saliency computation metrics for two types of graphical contents. Our first metric is applicable to 3D mesh models that are possibly animating, and it extracts saliency values for each vertex of the mesh models. The second metric we propose is applicable to animating objects and finds visually important objects due to their motion behaviours. In a third model, we present how to adapt the second metric for the animated 3D meshes.Along with the metrics of saliency, we also present possible application areas and a perceptual method to accelerate stereoscopic rendering, which is based on binocular vision principles and makes use of saliency information in a stereoscopic rendering scene.Each of the proposed models are evaluated with formal experiments. The proposed saliency metrics are evaluated via eye-tracker based experiments and the computationally salient regions are found to attract more attention in practice too. For the stereoscopic optimization part, we have performed a detailed experiment and verified our model of optimization.In conclusion, this thesis extends the use of human visual system principles in 3D computer graphics, especially in terms of saliency.