Tez No İndirme Tez Künye Durumu
338491
Attention based image retrieval / Dikkat tabanlı görüntü erişimi
Yazar:GÜLŞAH TÜMÜKLÜ ÖZYER
Danışman: PROF. DR. FATOŞ T. YARMAN VURAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2012
146 s.
Bu tez çalışmasında, dikkat tabanlı görüntü erişim (DTGE) sistemi olarak adlandırılan görsel dikkate dayalı bir içerik tabalı görüntü erişim (İTGE) sistemi önerildi. Önerilen DTGE sistemi, içerik tabanlı görüntü erişimini, insan algılamasını göz önüne alarak tanımlıyor. Itti ve Koch tarafından geliştirilen görsel dikkat modeline dayalı, etkili ve İTGE problemine özgün bir sistem önerildi. Önerilen DTGE sistemi, sorgu görüntüsünü ve veri setindeki görüntüleri birlikte kullanarak İTGE yaklaşımını bir dikkat görevi olarak ele alır.DTGE sistemi belirginlik bilgisini kullanan belirginlik haritası hesaplama, alan çıkarma, öznitelik çıkarma ve benzerlik eşleştirmesi adımlarından oluşmaktadır. Belirginlik haritası hesaplamak için aşağıdan yukarıya düzgeleme, yukarıdan aşağıya düzgeleme ve yukarıdan aşağıya öznitelik haritası ağırlıklandırma algoritmaları önerildi. Bu algoritmalar Itti-Koch modelinin düzgeleme ve öznitelik haritası birleştirme adımlarını İTGE problemine uyarlar. Belirgin bölgelerin öznitelikleri, belirginlik tabanlı öznitelik birleştirme ve belirginlik tabanlı öznitelik seçme algoritmaları ile çıkarıldı. İki görüntü arasındaki benzerlik yine görüntülerde ki bölgelerin belirginlik bilgisine dayalı bir eşleştirme algoritması ile hesaplandı. Önerilen sistem, STIM ve SIVAL nesne veri setlerinde ve yüksek çözünürlüklü havalimanı görüntülerinde test edildi. Elde edilen deney sonuçlarına göre, önerilen sistem en son gelişmeleri yansıtan İTGE sistemlerinden daha iyi erişim perfomansı göstermiştir.
This thesis proposes a content-based image retrieval (CBIR) system based on the human visual attention, called Attention-based Image Retrieval (ABIR). The proposed ABIR system handles CBIR problem from the perspective of human perception. An efficient visual attention model specific to CBIR problem derived from the computational visual attention model of Itti and Koch is suggested. ABIR system defines the CBIR system as an attention task, where query and images in the database are considered together to extract region of interests.The ABIR system consists of saliency map computing, region extraction, feature extraction and similarity matching steps using the saliency information. Bottom-up Normalization Algorithm, Top-down Normalization Algorithm and Top-down Feature Map Weighting Algorithm are proposed to compute the saliency maps. Bottom-up normalization and top-down normalization algorithms attack the normalization process of Itti-Koch model to compute saliency of images. Bottom-up normalization algorithm computes the normalization parameters from the all images in the dataset. On the other hand, top-down normalization algorithm normalizes the images in the dataset by using query image. Top-down feature map weighting algorithm combines the feature maps of an image in the dataset by using the query image. The features of salient regions are computed by using proposed the saliency-based feature integration algorithm and saliency-based feature selection algorithm. A saliency-based similarity matching algorithm ranks the images with respect to the query image. The proposed ABIR system is tested on STIM and SIVAL object datasets and high resolution airport images. The retrieval results are superior compared to the selected state of the art CBIR systems.