Tez No İndirme Tez Künye Durumu
255252
Image annotation with semi-supervised clustering / Yarı denetimli kümeleme ile görüntü etiketleme
Yazar:AHMET SAYAR
Danışman: PROF. DR. FATOŞ T. YARMAN VURAL
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Görüntü işleme = Image processing ; Örüntü tanıma = Pattern recognition
Onaylandı
Doktora
İngilizce
2009
164 s.
Görüntü etiketleme, mevcut etiketlenmiş görüntü eğitim kümelerinden öğrenerek, verilen bir resim için bir dizi kelime üretilmesi olarak tanımlanabilir.Otomatik görüntü etiketleme yöntemlerinde görsel bilgiyi nicelemek için genelde bölge küme-leme algoritmaları kullanılmaktadır. Görsel kod tabloları, bölgelerden elde edilen düşük düzeyli görsel özniteliklerin kümelenmesiyle elde edilir. Bu kod tabloları görüntü etiketleriyle değişik yöntemler kullanılarak eşleştirilmektedir.Bu tezde, etiketlenmiş görüntülerde mevcut ancak, kullanılmayan bilgileri kullanarak kümele-me işlemini iyileştiren yeni bir görüntü etiketleme tekniği önerilmektedir. "Ek bilgi" adı verilen bazı öznitelikler kümeleme işlemini denetlemek için kullanılmaktadır. Bu tezde, üç tip ek bilgi önerilmektedir. İlki, görüntü etiketlerini kapsayan metin dokümanınından otomatik olarak elde edilen gizli konu olasılıkları bilgisidir. Diğer ikisi görüntünün önemli yerlerini işaret eden ilgi noktaları etrafından elde edilen yön ve renk bilgileridir. Bu ek bilgiler, yarı denetimli k-ortalama bölge kümeleme algoritmasına bir dizi kısıt sağlamak amacı ile değerlendirilirler. Böylece, bölgelerin kümelemesinde sadece düşük seviyeli görsel öznitelik-ler değil, aynı zamanda bu ek bilgiler de kullanılmış olur. Bu tamamlayıcı ek bilginin görüntü bölgelerinden elde edilen düşük seviyeli öznitelikler ile yüksek seviyeli metin bilgisi arasına anlambilimsel açığı kapatması beklenir.Sonuç olarak, görsel kod tabloları ve görüntü etiket kelimeleri arasında daha iyi bir ilişki elde edilmiş olur. Ayrıca, uyarlanan K-ortalama algoritmasında kullanılan kısıtlar nedeniyle algoritma performansında hızlanma sağlanmıştır. Önerilen algoritma yüksek performanslı paralel hesaplama ortamında gerçeklenmiştir.
Image annotation is defined as generating a set of textual words for a given image, learning from the available training data consisting of visual image content and annotation words.Methods developed for image annotation usually make use of region clustering algorithms to quantize the visual information. Visual codebooks are generated from the region clusters of low level visual features. These codebooks are then, matched with the words of the text document related to the image, in various ways.In this thesis, we propose a new image annotation technique, which improves the representation and quantization of the visual information by employing the available but unused information, called side information, which is hidden in the system. This side information is used to semi-supervise the clustering process which creates the visterms. The selection of side information depends on the visual image content, the annotation words and the relationship between them.The side information provides a set of constraints in a semi-supervised K-means region clustering algorithm. Consequently, in generation of the visual terms from the regions, not only low level features are clustered, but also side information is used to complement the visual information, called visterms. This complementary information is expected to close the semantic gap between the low level features extracted from each region and the high level textual information. Therefore, a better match between visual codebook and the annotation words is obtained. Moreover, a speedup is obtained in the modified K-means algorithm because of the constraints brought by the side information.