Tez No İndirme Tez Künye Durumu
153483 Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.
Semantic video modeling and retrieval with visual, auditory, textual sources / Görsel, işitsel, yazısal kaynaklarla video modellenmesi ve erişimi
Yazar:NURCAN DURAK
Danışman: PROF. DR. ADNAN YAZICI
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Yüksek Lisans
İngilizce
2004
108 s.
oz GÖRSEL, İŞİTSEL, YAZISAL KAYNAKLARLA ANLAMSAL VİDEO MODELLENMESİ ve ERİŞİMİ Durak, Nurcan Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Profesör Dr. Adnan Yazıcı Eylül 2004, 95sayfa İçeriğe dayalı video indeksleme ve erişim çalışmaları, videonun içeriğine farklı yönlerden daha etkin ve başarılı bir şekilde ulaşılmasını amaçlar. Çalışmaların çoğu, video içeriğinin modellenmesinde ve erişilmesinde görsel bileşen üzerine yoğunlaşmıştır. Görsel içeriğin yanında diğer medya bileşenleri de değerli bilgiler taşır. Diğer medya bileşenleri video üzerinde ki yazılar, başlıklar, işitsel bilgiler, resimlere eşlik eden konuşmalar olabilir. Bu çalışma videonun anlamsal içeriğini görsel, işitsel ve yazısal bileşenler kullanarak modellemektedir. Görsel alanda, görsel olaylar, görsel nesneler ve görsel nesnelerin uzaysal- zamansal özellikleri çıkartılmıştır. İşitsel alanda, işitsel olaylar ve işitsel nesneler çıkartılmıştır. Yazısal alanda, konuşma metni ve video üzerindeki yazılar göz önüne alınmıştır. Önerdiğimiz modelle, kullanıcılar video içeriğine farklı yönlerden ulaşabilirler ve istedikleri bilgiyi daha çabuk elde ederler. Çok-biçimli yapısının yanında, modelimiz video içeriğini farklı anlamsal katmanlarda sorgulayabilmek için anlamsal hiyerarşiler üzerine kurulmuştur. Görsel alanda sekans-sahne hiyerarşileri, işitsel alanda arkaplan-önplan hiyerarşileri, konuşma alanında da konu hiyerarşileri vardır. Tanıtılan model geliştirilmiş ve çok-biçimli sorgulamalar, hiyerarşik sorgulamalar, bulanık konumsal sorgulamalar, bulanık bölgesel sorgulamalar, bulanık uzaysal-zamansal sorgulamalar, ve zamansal sorgulamalar video içeriği üzerine başarıyla uygulanmıştır. Anahtar Kelimeler: Çok-biçimli Video Modelleme ve Erişme, İşitsel, Görsel, Yazısal, Uzaysal-Zamansal.
ABSTRACT SEMANTIC VIDEO MODELING AND RETRIEVAL WITH VISUAL, AUDITORY, TEXTUAL SOURCES Durak, Nurcan M.S., Department of Computer Engineering Supervisor: Prof. Dr. Adnan Yazıcı September 2004, 95pages The studies on content-based video indexing and retrieval aim at accessing video content from different aspects more efficiently and effectively. Most of the studies have concentrated on the visual component of video content in modeling and retrieving the video content. Beside visual component, much valuable information is also carried in other media components, such as superimposed text, closed captions, audio, and speech that accompany the pictorial component. In this study, semantic content of video is modeled using visual, auditory, and textual components. In the visual domain, visual events, visual objects, and spatial characteristics of visual objects are extracted. In the auditory domain, auditory events and auditory objects are extracted. In textual domain, speech transcripts and visible texts are considered. With our proposed model, users can access video content from different aspects and get desired information more quickly. Beside multimodality, our model is constituted on semantic hierarchies that enable querying the video content at different semantic levels. There are sequence-scene hierarchies in visual domain, background-foreground hierarchies in auditory domain, and subject hierarchies in speech domain. Presented model has been implemented and multimodal content queries, hierarchical queries, fuzzy spatial queries, fuzzy regional queries, fuzzy spatio-temporal queries, and temporal queries have been applied on video content successfully. Keywords: Multimodal Video Modeling and Retrieval, Audio, Visual, Textual, Spatio- temporality. IV