Tez No İndirme Tez Künye Durumu
759162
Leveraging semantic saliency maps for query-specific video summarization / Sorguya özel video özetleme icin anlamsalbelirginlik haritalarından yararlanma
Yazar:KEMAL ÇİZMECİLER
Danışman: DOÇ. DR. MEHMET ERKUT ERDEM ; DOÇ. DR. AYKUT ERDEM
Yer Bilgisi: Hacettepe Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı / Bilgisayar Mühendisliği Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2022
99 s.
Otomatik video ozetleme, b ¨ uy¨ uk miktarda g ¨ orsel veriyi kolayca anlamamıza ve analiz ¨ etmemize yarayan bir tekniktir. Literaturdeki metotlar bunu videyu belli parc¸alara ayırarak ¨ ve bu parc¸alara bir onem de ¨ geri atayarak gerc¸ekles¸tirirler. Sorgu tabanlı ˘ ozet c¸ıkarmada ise ¨ sorgu terimlerinin nasıl onem de ¨ gerine dahil edilebilece ˘ gi aras¸tırılmıs¸tır. ˘ Bu c¸alıs¸mada sorgu tabanlı ozetlemede ¨ onem de ¨ geri atarken hangi kriterlerin etkili ˘ olabilecegi aras¸tırılmıs¸tır ve anlamsal ˘ oznitelikler ve g ¨ orsel belirginlik haritalarının katkı ¨ saglayabilece ˘ gi˘ one s ¨ ur¨ ulm¨ us¸t ¨ ur. Ayrıca sorgu terimlerinin sadece bazı aktiviteler olmaktan ¨ ziyade, aktivitenin gerc¸ekles¸tirildigi mekan veya aktiviteyi gerc¸ekles¸tiren akt ˘ or olabilece ¨ gi˘ ic¸in bu kavramlar da sorgu terimlerine dahil edilmis¸tir. Yapılan deneylerde, optimizasyona dahil edilen 3 fonksiyondan biri olan kapsama terimine anlamsal ve gorsel belirginlik ¨ haritalarının dahil edilmesinin olumlu katkı sagladı ˘ gı g ˘ ozlemlenmis¸tir. Optimizasyonda ¨ dikkate alınan diger iki fonksiyon ise temsil ve sorgu terimi yakınlı ˘ gıdır. Kısaca, insanların ˘ belli bir gorev dahilinde videoyu inceledi ¨ ginde baktı ˘ gı yerlerin de ˘ gis¸ebilece ˘ gi d ˘ us¸¨ uncesiyle ¨ (Gorev Odaklı Dikkat), videodaki ilgili yerlerin ¨ onceden belirlenmesi ve c¸ıkarılan ¨ ozetlerde ¨ iii bu bol¨ umlere a ¨ gırlık verilmesi faydalı olmus¸tur. ˘ ˙Iki buy¨ uk veri k ¨ umesi ¨ uzerinde yapılan ¨ ayrıntılı deneyler ve gorsel sonuc¸lar, ¨ one s ¨ ur¨ ulen hipotezin do ¨ grulu ˘ gunu g ˘ ozler ¨ on¨ une ¨ sermis¸tir.
Automatic video summarization is a technique that allows us to easily understand and analyze large amount of visual data. Methods in the literature do this by dividing the video into certain parts and assigning a significance value to these parts. In query-based summary extraction, how query terms can be included in the importance value has been investigated. In this study, it was investigated which criteria could be effective in assigning importance value in query-based summarization, and it is suggested that semantic attributes and visual salience maps could contribute. In addition, these concepts are also included in the query terms, since the query terms may be the place where the activity is carried out or the actor performing the activity, rather than just some activities. In the experiments, it has been observed that the inclusion of semantic and visual saliency maps in the diversity term, which is one of the 3 functions included in the optimization, makes a positive contribution. Two other functions considered in optimization are representation and query term relevance. In short, with the thought that the places people look at the video may change when they view the video within a certain task (Task-Oriented Attention), it is useful i to predetermine the relevant parts in the video and to give extra weight to these sections in the summaries. Detailed experiments and visual results on two large datasets have demonstrated the correctness of the proposed hypothesis.