Tez No İndirme Tez Künye Durumu
397276
A unified framework for stroke fragmentation and sketch recognition / Çizim vuruşlarının bölütlenmesi ve çizim tanıma için bütünleşik bir yaklaşım
Yazar:RECEP SİNAN TÜMEN
Danışman: DOÇ. DR. TEVFİK METİN SEZGİN
Yer Bilgisi: Koç Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Eskiz = Sketch ; Kullanıcı arayüz sistemleri = User interface systems ; Örüntü tanıma = Pattern recognition
Onaylandı
Doktora
İngilizce
2015
100 s.
Kalem tabanlı etkileşimi destekleyen donanımlar uzun zamandır mevcut olmasına rağmen, bu sistemlerin girdilerinin etkin ve sağlıklı bir şekilde işlenmesi nispeten geri kalmış bir konudur. Bu durum kısmen çizim tanıma probleminin üssel karmaşıklığından kaynaklanmakta olup, bahse konu karmaşıklık orta büyüklükteki bir çizim için dahi bilinen yöntemler ile en iyi çözümü bulmayı imkansız hale getirmektedir. Mevcut çizim tanıma sistemleri, karmaşıklık problemini aşmak için ya basitleştirici varsayımlar kullanmakta, ya da en iyi olmayan çözümleri kullanıcıya sunmaktadır. Bu tezde, çizim tanıma problemi için, mevcut metodların aksine en iyi tanıma çözümünü çokterimli bir karmaşıklıkta bulabilen, eğitilebilir bir çerçeve yaklaşım sunulmaktadır. Sunulan yaklaşım, çevrimiçi çizimlerin yanısıra, çevrimdışı ve herhangi bir sıra izlemeyen çizimler için de kullanılabilmekte, kullanıcı girdisi hakkında herhangi bir varsayımda bulunmamaktadır. Önerilen yaklaşım, denetimli öğrenme teknikleri, çizge teorisi ve dinamik programlama metodlarına dayanmaktadır. Çalışmamızda sunulan çerçeve yaklaşım, aşağıdan yukarıya çizim tanıma probleminin iki temel alt problemi olan vuruşların parçalanması ve çizim bölütlenmesi problemlerine başarı ile uygulanmıştır. Ayrıca çevrimdışı ve belirli bir çizim sırası izlemeyen çizimler için, uzamsal sıralama metodu geliştirilmiş, uzamsal sıralama için birden çok çizge algoritması ve birden falza bağdaşım ölçüsü tanımlamıştır. Önerilen metodların doğruluğu ve çalışma süreleri birden çok veri setinde denenmiş, deneyler sonucunda, geliştirilen yaklaşımın, bazı veri setlerinde bilinen en iyi çizim tanıyıcılar ile başabaş sonuçlar verdiği, bazılarında ise farklı derecede iyi sonuçlar ürettiği tespit edilmiştir.
Hardware supporting pen-based interaction have been around for a long time, however progress in efficient and intelligent processing of input has been lagging far behind. This is partly due to the complicated nature of the sketch recognition problem. Optimal sketch recognition is intractable even for moderate-sized sketches. Recent methods deal with the problem either by making simplifying assumptions or by adopting sub-optimal methods. In this thesis, as an alternative to the sub-optimal methods, we describe an optimal and polynomial-time trainable framework for multi-domain sketch recognition. Our solution handles offline and interspersed sketches as well as online sketches, and it does not make assumptions about user input. Our unified framework is based on supervised machine learning techniques, graph theory, and dynamic programming. We apply the framework to two fundamental problems of bottom-up sketch recognition: stroke fragmentation and sketch segmentation. Dynamic programming approach is directly applicable to the fragmentation of strokes and segmentation of ordered primitives. For other cases, such as offline and interspersed sketches, we introduce the \textit{spatial serialization} concept to impose an order on the primitives. We propose different graph theoretic methods and coherence models to convert 2D points into an ordered set of primitives. We evaluate the accuracy and runtime of different serialization schemes on multiple datasets. For both fragmentation and segmentation problems, experiments show that the accuracy of the unified framework either matches with the state-of-the-art, or it surpasses them by a large margin.