Tez No İndirme Tez Künye Durumu
397974
Active audio-visual human tracking for robots / Robotlar için aktif işitsel-görsel insan takibi
Yazar:BARIŞ BAYRAM
Danışman: YRD. DOÇ. DR. GÖKHAN İNCE
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayarla görme = Computer vision ; Görsel-işitsel materyaller = Audio-visual materials ; Robot denetim = Robot control ; Robotik = Robotics ; Yapay zeka = Artificial intelligence ; Yüz bulma = Face detection ; İşaret işleme = Signal processing ; İşitme sistemi = Auditory system
Onaylandı
Yüksek Lisans
İngilizce
2015
75 s.
Bu tezde, işitsel ve/veya görsel olarak karmaşık çevreler ve şartlar altında robotların algılama yetisini iyileştirmek için, çoklu kipli/sensörlü sistem tasarlanılmıştır. Gerçek zamanda koşan bu sistem 1) işitme kipi, bu kipe destek olması amacıyla 2) görme kipi ve bu iki kipten gelen verilere dayalı akıllı davranış örüntüleri yaratmak için önerilen 3) hareket kipi olmak üzere üç kipten oluşmaktadır. Ortamdaki konuşmacının tespiti, lokalizasyonu ve takibi, işitme ve görü kiplerinin, bağımsız olarak gerçekleştirdiği başlıca görevleridir
In this thesis, a multimodal system is designed in the form of an active audio-visual perception in order to improve the perceptual capability of a robot in a noisy environment. The system running in real-time uses 1) audition modality, 2) a complementary vision modality and 3) motion modality incorporating intelligent behaviors based on the data obtained from both sensory modalities. In this system, the detection, localization and tracking of the speaker are the main tasks of audition and vision modalities independently.