Tez No |
İndirme |
Tez Künye |
Durumu |
397974
|
|
Active audio-visual human tracking for robots / Robotlar için aktif işitsel-görsel insan takibi
Yazar:BARIŞ BAYRAM
Danışman: YRD. DOÇ. DR. GÖKHAN İNCE
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgisayarla görme = Computer vision ; Görsel-işitsel materyaller = Audio-visual materials ; Robot denetim = Robot control ; Robotik = Robotics ; Yapay zeka = Artificial intelligence ; Yüz bulma = Face detection ; İşaret işleme = Signal processing ; İşitme sistemi = Auditory system
|
Onaylandı
Yüksek Lisans
İngilizce
2015
75 s.
|
|
Bu tezde, işitsel ve/veya görsel olarak karmaşık çevreler ve şartlar altında robotların
algılama yetisini iyileştirmek için, çoklu kipli/sensörlü sistem tasarlanılmıştır. Gerçek
zamanda koşan bu sistem 1) işitme kipi, bu kipe destek olması amacıyla 2) görme kipi
ve bu iki kipten gelen verilere dayalı akıllı davranış örüntüleri yaratmak için önerilen
3) hareket kipi olmak üzere üç kipten oluşmaktadır. Ortamdaki konuşmacının tespiti,
lokalizasyonu ve takibi, işitme ve görü kiplerinin, bağımsız olarak gerçekleştirdiği
başlıca görevleridir
|
|
In this thesis, a multimodal system is designed in the form of an active audio-visual
perception in order to improve the perceptual capability of a robot in a noisy
environment. The system running in real-time uses 1) audition modality, 2) a
complementary vision modality and 3) motion modality incorporating intelligent
behaviors based on the data obtained from both sensory modalities. In this system,
the detection, localization and tracking of the speaker are the main tasks of audition
and vision modalities independently. |