Tez No |
İndirme |
Tez Künye |
Durumu |
637494
|
|
Exploring mini-batch sample selection strategies for deep learning based speech recognition / Derin öğrenme tabanlı ses tanıma için mini-yığın örnek seçim stratejilerinin araştırılması
Yazar:YEŞİM DOKUZ
Danışman: DOÇ. DR. ZEKERİYA TÜFEKCİ
Yer Bilgisi: Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
İngilizce
2020
117 s.
|
|
Bu tez çalışması derin öğrenme tabanlı ses tanıma sistemleri için mini-yığın örnek seçim stratejileri önermeyi amaçlamaktadır. Derin öğrenme tabanlı ses tanıma sistemleri, derin öğrenme mimarilerinin popülaritesi ve başarıları ile birlikte çok daha yaygın ve ses tanıma alanında en modern sistem olmuştur. Özyinelemeli Sinir Ağları (ÖSA) ve Uzun Kısa Dönem Hafıza ÖSA ses tanıma uygulamaları için oldukça yaygın ve başarılı bir şekilde kullanılan mimarilerdir. Mini-yığın gradyan iniş algoritması derin öğrenme tabanlı ses tanıma sistemlerinde kabul görmüş bir eğitim algoritmasıdır. Mini-yığın gradyan iniş algoritması başarılı bir algoritmadır ancak bu algoritmanın problemlerinden biri her bir mini-yığın için eğitim örneklerini rastgele seçmesidir. Bu tez çalışmasında, derin öğrenme tabanlı ses tanıma sistemlerinin ses tanıma doğruluğunu artırmak için mini-yığın örnek seçim stratejileri önerilmiştir. Önerilen stratejiler ses veri kümelerinde bulunan cinsiyet ve aksan özellikleri gibi meta özellikleri kullanmaktadır. Cinsiyet tabanlı stratejiler, aksan tabanlı stratejiler ve cinsiyet ve aksan tabanlı stratejileri birlikte kullanan hibrit stratejiler olmak üzere üç tür örnek seçim stratejisi önerilmiştir. Deneysel sonuçlar önerilen stratejilerin derin öğrenme tabanlı ses tanıma sistemlerinin performansını artırmak için faydalı olduğunu göstermiştir.
|
|
This thesis aims to propose mini-batch sample selection strategies for deep learning based speech recognition systems. Deep learning based speech recognition systems became more prevalent and state-of-the-art system for speech recognition domain with the popularity and success of deep learning architectures. Recurrent Neural Networks (RNN) and Long Short-Term Memory (LSTM) RNN are widely and successfully utilized for the applications of speech recognition. Mini-batch gradient descent algorithm is generally accepted algorithm for training deep learning based speech recognition systems. Mini-batch gradient descent algorithm is a successful algorithm, but one of the main problems in mini-batch gradient descent is that the training samples are selected randomly for each mini-batch. In this thesis, mini-batch sample selection strategies are proposed to improve speech recognition accuracy of deep learning based speech recognition systems. Proposed strategies use meta features of speech corpuses, i.e. gender and accent features. Three types of sample selection strategies are proposed, i.e. gender adjusted strategies, accent adjusted strategies, and hybrid strategies that combine gender and accent adjusted strategies. The experimental results show that proposed strategies are beneficial for improving performance of deep learning based speech recognition systems. |