Tez No İndirme Tez Künye Durumu
352242
Çoklu ses kayıtları içeren bir parkinson konuşma veri kümesinin toplanması ve analizi / Collection and analysis of a parkinson speech dataset with multiple types of sound recordings
Yazar:BETÜL ERDOĞDU ŞAKAR
Danışman: PROF. DR. AHMET SERTBAŞ ; DOÇ. DR. OLCAY KURŞUN
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyomühendislik = Bioengineering ; Nöroloji = Neurology
Dizin:Parkinson hastalığı = Parkinson disease ; Ses bozuklukları = Voice disorders ; Ses işleme = Speech processing ; Yapay zeka = Artificial intelligence ; Örüntü tanıma = Pattern recognition
Onaylandı
Doktora
Türkçe
2014
127 s.
Teknoloji ilerledikçe, tıp alanında kestirimci uzaktan tanı ve takip sistemlerinin kullanımı gittikçe artmaktadır. Bu tip sistemler tansiyon ve şeker gibi yaygın hastalıkların teşhis, tanı ve takibinde sıklıkla kullanılmaktadır. Bu sistemlere artan ilgiyle birlikte, Parkinson hastalığının teşhis, tanı ve takibinde kullanılabilecek konuşmadan örüntü tanıma uygulamalarına olan ilgi de artmıştır. Bu amaçla, bu çalışmada Parkinson hastaları için bir dizi konuşma alıştırmasından derlenmiş sürekli sesli harfleri, kelimeleri ve cümleleri içeren farklı ses örnekleri toplanmıştır. Her denek için birden fazla ses kaydı içeren bu tür bir veri kümesi üzerinde çalışacak kestirimci bir yapay öğrenme modeli çıkarımında iki temel sorun bulunmaktadır. Birincisi, bu farklı ses örneklerinin Parkinson hastalığının teşhisinde ne kadar kestirimci olabileceğini tahmin etmektir. Diğeri ise, bir deneğin tüm örnek ses kayıtları yerine bu kayıtların merkezi eğilim ve dağılım ölçütlerini kullanmanın bu deneğin tüm kayıtlarını ne kadar temsil edeceğidir. Bu çalışmanın amacı toplanan Parkinson veri kümesi üzerinde çeşitli yapay öğrenme algoritmalarını kullanarak hangi ses örneğinin daha başarılı sonuçlar vereceğini bulmak; ayrıca merkezi eğilim ve dağılım ölçütlerini kullanarak ses örneklerinden çıkarılan temsili değişkenlerin başarısını ölçmektir. Yapılan bu çalışma sonucunda toplanan Parkinson veri kümesi üzerinde kullanılan popüler yapay öğrenme algoritmaları göstermiştir ki daha önce yapılan çalışmalarda da gösterildiği gibi sürekli sesli harfler daha fazla ayırt edici bilgi içermektedir. Ayrıca bir deneğe ait farklı ses örneklerinin merkezi eğilim ve dağılım ölçütleri ile gösterimini kullanmak kestirimci modelin ayırt edici özelliğini arttırmaktadır. Anahtar kelimeler: merkezi eğilim ve dağılım ölçütleri, çapraz geçerleme, çoklu ses türleri, konuşma bozuklukları, Parkinson hastalığının uzaktan tanısı.
As the tecnological progress advances, usage of predictive telediagnosis and telemonitoring systems in the medical area is also increasing. These kind of systems have already been used for the diagnosis and monitoring of widespread diseases like tension (hyper/hipo) and diabetes. With the increasing interest to these systems, there has been an increased interest in speech pattern analysis applications of Parkinsonism for building predictive telediagnosis and telemonitoring models. For this purpose, we have collected a wide variety of voice samples, including sustained vowels, words, and sentences compiled from a set of speaking exercises for People with Parkison's (PWP). There are two main issues in learning from such a dataset that consists of multiple speech recordings per subject: (i) how predictive these various types, e.g. sustained vowels vs. words, of voice samples are in Parkinson's Disease (PD) diagnosis? (ii) how well the central tendency and dispersion metrics serve as representatives of all sample recordings of a subject? One of the aims of this thesis study is to investigate the performance of popular machine learning tools on different voice samples. Additionally the success of using the representations of the voice samples with the central tendency and dispersion metrics is also examined. This study showed that investigating our Parkinson dataset using well-known machine learning tools, as reported in the literature, sustained vowels are found to carry more PD-discriminative information. It is also found that rather than using each voice recording of each subject as an independent data sample, representing the samples of a subject with central tendency and dispersion metrics improves generalization of the predictive model. Keywords: central tendency and dispersion metrics, cross validation, multiple sound types, speech impairments, telediagnosis of Parkinson's disease.