Ses, bir iletişim aracı olmasının dışında kişinin kimliği, ruhsal durumu ve fiziksel sağlığı gibi konularda da gösterge oluşturmaktadır. İnsan seslerinden psikolojik tanıda, duygu durumu tespitinde ve kişi tanımada nesnel ve öznel yöntemler kullanılmaktadır. Algısal değerlendirme öznel bir değerlendirme yöntemidir ve konuşmaların uzman kişiler tarafından dinlenip yorumlanması ile gerçekleştirilir. Bu nedenle sonuçlar uzmanın tecrübesine göre değişkenlik göstermektedir. Bu sorunun üstesinden gelmek için nesnel değerlendirme yöntemleri kullanılmaktadır. Akustik analiz, sesten çeşitli parametreler elde edilerek ses yapısının nesnel olarak değerlendirmesi için kullanılır.
Duygusal durum üzerine yapılan çalışmalardaki en büyük sınırlılık duygusal durumun tam olarak tetiklendiği verilerin edinilmesidir. Ayrıca, anksiyete temel bir duygu olmayıp birden fazla duygunun kombinasyonu olduğu için sadece anksiyete içeren hazır veri seti bulunmamaktadır. Çoğunlukla korku duygusu ile birlikte incelenmiştir.
Duygusal durumların akustik parametreler üzerindeki etkileri çeşitli çalışmalarda araştırılmıştır. Ancak, yapılan çalışmalar ya sınırlı sayıda akustik parametre üzerinden gerçekleştirilmiş ya da hazır veri setleri kullanılmıştır. Ayrıca, anksiyetenin akustik parametreler üzerindeki etkisi ayrıntılı olarak araştırılmamış ve sınırlı sayıda parametre kullanılmıştır.
Bu tez çalışmasının konusu, seslerden akustik parametrelerin tespit edilmesi ve anksiyetenin akustik parametreler üzerindeki etkilerinin ayrıntılı incelenmesidir. Bu amaçla konuşma işleme ve akustik analiz için MATLAB ortamında SPAC isimli bir yazılım geliştirilmiştir. SPAC'ın literatürdeki yazılımlara göre üstünlüğü kullanıcı dostu grafiksel arayüze ve modüler yapıya sahip olması, son işleme ve sınıflandırma modülerini içermesi ve seslerden elde ettiği akustik parametre sayısı ve çeşitliliğidir. SPAC ile öznitelik kümelerinin katsayılarına bağlı olarak 723 ve üzeri akustik parametre elde edilebilmektedir.
Geçerlilik testi sonuçlarına göre, SPAC ile elde edilen akustik parametreler diğer araçlarla benzerlik göstermektedir. Sınıflandırma testi sonuçlarına göre SPAC ile elde edilen akustik parametreler her sınıfı tanımlayabilmektedir. Sonuç olarak hazırlanan yazılım ile elde edilen parametreler ses verisini doğru şekilde tanımlamaktadır. Ayrıca, SPAC ile edilen dalgacık katsayıları diğer araçlarla elde edilememekte ve parametrelerin Δ ve Δ2 değerleri her araç tarafından desteklenmemektedir.
Anksiyetenin akustik parametreler üzerindeki etkisini araştırmak için Gülhane Eğitim ve Araştırma Hastanesi Psikiyatri Anabilim Dalı Başkanlığında yatan ve ayaktan hastalardan ses kayıtları toplanmıştır. Olgu-kontrol niteliğindeki bu deneysel çalışmada, anksiyete bozukluğu olan hastalar ile sağlıklı kontrol grubunun nötr ve anksiyöz olmak üzere 2 duyguya ilişkin 3 ayrı ses kaydı alınmıştır. Olguların anksiyete düzeyleri uluslararası standartlarda olan psikometrik ölçeklerle değerlendirilmiştir.
Toplanan ses kayıtlarının akustik analizi SPAC ile yapılmıştır. SPAC ile elde edilebilen 9 kategorideki akustik parametrelerin istatistiksel olarak ortalama ve standart sapma değerleri analizlere dahil edilmiştir. Bu nedenle 723 parametre 122'ye düşürülmüştür. Bu parametrelerin anksiyete ile ilişkisini tespit etmek için istatistiksel analiz yöntemleri kullanılmıştır. Analiz sonuçlarına göre 122 parametrenin 42'si anksiyete durumunda değişim göstermiştir. Duygunun tetiklenmesi için metin okutmanın da anksiyeteyi ortaya çıkarmada etkili olduğu görülmüştür.
Yapılan çalışma sonucunda, konuşma işleme ve akustik analiz için geniş öznitelik kütüphanesine sahip ve modüler bir yazılım geliştirilmiştir. Analizler sonrasında, literatüre ek olarak formant frekanslarının bant genişliği, Mel-Frekans Kepstral Katsayıları, Doğrusal Öngörü Kepstral Katsayıları ve dalgacık katsayılarının da anksiyeteden etkilendiği tespit edilmiştir. Anksiyete üzerindeki etkili parametreler önem sırasına göre F0, F1, F2, F3, jitter, LPCC, MFCC ve dalgacık katsayıları şeklinde sıralanabilir. Ayrıca, olguların hasta ve sağlam ayrımında temel frekans, formant frekansı, konuşma oranı ve dalgacık katsayıları ön plana çıkmaktadır.
|
Voice is an indicator of the identity, mental state, and physical health of an individual other than being a communication tool. Psychological diagnosis, emotional state detection and person recognition from human voices are realized by objective and subjective methods. Perceptual evaluation is a subjective evaluation method and is carried out by listening and interpreting the speeches by the experts. Therefore, the results vary according to the experience of the expert. Objective evaluation methods are used to overcome this problem. Acoustic analysis is used in order to obtain several parameters form voice and objectively evaluate voice disorders.
The greatest limitation in studies on the emotional state is the acquisition of data in which the emotional state is precisely triggered. In addition, since anxiety is not a basic emotion but rather a combination of multiple emotions, there are no ready data sets containing only anxiety. It has often been studied with fear.
The effects of emotional states on acoustic parameters have been investigated in various studies. However, studies have been performed on a limited number of acoustic parameters, or have used preliminary data sets. In addition, the effect of anxiety on acoustic parameters has not been investigated in detail and a limited number of parameters have been used.
The purpose of this thesis is to determine acoustic parameters from sounds and to investigate the effects of anxiety on acoustic parameters. For this purpose, a software named SPAC was developed in the MATLAB environment for speech processing and acoustic analysis. The superiority of SPAC over software in the literature is that it has a user-friendly graphical interface and modular structure, including the finishing and classification modalities and the number of acoustic parameters obtained from the sounds. With SPAC, acoustic parameters can be obtained over 723 depending on the coefficients of the feature sets.
The according to the results of validation test, acoustic parameters obtained with SPAC similar to other tools. According to the results of classification test, acoustic parameters obtained with SPAC can define every class. As a result, parameters obtained by the prepared software correctly describe the voice data. Moreover, the wavelet coefficients with SPAC cannot be obtained with other software, and the values of Δ and Δ2 of the parameters are not supported by each software.
To investigate the effect of anxiety on acoustic parameters, voice records were collected from outpatient and inpatient in the Gülhane Education and Research Hospital Psychiatry Department. In this case-control experimental study, three separate voice recordings were taken for two emotions, being neutral and anxious from patients with anxiety disorder and healthy control group. The anxiety levels of the cases were assessed with psychometric scales that are at international standards.
Acoustic analysis of collected sound recordings was performed with SPAC. Statistical mean and standard deviation values of the acoustic parameters in the 9 categories obtained by SPAC were included in the analyzes. For this reason, 723 parameters have been reduced to 122. The statistical analysis methods were used to determine the anxiety associations of these parameters. According to results of the analysis, 42 parameters showed change in anxiety case. It has also been shown that the text reader is also effective in generating anxiety for the triggering of feelings.
As a result of this work, a modular software has been developed with extensive feature library for speech processing and acoustic analysis. After the analyzes, in addition to literature, the bandwidth of the formant frequencies, Mel-Frequency Cepstral Coefficients, Linear Prediction Cepstral Coefficients and wavelet coefficients has also been found to be affected by anxiety. The effective parameters on the anxiety can be listed as F0, F1, F2, F3, jitter, LPCC, MFCC and wavelet coefficients according to importance order. In addition, the fundamental frequency, formant frequency, speech rate and wavelet coefficients are the most important parameters for separation of patient and health of cases. |