Tez No |
İndirme |
Tez Künye |
Durumu |
539080
|
|
Algısal özet fonksiyonları tabanlı derin öğrenme yöntemleri kullanılarak imgelerin sınıflandırılması / Classification of images by using deep learning methods based on perceptual hash functions
Yazar:FATİH ÖZYURT
Danışman: PROF. DR. ENGİN AVCI
Yer Bilgisi: Fırat Üniversitesi / Fen Bilimleri Enstitüsü / Yazılım Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
Türkçe
2019
92 s.
|
|
Endüstri ve akademik çevredeki veri bilimcileri; makine öğrenmesini, imge
sınıflandırmasını, video analizini, konuşma tanıma ve doğal dil işleme süreçlerini pek çok
alanda kullanmaktadırlar. İmge sınıflandırma aşamasında, özniteliklerin manuel olarak
çıkartılması uzmanlık gerektiren bir alandır. Bu nedenle, öznitelik çıkarma aşaması imge
sınıflandırılması için örüntü tanımada en önemli adım olarak kabul edilmektedir. Derin
öğrenme algoritmaları, imgelerin manuel öznitelik çıkarma özelliğini ortadan kaldırmak için
aktif bir araştırma alanı haline gelmiştir. Ancak imgelerde piksel seviyesinde işlem
yapılması nedeniyle çalışma zamanını arttırmaktadır. Algısal özet fonksiyonları, imgelerin
belirgin özniteliklerini tespit ederek özet değeri oluşturmaktadır. Dolayısıyla algısal özet
fonksiyonu ile elde edilen öznitelik verilerine imgenin parmak izi de denilebilir.
Bu tez çalışmasında imge yapısını bozmayan algısal özet fonksiyonu kullanılarak direkt
ham imgelerden belirgin öznitelikler elde edilmiştir. Seçilen algısal özet fonksiyonunun
performansını değerlendirmek için Bit Hata Oranı (BHO), Ortalama Karesel Hata (OKH),
Tepe Sinyal Görüntü Oranı (TSGO) gibi parametreler ile karşılaştırılarak başarımları test
edilmiştir. Veri tabanı olarak Fırat Üniversitesi hastanesinden alınan karaciğer tümör verileri
ve halka açık veri tabanı olan Caltech-101 verileri kullanılmıştır. Derin öğrenme
mimarilerinden Evrişimsel Sinir Ağ (ESA) algoritması, Ayrık Dalgacık Dönüşümü (ADD)
– Tekil Değer Ayrışımı (TDA) tabanlı algısal özet fonksiyonu ile birlikte kullanılmıştır.
Bu doktora tez çalışmasının amacı, algısal özet fonksiyonu tabanlı ESA kullanarak
yüksek boyutlu imgelerin sabit diskteki kapladığı boyutu azaltan, sınıflandırma sürelerini
kısaltıp sınıflandırma performansını kabul edilebilir bir eşiğin üzerinde tutmaktadır. ADDTDA tabanlı Algısal Özet Fonksiyonu (AÖT) ile ESA birlikte ilk defa kullanılarak
özniteliklerin çıkarılması amaçlanmıştır. Karaciğer ve Caltech-101 veri tabanında bulunan
çeşitli imgelere uygulanan AÖT-ESA yöntemi ile çıkartılan öznitelikler önerilen yöntemin
başarımını test etmek için Yapay Sinir Ağları (YSA), Destek Vektör Makineleri (DVM), Ken Yakın Komşu (KNN) gibi sınıflandırıcılara verilmiştir. AÖT-ESA yöntemi, bir taraftan
sınıflandırma performansının gelişimine katkı sunarken diğer taraftan da uzun süren çalışma
zamanı probleminin çözümüne katkıda bulunmuştur.
|
|
Machine learning, image classification, video analysis, speech recognition and natural
language processing are widely used by data scientisits in both industrial and academic world
for various purposes. The manuel extraction of the features requires a certain expertise
during the image classification stage. Thus, the feature extraction phase is considered to be
the most important step in pattern recognition for image classification. Deep learning
algorithms have become an active research area to remove the manuel feature extraction step
of images. However, image processing take considerable long execution times as it operates
at the pixel level. The salient characteristics of images are determined by perceptual hash
functions which give a certain hash value. Therefore, the feature data obtained by the
perceptual hash function can also be called the fingerprint of the image.
In this thesis, salient features are obtained directly from raw images by using perceptual
hash function which does not distort image structure. Comparisons have been made by
considering some parameters as BER, MSE, PSNR to evaluate the performance of the
proposed perceptual hash function. Liver disease images obtained from Elazig University
Hospital Radiology Laboratory, and Caltech-101 (publicly available database) images were
used as a database. The Convolutional Neural Network (CNN) algorithm, one of the deep
learning architectures, was used with the Discrete Wavelet Transform (DWT) - Singular
Value Decomposition (SVD) based perceptual hash function.
The aim of this doctorate thesis is to reduce the classification time of the high-dimensional
images and their sizes on hard disk while maintaining the classification performance above
an acceptable threshold by using perceptual hash based CNN. It is intended to extract the
features by using both DWT - SVD based perceptual hash function and the CNN for the
first time together. The results obtained by applying the our proposed method to the liver
and the Caltech-101 image database were evaluated by considering some known classifiers
such as Artificial Neural Networks (ANN), Support Vector Machines (SVM), K-nearest
Neighbor (KNN). The proposed method not only improves the classification performance
but also provides a positive impact on the excessive runtime problem. |