Tez No İndirme Tez Künye Durumu
539080
Algısal özet fonksiyonları tabanlı derin öğrenme yöntemleri kullanılarak imgelerin sınıflandırılması / Classification of images by using deep learning methods based on perceptual hash functions
Yazar:FATİH ÖZYURT
Danışman: PROF. DR. ENGİN AVCI
Yer Bilgisi: Fırat Üniversitesi / Fen Bilimleri Enstitüsü / Yazılım Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2019
92 s.
Endüstri ve akademik çevredeki veri bilimcileri; makine öğrenmesini, imge sınıflandırmasını, video analizini, konuşma tanıma ve doğal dil işleme süreçlerini pek çok alanda kullanmaktadırlar. İmge sınıflandırma aşamasında, özniteliklerin manuel olarak çıkartılması uzmanlık gerektiren bir alandır. Bu nedenle, öznitelik çıkarma aşaması imge sınıflandırılması için örüntü tanımada en önemli adım olarak kabul edilmektedir. Derin öğrenme algoritmaları, imgelerin manuel öznitelik çıkarma özelliğini ortadan kaldırmak için aktif bir araştırma alanı haline gelmiştir. Ancak imgelerde piksel seviyesinde işlem yapılması nedeniyle çalışma zamanını arttırmaktadır. Algısal özet fonksiyonları, imgelerin belirgin özniteliklerini tespit ederek özet değeri oluşturmaktadır. Dolayısıyla algısal özet fonksiyonu ile elde edilen öznitelik verilerine imgenin parmak izi de denilebilir. Bu tez çalışmasında imge yapısını bozmayan algısal özet fonksiyonu kullanılarak direkt ham imgelerden belirgin öznitelikler elde edilmiştir. Seçilen algısal özet fonksiyonunun performansını değerlendirmek için Bit Hata Oranı (BHO), Ortalama Karesel Hata (OKH), Tepe Sinyal Görüntü Oranı (TSGO) gibi parametreler ile karşılaştırılarak başarımları test edilmiştir. Veri tabanı olarak Fırat Üniversitesi hastanesinden alınan karaciğer tümör verileri ve halka açık veri tabanı olan Caltech-101 verileri kullanılmıştır. Derin öğrenme mimarilerinden Evrişimsel Sinir Ağ (ESA) algoritması, Ayrık Dalgacık Dönüşümü (ADD) – Tekil Değer Ayrışımı (TDA) tabanlı algısal özet fonksiyonu ile birlikte kullanılmıştır. Bu doktora tez çalışmasının amacı, algısal özet fonksiyonu tabanlı ESA kullanarak yüksek boyutlu imgelerin sabit diskteki kapladığı boyutu azaltan, sınıflandırma sürelerini kısaltıp sınıflandırma performansını kabul edilebilir bir eşiğin üzerinde tutmaktadır. ADDTDA tabanlı Algısal Özet Fonksiyonu (AÖT) ile ESA birlikte ilk defa kullanılarak özniteliklerin çıkarılması amaçlanmıştır. Karaciğer ve Caltech-101 veri tabanında bulunan çeşitli imgelere uygulanan AÖT-ESA yöntemi ile çıkartılan öznitelikler önerilen yöntemin başarımını test etmek için Yapay Sinir Ağları (YSA), Destek Vektör Makineleri (DVM), Ken Yakın Komşu (KNN) gibi sınıflandırıcılara verilmiştir. AÖT-ESA yöntemi, bir taraftan sınıflandırma performansının gelişimine katkı sunarken diğer taraftan da uzun süren çalışma zamanı probleminin çözümüne katkıda bulunmuştur.
Machine learning, image classification, video analysis, speech recognition and natural language processing are widely used by data scientisits in both industrial and academic world for various purposes. The manuel extraction of the features requires a certain expertise during the image classification stage. Thus, the feature extraction phase is considered to be the most important step in pattern recognition for image classification. Deep learning algorithms have become an active research area to remove the manuel feature extraction step of images. However, image processing take considerable long execution times as it operates at the pixel level. The salient characteristics of images are determined by perceptual hash functions which give a certain hash value. Therefore, the feature data obtained by the perceptual hash function can also be called the fingerprint of the image. In this thesis, salient features are obtained directly from raw images by using perceptual hash function which does not distort image structure. Comparisons have been made by considering some parameters as BER, MSE, PSNR to evaluate the performance of the proposed perceptual hash function. Liver disease images obtained from Elazig University Hospital Radiology Laboratory, and Caltech-101 (publicly available database) images were used as a database. The Convolutional Neural Network (CNN) algorithm, one of the deep learning architectures, was used with the Discrete Wavelet Transform (DWT) - Singular Value Decomposition (SVD) based perceptual hash function. The aim of this doctorate thesis is to reduce the classification time of the high-dimensional images and their sizes on hard disk while maintaining the classification performance above an acceptable threshold by using perceptual hash based CNN. It is intended to extract the features by using both DWT - SVD based perceptual hash function and the CNN for the first time together. The results obtained by applying the our proposed method to the liver and the Caltech-101 image database were evaluated by considering some known classifiers such as Artificial Neural Networks (ANN), Support Vector Machines (SVM), K-nearest Neighbor (KNN). The proposed method not only improves the classification performance but also provides a positive impact on the excessive runtime problem.