Uzaktan algılama yöntemleri, algılama için sinyal gönderip göndermemelerine göre aktif ve pasif olarak iki alt başlıkta incelenmektedir. Pasif uzaktan algılama yöntemleri arasında yer alan hiperspektral görüntüleme son yıllarda gelişen görüntüleme teknolojisiyle araştırmacılar tarafından üzerinde yoğun olarak çalışılan bir alandır. Hiperspektral görüntüler, elektromanyetik spektrumda görünür bölgeden kızılötesi bölgeye kadar olan spektrumda spektral bantlara sahiptir. Hiperspektral görüntüleme kendisinden bir önceki teknoloji olan multispektral görüntülemeye göre daha fazla bant sayısına sahiptir. Multispektral görüntüler 4 ila 10 arasında spektral bantlara sahipken, hiperspektral görüntüler yüzün üzerinde bantlara sahiptir. Hiperspektral görüntüler, sivil ve askeri alanlarda birçok uygulamada kullanılmaktadır, çünkü hiperspektral görüntülerde her piksel ifade ettiği bölgenin neredeyse sürekli sinyal bilgisini elde etmeye olanak sağlar.
Hiperspektral görüntülerin uçak ve uydular ile elde edilmesinden dolayı algılayıcı ve algılanan madde arasında atmosfer tabakası bulunmaktadır. Bu nedenle, hiperspektral görüntülerde atmosferik etkilerden gürültü oluşmaktadır. Oluşan bu etkiler bazı bantlarda diğer bantlara oranla daha fazla etkiye sahiptirler. Bu nedenle hiperspektral görüntülerde bazı bantlar sağlayıcı tarafından atılmaktadır. Bunun yanında uygulama alanlarına göre farklılık gösterse de, hiperspektral görüntüler üzerinde yapılacak analiz işlemlerinden önce bir çok çalışmada çeşitli gürültü giderimi yöntemleri uygulanmaktadır. Bu tez çalışmasında da temel bileşen analizi ve bağımsız bileşen analizi uygulanarak bu gürültü etkisinin giderilmesi hedeflenmiştir.
Veri etiketleme diğer alanlarda olduğu gibi hiperspektral görüntüleme alanında da zaman ve iş gücü açısından maliyetli bir işlemdir. Bu nedenle makine öğrenmesi alanında araştırmacılar az sayıdaki etiketli örnekle, görüntü analizi yapmayı hedeflemektedirler. Bunun için ortaya atılan yöntemlerin genel adına da yarı-güdümlü öğrenme ismi verilmiştir. Yarı-güdümlü öğrenme yapısı nedeniyle melez bir öğrenme şeklidir. Etiket bilgisinin kullanılmadığı eğiticisiz/güdümsüz kümeleme yöntemleriyle, etiket bilgisinin kullanıldığı eğiticili/güdümlü sınıflama yöntemlerinin arasındaki yöntemlerdir. Yarı-güdümlü öğrenme yöntemleri hem etiketli hem de etiketsiz veri bilgilerini kullanarak az sayıdaki etiketli örnekle hedefine ulaşmayı amaçlamaktadırlar. Bu tez çalışmasının temel amacı hiperspektral görüntülerin az sayıdaki etiketli örnekle yarı-güdümlü olarak sınıflandırılmasıdır.
Yarı-güdümlü öğrenme yöntemleri temel olarak iki aşamadan oluşmaktadır. Bunlardan ilki etketli örnekleri seçimi, ikinci ise bu örneklerin etiketlenmesidir. Etiketleme süreci kadar etiketli örnek seçimi de önemlidir. Tez çalışmasının ilk bölümünde artımsal bir model olan kendi kendine öğrenme yöntemiyle yarı-güdümlü öğrenme uygulanmıştır. Burada etiketli örnek seçimi k-ortalamalar ve yarı-güdümlü öğrenme literatürde ilk defa uygulanan eksiltici kümeleme ile gerçekleştirilmiştir. Temel amaç en çok fayda/bilgi sağlayacak örneklerin seçilmesidir. İkinci aşama olan etiketsiz verilerin etiketlenmesinde ise artımsal bir model temel alınmıştır. Yarı-güdümlü olarak etiketlenen eğitim kümesinin ardından test kümesi çekirdek destek vektör makineleri ve çekirdek seyrek gösterim sınıflayıcısı gibi iki farklı güdümlü öğrenme yöntemiyle sınıflandırılmıştır. Bu sınıflandırıcı sonuçları karar aşamasında çeşitli şekillerde birleştirilerek sistem sonucu elde edilmiştir. Ayrıca bu bölümde çeşitli öznitelik seçim ve çıkarım yöntemleri uygulanarak sistem başarımına etkileri nesnel olarak gözlemlenmiştir.
Tez çalışmasının diğer bölümünde yarı-güdümlü öğrenme yöntemlerinin bir diğer çeşidi olan graf-tabanlı bir sistem önerilmiştir. Bu yapıda eğitim verisi veya tüm veriler bir graf üstüne yerleştirilerek aşama aşama etiketleme işlemi gerçekleştirilmektedir. Graf tabanlı yapıda komşu piksellerin de işin içine katılmasıyla uzamsal bilgi kullanılmıştır. Grafta sadece eğitim örnekleri kullanıldıysa test örnekleri yine farklı sınıflayıcılar ile sınıflanarak sınıflama sonuçları karar seviyesinde birleştirilmiştir. Bu bölümde, derin öğrenme tabanlı sınıflandırıcı, sınıflandırıcılara dahil edilmiştir ve sınıflandırma sonuçları karar aşamasında eklenmiştir. Ayrıca graf tabanlı yapının hesaplama işlemleri grafik işleme ünitesine aktarılmıştır. Bu sayede eğitim ve test örneklerinin tamamının graf tabanlı sistem ile etiketlenmesine olanak sağlanmıştır. İki farklı çözümün sonuçları ve literatürde ön plana çıkan çalışmaların sonuçları karşılaştırılmıştır.
1980' li yıllarda ortaya çıkan yapay sinir ağları teknolojinin gelişmesiyle derin sinir ağları olarak tekrar ortaya çıkmıştır, ve diğer makine öğrenmesi yöntemleriyle elde edilemeyen başarımlara ulaşılmasına imkan sağlamıştır. Tez çalışmasının son bölümünde derin öğrenme tabanlı bir sistem önerilmiştir. Önerilen sistem temel olarak aynı özelliklere sahip hiperspektral veri kümeleri için tek bir derin modelin eğitilmesini ve diğer veri kümelerinin bu modeli kullanarak öznitelik çıkarım işlemlerini gerçekleştirmesini hedeflemektedir. Sistemde öncelikle hiperspektral görüntülerin derin öğrenme modellerine girdi olabilmesi için yeni bir veri dönüşüm modeli önerilmiştir. Ayrıca diğer makine öğrenmesi alanlarında sıklıkla kullanılan ince-ayar (fine-tuning) yöntemi yarı-güdümlü hiperspektral veri analizinde ilk kez kullanılmıştır. Sistemde ince-ayarla elde edilen modelden derin öznitelik vektörleri elde edilerek bu vektörler üzerinde etiketli örnek seçimi için 5 farklı kümeleme yöntemi uygulanmıştır. Bunun temel amacı farklı kümeleme yöntemlerinin sistem başarımına etkisinin araştırılmasıdır. Yarı-güdümlü öğrenme aşamasında ise transdüktif destek vektör makineleri (transductive support vector machines) ve ilk defa önerilen yarı-güdümlü seyrek gösterim sınıflayıcısı kullanılmıştır. Elde edilen sınıflama sonuçları literatürdeki en gelişkin yöntemler ile karşılaştırılmıştır.
Özet olarak bu tez çalışmasında, az sayıda etiketli örneğe sahip hiperspektral verilerin yarı-güdümlü olarak sınıflandırılması için yeni sistem çözümleri ve yeni yaklaşımlar önerilmesi amaçlanmıştır. Çalışmanın uzaktan algılama, makine öğrenmesi, görüntü işleme, yarı-güdümlü öğrenme ve derin öğrenme alanlarında çalışan araştırmacılar için faydalı bir kaynak olması hedeflenmiştir.
|
Remote sensing methods are examined in two sub-headings as active and passive according to whether they send signals for detection. Hyperspectral imaging, which is one of the passive remote sensing methods, is an area that has been studied extensively by the researchers with the imaging technology developed in recent years. Hyperspectral images have spectral bands in the electromagnetic spectrum from the visible region to the infrared region. Hyperspectral imaging has a greater number of bands than multispectral imaging, which is the prior art. Multispectral images have spectral bands in range 4 to 10, while hyperspectral images have over hundred bands. Hyperspectral images are used in many applications in civilian and military fields, since each pixel in hyperspectral images allows to obtain almost continuous signal information of the region it expresses.
Due to the acquisition of hyperspectral images by airplanes and satellites, there is an atmosphere layer between the sensor and the perceived substance. Therefore, noise is generated due to atmospheric effects on hyperspectral images. These effects have more effect on some bands than other bands. Therefore, some bands are discarded by the provider in hyperspectral images. In addition to this, various noise removal methods are applied in many studies before analyzing the hyperspectral images. In this thesis, it is aimed to eliminate this noise effect by applying principle component analysis and independent component analysis.
Data labeling is a costly process in other areas, as well as in the field of hyperspectral imaging, in terms of time and labor. For this reason, in the field of machine learning, researchers aim to carry out image analysis with a small number of labeled samples. For the purpose of this, the general name of the proposed methods is called semi-supervised learning. It is a hybrid form of learning because of its semi-supervised learning structure. The methods are between the non-guided/unsupervised clustering methods, which are not using label information and the guided/supervised classification methods, which are using the label information. Semi-supervised learning methods aim to achieve their goal with a few labeled samples by using both labeled and unlabeled data information. The main purpose of this thesis is to classify hyperspectral images as semi-supervised with a small number of labeled samples.
Semi-supervised learning methods are mainly composed of two stages. The first of these is the selection of the labeled samples and the second is the labeling of these samples. Selecting the labeled samples is as important as the labeling process. In the first part of the thesis, semi-supervised learning was applied by self-learning/self-training method which is an incremental model. Here, the labeled sample selection was performed by subtractive clustering, which is applied for the first time in the semi-supervised learning literature, and k-means clustering. The main purpose is to select the samples that will provide the most benefit/information. In the second step is based on an incremental model for labeling of unlabeled data. Following semi-supervised learning of the training set, the test set was classified by two different supervised learning techniques, such as kernel support vector machines and kernel sparse representation classifier. The results of the classifiers were combined in various ways at the decision level to obtain the system result. In addition, various feature selection and extraction methods have been applied in this section and the effects on system performance have been observed objectively.
In the other part of the thesis study, a graph-based system which is another type of semi-supervised learning methods has been proposed. In this structure, step-by-step labeling is carried out by placing the training data or all data on a graph. Spatial information was used in the graph based structure with the addition of neighboring pixels. If only the training samples were used in the graph, the test samples were labeled with different classifiers and the classification results were combined in the decision level. In this section, the deep learning-based classifier is included to the classifiers, and the classification results are added in the decision stage. In addition, the calculation of the graphi-based structure was transferred to the graphics processing unit. In this way, it is possible to label all the training and test samples with the graph-based system. The results of two different solutions and the results of the state of the art studies in the literature are compared.
Artificial neural networks that emerged in the 1980s, have emerged once again as deep neural networks with the development of technology, and have enabled the achievement of achievements that could not be achieved by other machine learning methods. In the last part of the thesis, a deep learning-based system has been proposed. The proposed system basically aims to train a single deep model for hyperspectral datasets with the same characteristics, and to extract the features using this model for all data sets. In the system, a new data transformation model has been proposed in order to enable hyperspectral images to be an input to the deep learning models. In addition, fine-tuning technique, which is frequently used in other machine learning fields, was used for the first time in semi-supervised hyperspectral data analysis. Deep feature vectors were obtained from the fine-tuned model in the system and 5 different clustering methods were applied for the labeled sample selection from these vectors. The main purpose of this is to investigate the effect of different clustering methods on system performance. Semi-supervised sparse representation classifier which is proposed for the first time and transductive support vector machines were used in the semi-supervised learning phase. The classification results were compared with the state of the art studies in the literature.
In summary, this thesis study aims to propose new system solutions and new approaches for the classification of hyperspectral data with a small number of labeled samples as semi-supervised. The study aims to be a useful resource for remote sensing, machine learning, image processing, semi-supervised learning and deep learning. |