Tahıl ürünlerinin besin değerlerinin ve kimyasal bileşimlerinin analizi, ürünlerin kalitesinin belirlenmesinde önemli bir rol oynamaktadır. Bu analiz işlemi genellikle özel test cihazları ve uzun test süreci gerektirmesi nedeniyle pratik yöntemlere ihtiyaç duyulmaktadır. Yakın kızılötesi spektroskopisi, hızlı ve düşük maliyetli analiz kabiliyeti ve tahribatsız ölçüm gibi özellikleri nedeniyle son yıllarda yaygın olarak kullanılan bir yöntem haline gelmiştir. Yakın kızılötesi spektroskopisinin birçok farklı alanda kullanımı bulunmasına rağmen, bu bölgede soğurma gösteren atomik bağlar nedeniyle asıl uygulama alanı gıda sektörü olmuştur.
Yakın kızılötesi spektroskopisinde spektrum verileri laboratuvar veya el tipi spektrometreler ile elde edilmektedir. Spektrum verileri gerek bu cihazların elektronik veya optik bileşenlerinden kaynaklı, gerekse de ortam kaynaklı çeşitli gürültüler içermektedir. Bu nedenle spektrum verileri öncelikle ön işleme tabi tutulmaktadır. Ön işleme için literatürde çeşitli yöntemler bulunsa da kullanılacak ön işleme yöntemi deneme yanılma yoluyla belirlenmektedir. Bu durum kullanılacak regresyon modelinin başarısını doğrudan etkilemektedir. Son yıllarda popüler olan yapay sinir ağları ve derin öğrenme algoritmalarını yakın kızılötesi spektroskopi ile birleştirmek, bu alana yeni bir bakış açısı getirerek, daha güvenilir modeller oluşturulabilmesini sağlamıştır.
Bu tez çalışmasında, yakın kızılötesi spektroskopisinde kullanmak üzere denetimsiz öğrenme türü olan evrişimsel otokodlayıcı modeli oluşturulmuştur. Bu modelle, her bir dalga boyu verisi özellik olarak kabul edilen, bu nedenle özellik sayısı fazla olan spektrum verilerinden daha düşük boyutlu özellikler çıkartılmıştır. Çıkarılan bu özellikler kullanılarak hedef parametresinin tahmini için çoklu doğrusal regresyon modeli oluşturulmuştur. Önerilen yöntem mısır tanelerinin spektrumunu içeren veri seti üzerinde test edilmiştir. Üç farklı spektroskopi cihazının spektrumlarını ve dört farklı hedef kalite parametresi içeren bu veri setinde her bir cihaz için bir evrişimsel otokodlayıcı modeli ve bu modelle çıkarılan özellikleri kullanarak her bir hedef parametresi için çoklu doğrusal regresyon modeli oluşturulmuştur. Önerilen yöntemin sonuçlarını karşılaştırmak için popüler ön işleme yöntemleri olan çarpımsal saçılma düzeltmesi, standart normal değişken, ortalama merkezleme ve Savitzky-Golay filtreleme ile popüler kemometri yöntemleri olan kısmi en küçük kareler regresyonu ve temel bileşenler regresyon yöntemlerinin kombinasyonları kullanılmıştır. Önerilen yöntemin popüler kemometri yöntemlerine göre daha üstün bir performans gösterdiği görülmüştür.
|
Analysis of the nutritional values and chemical composition of cereal products plays an important role in determining the quality of the products. This analysis process usually requires special testing equipment and a long testing process so more practical methods are required. Near-infrared spectroscopy has become a widely used method in recent years due to its fast and cost-effective analysis and non-destructive measurement capability. Although near-infrared spectroscopy has many applications in different fields, the main application area has been the food industry due to atomic bonds showing absorption in this region.
In near-infrared spectroscopy, spectral data is obtained using laboratory or handheld spectrometers. Spectrum data contains various noises originating from the electronic or optical components of these devices as well as from the test environment. For this reason, the spectral data must first be pre-processed. Although there are various methods in the literature for preprocessing, the preprocessing method to be used is determined by trial and error. This situation directly affects the success of the regression model to be used. Combining artificial neural networks and deep learning algorithms, which have become popular in recent years, with near-infrared spectroscopy has brought a new perspective to this field and enabled the creation of more reliable calibration models.
In this thesis, a convolutional autoencoder model, which is an unsupervised deep learning model type, was built for use in near-infrared spectroscopy. With this model, low-dimensional features were extracted from the spectral data, which has a large number of features because each wavelength data is considered as one feature. Using these extracted features, a multiple linear regression model was built to estimate target parameters. The proposed method was tested on the dataset containing the spectrum of corn seeds. In this dataset, containing the spectra obtained from three different spectroscopy devices and four different reference quality parameters, a convolutional autoencoder model was built for each device and then a multiple linear regression model was built for each target parameter using the features extracted from the autoencoder model. To compare the results of the proposed method, combinations of common preprocessing methods such as multiplicative scatter correction, standard normal variate, mean centering, and Savitzky-Golay filtering, as well as common chemometric methods, partial least squares regression and principal component regression, were used. It has been observed that the proposed method outperforms popular chemometric methods. |