Tez No İndirme Tez Künye Durumu
535329
Data engineering and management in textile sector / Tekstil sektöründe veri mühendisliği ve yönetimi
Yazar:PELİN YILDIRIM
Danışman: DOÇ. DR. DERYA BİRANT
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2019
147 s.
Son dönemlerde, tekstil endüstrisinde her gün devasa miktarda veri üretilmektedir. Bu çok değişkenli ve doğrusal olmayan veriler, tekstil ürününün hammadde özelliklerini, makine ayarlarını, işlem parametrelerini ve kalite niteliklerini içerir. Bu ham verilerden faydalı örüntülerin ve değerli bilginin elde edilmesi, tekstil ürünlerinin kalite ve verimliliğini arttırmak için doğru kararlar almayı sağlar. Bu amaca istinaden, bu tez, tekstil sektöründe veri madenciliği ve makine öğrenmesi tekniklerinin uygulanmasına odaklanmaktadır. Veri mühendisliği, veri işleme ve analizi için veri madenciliği teknikleri ile ilgilenen bir disiplindir. Veri madenciliği teknikleri üç ana kategoride gruplandırılabilir: sınıflandırma, kümeleme ve birliktelik kuralı analizi. Bu tezde, her kategori için çeşitli durum çalışmaları gerçekleştirilmiştir. Sınıflandırma temelli durum çalışmalarında, tekstil nesnelerinin ayırt edilmesi için derin öğrenme yöntemlerinin uygulanmasının yanı sıra, tekstil sektöründe tahminleme performansını iyileştirmek (örn. örgü yapıların delinme performansını belirlemek) için de topluluk öğrenmesi yöntemleri önerilmiştir. Kümelemeye dayalı bir çalışma olarak ise, k-Linkage isimli, küme çifti arasındaki benzerliği hesaplamak için iki kümeden de k tane örneklemi göz önünde bulunduran yeni bir hiyerarşik kümelenme yaklaşımı önerilmiştir. Birliktelik kuralı analizi çalışmasında, iplik ve kumaş özellikleri arasındaki ilişkilerin ortaya çıkarılması için genişletilmiş bir FP-Growth algoritması kullanılmıştır. Tezde, önerilen yöntemlerin performansını göstermek adına her bir çalışma için çeşitli deneysel çalışmalar gerçekleştirilmiştir. Her bir deneyde, önerilen yaklaşımlar gerçek tekstil verileri üzerinde uygulanmış ve mevcut yöntemler ile farklı değerlendirme ölçütleri açısından karşılaştırılmıştır. Genel olarak, her bir deneyden elde edilen sonuçlar, bu tezde önerilen yaklaşımlarla geleneksel çözümlere göre daha doğru değerlere ulaşıldığını göstermektedir.
Recently, enormous amounts of data are generated every day in textile industry. These multivariable and nonlinear data include raw material characteristics, machine settings, process parameters and quality attributes of the textile product. Deriving useful patterns and valuable knowledge from these raw data provides making right decisions to increase quality and productivity for textiles. To serve the purpose, this thesis focuses on the application of the data mining and machine learning techniques in the textile sector. Data engineering is a discipline that concerns with data mining techniques for data processing and analysis. Data mining techniques can be grouped in three main categories: classification, clustering, and association rule mining. In this thesis, several case studies were conducted for each category. In the classification-based case studies, ensemble learning methods were proposed to improve prediction performance in textile sector (i.e. to determine stab resistance performances of knitted structures) as well as deep learning methods for textile object identification. As a clustering-based study, a novel hierarchical clustering approach, named k-Linkage, was proposed that calculates resemblance between pair of clusters considering k samples from two clusters. In the association rule mining study, an extended FP-Growth algorithm was used to discover the relationships between yarn and fabric properties. In the thesis, several experimental studies were performed for each study to demonstrate the performances of the proposed methods. In each experiment, the proposed approaches were applied on real-world textile data and compared with the existing approaches in terms of different evaluation measures. In general, the results obtained from each experiment indicate that the proposed approaches in this thesis achieve more accurate results than the conventional solutions.