Tez No İndirme Tez Künye Durumu
505664
Büyük veride makine öğrenmesi uygulaması / Machine learning application on big data
Yazar:MUSTAFA VAHİT KESKİN
Danışman: DR. ÖĞR. ÜYESİ DOĞAN YILDIZ
Yer Bilgisi: Yıldız Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Uygulamalı İstatistik Ana Bilim Dalı / İstatistik Bilim Dalı
Konu:İstatistik = Statistics
Dizin:
Onaylandı
Yüksek Lisans
Türkçe
2018
84 s.
Çağımızın petrolü olan veri hızla artan boyutu ve çeşitliliği ile kendisinden anlamlı bilgi çıkarma çalışmalarını zorlaştırmıştır. Geleneksel yöntemler ile işlenemeyen boyut ve türdeki verileri işleyebilmek adına ortaya çıkan büyük veri yazılımları veri analitiği çalışmalarına yeni bakış açıları getirmiştir. Tez kapsamında bulut servisi üzerinde büyük veri araçları kullanılarak büyük veride keşifçi veri analizi, büyük veri görselleştirmesi ve büyük veride makine öğrenmesi uygulamaları gerçekleştirilmiştir. Uygulamada Amazon Web Servisi Elastic Map Reduce, Apache Hadoop, Apache Hive, Apache Spark ve R Studio kullanılacaktır. Makine öğrenmesi literatüründe yer alan ve sık kullanılan algoritmalar ele alınacak ve uygulama içinde performansları karşılaştırılacaktır.
Data, which is the new oil of 21st century, has made it difficult to extract meaningful information from itself because of its increasing size and variety. Big data softwares emerged in order to process data that can not be processed by traditional methods have brought a new perspective on data analysis studies. Within the scope of the thesis, explorer data analysis, visualization, and machine learning applications have been performed in big data by using big data tools on cloud service. Amazon Web Services Elastic Mapreduce, Apache Hadoop, Apache Hive, Apache Spark and R Studio will be used in application. Frequently used algorithms in the machine learning literature will be discussed and their performance in the application will be compared.