Bitcoin, ilk kripto para olması sebebi ile dünya çapında en çok bilinen kripto para birimidir. %39'nu Bitcoin'nin oluşturduğu kripto para piyasasının yaklaşık değeri 807 milyar dolardır (Aralık 2022). Bitcoin fiyatının aşırı oynaklığından dolayı fiyatını tahmin etmenin zorluğunun sonucu olarak, önemli bir araştırma konusu haline gelmiş ve literatür de bu konuda birçok çalışma bulunmaktadır. Yatırımcılar için ise bu yüksek oynaklık yüksek karlar ve riskler demektir. Bu tez de, makine öğrenmesi yöntemleri, farklı veri setleri, ve optimizasyon teknikleri kullanılarak gerçek fiyata yakın tahmin sonuçları elde etme ve yatırımcılar için riskleri azaltmak hedeflenmiştir. Kullanılan yöntemler; Çok Katmanlı Algılayıcı (MLP), Destek Vektör Makineleri (SVM), Genelleştirilmiş Regresyon Sinir Ağı (GRNN), Tekrarlayan Sinir Ağı (RNN), Uzun-Kısa Süreli Bellek (LSTM), Geçitli Tekrarlayan Birim (GRU) ve Konvolüsyonel Sinir Ağı (CNN). Altın, ham petrol, doğal gaz, Ethereum ve dolar-euro parite veri setlerinin Bitcoin fiyatı ile kombinasyonlarının makine öğrenmesi modellerinin her biri ile yapılan deneyleri içermektedir. Bayes optimizasyonu (BO), rastgele arama, ızgara arama ve Hparam parametresi gibi hiper parametre optimizasyon yöntemleri incelenmiştir. BO diğer optimizasyon yöntemlerinden daha iyi sonuçlar elde etmiştir. Bu tezde, Bitcoin fiyat tahmini hatasını etkili bir şekilde azaltan yeni bir model önerilmektedir. BO'lu bu yeni model; Optimize edicilere ve karşılık gelen vekil işlevlere Gradyan Artımlı Regresyon Ağaçları (GBRT), Gauss Süreci (GP), Rastgele Orman (RF) ve Ekstra Ağaçlar (ET) uygulanması ile elde edilir. Ayrıca sonuçların karşılaştırıla bilirliğini arttırmak için; karesel ortalamalarının karekökü hatası (RMSE), ortalama karesel hata (MSE), ortalama mutlak hata (MAE) ve ortalama mutlak yüzde hatası (MAPE) olmak üzere dört farklı performans metriği ile değerlendirilmiştir. Genel olarak, makine öğrenmesi algoritmalarının Bitcoin'in kapanış fiyatını kullanan tahminleri daha iyi sonuçlar vermiştir. Ayrıca veri setine Ethereum, ham petrol ve doğal gazı eklenerek yapılan tahminler sırasıyla daha iyi sonuçlar elde etmiştir. Sırasıyla LSTM, CNN ve GRU ile diğer yöntemlere göre daha iyi sonuçlar elde edilmiştir. Optimizasyonun deneysel sonuçları; hparam, ızgara arama ve rastgele arama dört hata metriği içinde kötü sonuçlar elde etmiştir. BO-GP hibrit LSTM-GRU ile MAE=0.002302, MAPE=0.005497, MSE=0.000015 ve RMSE=0.003269 ile incelediğimiz kadarı ile literatürdeki en iyi sonuçları elde etmiştir.
|
The most well-known cryptocurrency is Bitcoin, as it was the first cryptocurrency. The approximate value of the cryptocurrency market capitalization, of which 39% is Bitcoin, is 807 billion dollars (December 2022). It has become an important research topic due to the difficulty in predicting the price of Bitcoin due to the extreme volatility of the price, and there are many studies in the literature. For investors, this high volatility means high profits and risks. This thesis aims estimation results close to the actual price and reduces the risks for the investors, using machine learning methods, different data sets, and optimization techniques. The methods used: Multilayer Perceptron (MLP), Support Vector Machines (SVM), Generalized Regression Neural Network (GRNN), Recurrent Neural Network (RNN), Long-Short-Term Memory (LSTM), Gated Repetitive Unit (GRU), and Convolutional Neural Network (CNN). The thesis includes experiments with each machine learning model with the combinations of Bitcoin, gold, crude oil, natural gas, Ethereum, and dollar-euro parity. Hyper-parameter optimization methods such as Bayesian optimization (BO), random search, grid search, and Hparam parameters are examined. Models with BO achieved better results than others. This thesis proposes a new model for Bitcoin price prediction that effectively reduces prediction error. This new BO model with Gradient Incremental Regression Trees (GBRT), Gaussian Process (GP), Random Forest (RF), and Extra Trees (ET) was applied to optimizers and corresponding surrogate functions. In addition, to increase the comparability of the results with the other paper, it was evaluated with four different performance metrics: root square mean error (RMSE), mean square error (MSE), mean absolute error (MAE), and mean absolute percentage error (MAPE). In general, among the seven algorithms, predictions using only the closing price of Bitcoin yielded better results. In addition, we obtained very close results in the estimates made by adding Ethereum, crude oil, and natural gas to the data set. Better results were obtained with LSTM, CNN, and GRU, respectively, than with the other methods. The experimental optimization results indicated that hparam, grid search, and random search achieved the worst results in all four error metrics. BO-GP with hybrid LSTM-GRU outperformed all methods in this thesis and the examined literature for the value of MAE=0.002302, MAPE=0.005497, MSE=0.000015, and RMSE=0.003269. |