Tez No |
İndirme |
Tez Künye |
Durumu |
483706
|
|
Müşteri kayıp analizi probleminin çözümünde analitik yaklaşımlar / Analytical approaches for solving in churn analysis problem
Yazar:FATMA ÖNAY KOÇOĞLU
Danışman: PROF. DR. ŞÜKRÜ ALP BARAY ; YRD. DOÇ. DR. TUNCAY ÖZCAN
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Enformatik Ana Bilim Dalı / Enformatik Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
|
Onaylandı
Doktora
Türkçe
2017
169 s.
|
|
Günümüz dünyası, gelişen bilgi ve iletişim teknolojilerinin etkisi altındadır. Teknolojinin sunduğu olanaklar ile beraber öneminin günden güne artmasnı sonucu bilgi, işletmelere ait sermaye, makine, iş gücü gibi kaynakların arasında önemli bir kaynak haline gelmiştir. Bilginin temel yapı taşının veri olduğu düşünülürse işletmeler her türlü veriyi saklar olmuştur. Tüm bu veri içerisinde müşterilere ait veri ayrı bir önem arz etmektedir. Bir işletmenin varlığını devam ettirebilmesi müşterileri ile arasındaki alışverişin sürekliliğine bağlıdır. Dolayısıyla, işletmeler zorlu rekabet koşulları altında yeni müşteriler kazanmanın yanında, var olan müşterilerini de elde tutmalıdır. Buna göre; müşteri davranışlarının izlenmesi ve bu davranışlardaki değişikliklere göre hareket edilmesi oldukça önemlidir. Bu kapsamda "Müşteri Kayıp Analizi" çalışmaları gerçekleştirilmektedir. Müşteri kayıp analizi çalışmaları ile beraber ayrılma eğilimi gösteren müşteriler ve bu eğilime neden olan durumlar ortaya çıkartılmaya çalışılmaktadır.
Diğer taraftan bilgi ve iletişim teknolojilerinin gelişimi ile beraber daha yüksek işlem gücü ve daha fazla depolama alanına sahip bilgisayarlar daha az maliyet ile üretilebilir hale gelmiştir. Bunun bir sonucu olarak saklanan veri miktarında artış meydana gelmiş, bu verinin analizi için çeşitli yöntemler geliştirilmiştir. Bu yöntemlerden biri "Veri Madenciliği"dir. Veri madenciliği, en genel anlamda, veri yığını içerisinden daha önceden keşfedilmemiş, amaca yönelik olarak işe yarar bilgiyi veya veri içerisindeki ilişkiyi ortaya çıkarma işi ve bu iş için kullanılan yöntemler bütünü olarak tanımlanabilir. Veri madenciliğinin etkin kullanıldığı problemlerden biri de müşteri kayıp analizidir.
Bu tez çalışması kapsamında iki farklı literatür çalışması yapılmıştır. Bu çalışmalardan ilkinde sıkça kullanılan veri madenciliği yöntemlerinin belirlenmesi amaçlanırken, ikincisinde tez problemi için daha önce kullanılmamış yeni yöntemler tespit edilmeye çalışılmıştır. Yeni yöntem önerisi için yapılan literatür incelemesinde araştırmanın yapıldığı dönemde Aşırı Öğrenme Makinelerinin problemin çözümünde kullanılmadığı tespit edilmiştir. Bu doğrultuda, "Aşırı Öğrenme Makineleri"nin bir sınıflandırma problemi olarak müşteri kayıp analizi probleminin çözümündeki etkinliğinin ve belirli koşullar altında en iyi çözümü üreten parametrelerinin araştırılması amaçlanmıştır. Aşırı Öğrenme Makinelerinin ön analizler ile problem çözümü için uygunluğu test edilmiş, olumlu sonuçlar elde edilmiştir. Aşırı Öğrenme Makinelerinin temelde üç farklı parametre değerinin önem teşkil ettiği saptanmıştır. Bunlar gizli katmanda yer alan nöron sayısı, aktivasyon fonksiyonu ve eşik değeridir. Bu parametre değerlerinin değiştirilmesi ile beraber performans değerlendirme ölçülerinde de iyileşme olacağı tezi ile hareket edilmiştir.
Aşırı Öğrenme Makineleri ile elde edilen performans değerlendirme ölçü değerleri, K-En Yakın Komşu Algoritması, Sade Bayes Algoritması ve Destek Vektör Makinelerinin kullanımı ile elde edilen performans değerlendirme ölçü değerleri ile karşılaştırılmıştır. Farklı performans geçerleme yöntemleri ile kurulan modellerde, Aşırı Öğrenme Makineleri %90'ın üzerinde bir doğruluk oranı ile çalışma kapsamında kullanılan diğer yöntemlerden daha iyi performans sergilemiştir. Tez çalışması sonucunda Aşırı Öğrenme Makinelerinin temel sınıflandırma problemi için başarılı olduğu, müşteri kayıp analizi çalışmalarında da etkin bir şekilde kullanılabileceği, belirlenen aralıklarda parametre değerlerinin iyileştirilmesi sağlanırsa, bu parametre değerleri ile beraber sonuçların da iyileşebileği görülmüştür.
Bu tez çalışması, İstanbul Üniversitesi Bilimsel Araştırma Projeleri Yürütücü Sekreterliğinin 49762 kodu ve 2221 ID numaralı projesi ile desteklenmiştir.
|
|
Today's world is under the influence of developing information and communication technologies. As a result of increasing importance of knowledge and with the opportunities offered by technology, knowledge became an important source for enterprises such as capital, machinery, workforce. When it is considered that data is the basic unit of knowledge, enterprises commence storing all kinds of data. In all kinds of data, customer data has special importance. The ability of an enterprise to maintain its existence depends on the continuity of the relationship with its customers. Therefore, enterprises must keep existing customers as well as acquire new customers under tough competition conditions. So, it is important to monitor customer behavior and act on the changes in these behaviors. Within this scope, "Customer Churn Analysis" studies are carried out. With customer churn analysis studies, it is tried to forecast the customers who tend to leave and reveal the situations that cause this tendency.
On the other hand, with the development of information and communication technologies, computers with higher processing power and more storage capacity can be produced with less cost. As a consequence, the amount of data stored has increased, and various methods have been developed for the analysis of this data. One of these methods is "Data Mining". Data mining can be described in general sense as whole of the methods to discover the relationship between data, which has not been discovered before in a huge data stack. Today, various algorithms for data mining are being developed and used for solving many problems. One of the problems which data mining is used effectively for is customer churn analysis.
Within the scope of this thesis study, two different literature studies were carried out. In the first of these studies, it was aimed to determine the data mining methods which are frequently used and in the second one tried to find new methods that were not used before for the thesis problem. In the literature review for the new method proposal, it was determined that the Extreme Learning Machine were not used to solve the problem at the time of the research. In this respect, it is aimed to investigate the effectiveness of the "Extreme Learning Machine" problem in solving the customer churn analysis problem as a classification problem and the parameters that produce the best solution under certain conditions. Preliminary analyzes of Extreme Learning Machine have been tested for its suitability for solving the customer churn analysis problem, and positive results have been obtained. It has been determined that three different parameter values are important for Extreme Learning Machines. These are the number of neurons in the hidden layer, the activation function and the threshold value. Acted with the thesis "If these parameter values are changed, the performance evaluation measure will improve".
The performance evaluation measure values obtained with the Extreme Learning Machine were compared with the performance evaluation measure values obtained with the use of K-Nearest Neighbor Algorithm, Sade Bayes Algorithm and Support Vector Machines. Findings based on the different models established shows that Extreme Learning Machine performed better than the other algorithms used in the study with an accuracy of over 90%. As a result of the thesis study, it is seen that Extreme Learning Machine is successful for the basic classification problem and that it can be used effectively in customer churn analysis studies, if the parameter values are improved in the determined intervals, the results can be improved with these parameters.
This work was supported by Scientific Research Project Coordination Unit of Istanbul University. Project number: 49762. |