Tez No |
İndirme |
Tez Künye |
Durumu |
377195
|
|
Intelligent ways of detecting fraud / Sahtekarlık tespitinin akıllı yolları
Yazar:YUSUF ŞAHİN
Danışman: YRD. DOÇ. DR. SEROL BULKAN ; DOÇ. DR. EKREM DUMAN
Yer Bilgisi: Marmara Üniversitesi / Fen Bilimleri Enstitüsü / Mühendislik Yönetimi Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Endüstri ve Endüstri Mühendisliği = Industrial and Industrial Engineering
Dizin:
|
Onaylandı
Doktora
İngilizce
2013
118 s.
|
|
Bilişim teknolojisindeki gelişmeler ve iletişim kanallarındaki hızlı iyileştirmelerle birlikte, sahtekarlıklar büyük maddi kayıplara yol açarak tüm dünya çapında yayılmaya devam etmektedir. Kredi kartı sahtekarlıklarını önlemeye yönelik CHIP&PIN gibi uygulamalar geliştirilmesine rağmen, bu mekanizmalar sanal POS terminalleri ya da posta havalesi (mail order) üzerinden gerçekleştirilen sahtekar kredi kartı kullanımları gibi en yaygın sahtekarlık tiplerini engelleyememektedir. Sonuç olarak, sahtekarlık tespiti bu tür sahtekarlık tiplerini durdurabilmek için gerekli ve muhtemelen en iyi araç haline gelmiştir. Bu çalışmada, kredi kartı sahtekarlık tespiti problem için her ara düğüm bölünmesinde yanlış sınıflandırma maliyetlerini en aza indirgeyen yeni bir maliyet-duyarlı karar ağacı yaklaşımı geliştirilmiştir. Bu yaklaşımla oluşturulan sınıflandırma modelinin performansı, gerçek bir kredi kartı veri kümesi üzerinde diğer iyi bilinen veri madenciliği metotları kullanılarak geliştirilen sınıflandırma modellerinin performansları ile karşılaştırılmıştır. Sonuçlara göre yeni geliştirilen maliyet duyarlı karar ağacı yaklaşımının diğer iyi bilinen metotlardan daha iyi bir performans göstermektedir.
Bu çalışma, gerçekleştirilen bir işlem için kredi kartı sahtekarlığı riskini belirleyen en iyi modeli seçmek için kullanışlı bir yapı oluşturmaktadır. Bu amaçla; öncelikle ilgili problem tanımı yapılıp, sahtekarlık tespiti üzerinde daha önce yapılan çalışmalar hakkında bir yazın taraması verilmiştir. Daha sonra, geliştirilen maliyet duyarlı karar ağacı algoritması ile geleneksel karar ağacı algoritmaları, destek vektör makineleri (SVM) ve yapay sinir ağları (ANN) gibi iyi bilinen veri madenciliği metotlarının verilen problem üzerindeki performanslarının bir karşılaştırması yapılmıştır. Buna ek olarak, kredi kartı sahtekarlığı tespit problemi üzerinde geliştirilen sınıflandırma modellerinin tahminlerinin başarısının ölçülmesinde yaygın performans ölçütlerinin etkinliği de analiz edilmiştir. Hatta verilen problemin karakterine daha uygun olan yeni bir alana özel maliyet-tabanlı performans ölçütü tanımlanmıştır.
|
|
With the developments in the information technology and improvements in the communication channels, fraud is spreading all over the world, resulting in huge financial losses. Though fraud prevention mechanisms such as CHIP&PIN for credit card fraud prevention are developed, these mechanisms do not prevent the most common fraud types such as online fraudulent credit card usages over virtual POS terminals or mail orders. As a result, fraud detection becomes the essential tool and probably the best way to stop such fraud types.
There are many data mining methods used in fraud detection, and decision tree algorithms are one of the most common methods used to develop classifier models to be used in fraud detection systems by assigning a probability of being fraudulent to each transaction occurred. In this study, a new cost-sensitive decision tree approach which minimizes the sum of misclassification costs while selecting the splitting attribute at each non-terminal node is developed and the performance of this approach is compared with the well-known traditional classification models on a real world credit card data set. The results show that this cost-sensitive decision tree algorithm outperforms the existing well-known traditional methods.
This thesis provides a useful framework to choose the best model to recognize the credit card fraud risk for a transaction committed and to see the advantages of cost-sensitive approaches in this problem domain. After giving a definition of the problem and a detailed literature survey of the previous studies done on fraud detection, a comparison of the performances of the proposed cost-sensitive decision tree algorithm and the other well-known data mining methods like traditional decision tree algorithms, support vector machines (SVM), and artificial neural networks (ANN) are done on the given problem. Furthermore, the effectiveness of the common performance metrics on measuring the success of the predictions of the classification models used in credit card fraud detection is analyzed. Moreover, a new domain-specific cost-sensitive performance metric which fits the characteristics of the problem better is defined. |