Tez No İndirme Tez Künye Durumu
410522
Data mining and knowledge discovery in medical information systems / Tıbbi bilişim sistemlerinde veri madenciliği ve bilgi keşfi
Yazar:YUNUS DOĞAN
Danışman: PROF. DR. RECEP ALP KUT
Yer Bilgisi: Dokuz Eylül Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bilgi = Knowledge ; Genetik algoritmalar = Genetic algorithms ; Kuantum algoritmalar = Quantum algorithms ; Kümeleme = Clustering ; Sınıflandırma = Classification ; Tıbbi bilişim = Medical informatics ; Veri madenciliği = Data mining
Onaylandı
Doktora
İngilizce
2015
151 s.
Hastane Bilgi Yönetim Sistemleri kamu ve özel hastanelerinin tamamımda kullanılmaktadır. Yirmi dört saat kesintisiz olarak yeni tıbbi verilerin kaydedildiği bu geniş veri tabanlarında, biriken bu değerli veriler günümüzde sadece kurum içinde gerekli raporlama ve sorgular için kullanılmakta ve temiz veri ambarları şeklinde tutulamadığından her hangi bir akademik çalışma için değerlendirilemediğine tanık olmaktayız. Bu tezde tıbbi verilerin belirli sınırlar dâhilinde ve standart protokoller ile akademik çalışmalar için açık kaynak olması gerektiğine vurgu yapılacak, gerçekleştirdiğim tıbbi bilişim sistemleri ve tıbbi uygulamalarda bu verilerin işlenip nasıl kıymetli sonuçların elde edilebileceğinden bahsedilecektir. Tezdeki çalışmalar "tıbbi laboratuarlar", "yüz ve boyun kanserleri" ve "beslenme ve diyet" alanları üzerine yapılmıştır. Bu üç alan için MSSQL veri tabanı ve C# programlama dili ile ASP.NET kullanılarak yeni bilişim sistemleri geliştirilmiştir. Böylece, temiz ve işlenebilir verilerin bu sistemlere toplanması sağlanmış ve veri madenciliği ve bilgi keşfi tekniği bu bilişim sistemleri için farklı algoritma yaklaşımları ile uygulanabilmiştir. Çalışmalarda veri madenciliği tekniklerinden farklı yaklaşımlara sahip kümeleme algoritmaları geliştirilmiştir. İlk olarak, bu algoritmalar etik kurul izinleri alınmış laboratuar verilerinin analizi için kullanılmıştır. İkinci olarak, yine etik kurul izinleri alınmış yüz ve boyun kanser verilerinin analizi için farklı yaklaşımlı kümeleme algoritmalar kullanılmıştır. Son olarak beslenme ve diyet veri kümesi melez kuantum genetik algoritması ile optimize edilmiştir. Geliştirilen kümeleme algoritmaları kendi kendini düzenleyen haritalar, k-ortalama++ algoritmaları ve onların farklı yaklaşımları ile karşılaştırılmıştır. Bunun yanında, geliştirilmiş melez kuantum genetik algoritması, geleneksel genetik algoritma ve kuantum genetik algoritma ile karşılaştırılmıştır. Sonuç olarak da geleneksel yöntemlere nazaran daha hızlı ve doğruluğu daha yüksek desenler elde edilebilmiştir.
Hospital Information Management Systems are used in all public and private hospitals. Valuable data which is obtained from these big databases, where updated data are collected continuously during all day, is used for only some necessary reports and queries inside of the corporation, and this data may not be considered for an academic study, because it is not held as a clean data warehouse. In this thesis, it is underlined that this data should be an open source with standard protocols under definite boundaries for academic studies in order to supply the improvement of medical research, and it is mentioned that how this data is processed and valuable patterns are obtained. There are studies about three branches, "medical laboratories", "head and neck cancers" and "nutrition and diets" in this thesis. For these three branches, new information systems have been implemented by using the technologies of MSSQL database and ASP.NET with C# programming languages. Thus, it has supplied to collect clean and processable instances in them and, the technique of knowledge discovery and data mining was able to be applied for these information systems by using different algorithm approaches. In the studies, clustering algorithms from data mining techniques have been implemented with different approaches and firstly, these algorithms have been used to analysis laboratory data sets which necessary permissions have been obtained to use. Secondly, head and neck cancer instances, which necessary permissions have been obtained to use, too, have been analysed by using clustering algorithms with different approaches. Lastly, the data set of nutrition and diets is optimized by hybrid quantum genetic algorithm. Improved clustering algorithms have been compared with self-organizing map, k-means++ algorithms and its different approaches. Moreover, improved hybrid quantum genetic algorithm has been compared with traditional genetic algorithm and quantum genetic algorithm. As a result, the patterns, which have higher accuracy and performance than the traditional approaches, have been obtained.