Tez No İndirme Tez Künye Durumu
462916
Ham verilerin genetik algoritmalarla ilişkisel veritabanlarına dönüştürülmesi ve bir uygulama / Converting raw datasets to relational databases using genetic algorithms and an application
Yazar:EMRE AKADAL
Danışman: DOÇ. DR. MEHMET HAKAN SATMAN
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Enformatik Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Dokümantasyon ve Enformasyon = Documentation and Information
Dizin:Çok kriterli optimizasyon = Multi criteria optimization ; İlişkisel veri tabanı = Relational database
Onaylandı
Doktora
Türkçe
2017
199 s.
Ham veriler, veriye özel tasarlanmış bir veri yapısı sayesinde etkin biçimde saklanabilir ve işlenebilirler. İlişkisel veritabanları, Codd (1970) tarafından ortaya atılan, verinin daha küçük tablolar (varlıklar) içerisinde ifade edilmesiyle birlikte veri tekrarını en aza indirebilen; veriyle ilgili işlemlerde performansı arttırabilecek bir veri saklama yöntemidir. Elektronik tablo biçiminde saklanan bir veri setinin, ilişkisel veritabanı formuna getirilmesi işlemine normalizasyon adı verilmektedir. Normalizasyon, verinin normal formlara getirilmesiyle uygulanmaktadır. Ancak normal formlar ile birlikte gelen ve uyulması gereken kurallar, sezgisel ve öznel kararlara bağlı olarak uygulandığı için tasarımcıya göre farklılık gösterebilmektedir. Bu sebeple her zaman en iyi ilişkisel veritabanı tasarımına ulaşılamayabilir. Bu durum, normal form kurallarının sistematik ya da otomatik olarak uygulanmasının zorluğunu göstermektedir. Literatürde normalizasyon işleminin otomatik olarak gerçekleştirilebilmesiyle ilgili çeşitli çalışmalar bulunmaktadır. Ancak bu çalışmaların ortak dezavantajı, kullanıcıdan fonksiyonel bağımlılıkların talep ediliyor olmasıdır. Fonksiyonel bağımlılıkların hatalı belirlenmesi, ilişkisel veritabanı tasarımının hatalı oluşturulmasına sebep olabileceği için sürecin otomatik hale getirilmesindeki zorluk, varlığını korumaktadır. Bu tez çalışması kapsamında normalizasyon işlemi bir optimizasyon problemi olarak ele alınmıştır. Amaç fonksiyonu, normalizasyon tanım ve kuralları gözetilerek önerilmiştir. Literatürdeki çalışmalardan farklı olarak bu çalışmada kullanıcıdan herhangi bir bilgi istenilmemekte, verilen ham veri setine karşılık ilişkisel veritabanı tasarımı önerisi sunulabilmektedir. Uygulama, seçilen 20 veritabanının veri setine dönüştürüldükten sonra önerilen algoritmanın tekrar aynı tasarımı önermesi beklenerek gerçekleştirilmiştir. Uygulama sonuçları, algoritmanın başarılı bir şekilde ilişkisel veritabanı tasarımı önerisi sunabileceğini göstermiştir.
Raw datasets can be stored and processed through a specific modelled data modal. Relational database, suggested by Codd (1970), is a data management method that can minimize the redundant parts of data thanks to the identification of the data in smaller tables (entities) and increase the performance in data-related processes. The process of converting a data set stored in electronic table form into relational database form is called normalization. Normalization is applied by converting the data into normal forms. However, since the rules arising from the normal forms and to be followed are applied depending on intuitive and subjective decisions they can vary according to the designer. Therefore, the best relational database design cannot always be achieved. This indicates the difficulty of applying normal form rules systematically or automatically. In literature, there are various studies regarding the automatic execution of the normalization process. However, the common disadvantage of these studies is that they demand functional dependencies from the user. Since the determination of functional dependencies incorrectly causes the incorrect design of the relational database, the difficulty in automatizing the process preserves its existence. Within the scope of this thesis study, normalization process was discussed as an optimization problem. The objective function was proposed by considering the definition and rules of normalization. Unlike the studies in the literature, in this study no information is demanded from the user and a relational database design suggestion can be offered in response to the given raw data set. The application was performed after the selected 20 databases were turned into data set with an expectation that the proposed algorithm results the same design again. The application results showed that the algorithm could successfully put forward a relational database design proposal.