Tez No İndirme Tez Künye Durumu
318905
A C++ distributed database select-project-join query processor on a HPC cluster / Bir dağıtık veritabanı select-project-join sorgu işlemcisinin bir HPC öbeği üzerinde C++ implementasyonu
Yazar:ERHAN CERAN
Danışman: DOÇ. DR. AHMET ÇOŞAR
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Dağıtık veri tabanı sistemleri = Distributed database systems ; Sorgulama işlemcisi = Query processor ; Veri tabanı yönetimi = Database management
Onaylandı
Yüksek Lisans
İngilizce
2012
89 s.
Yüksek performanslı bilgisayar öbekleri merkezi muadillerine göre daha ölçeklenebilir, ucuz ve güvenilir oldukları için günümüzde yaygınlaşmıştır. Veritabanı yönetim sistemleri dağıtık mimariler için oldukça uygun olmalarına rağmen, dağıtık veritabanları tasarımlarının zor olması nedeniyle yeterince geniş alanda kullanılmamaktadırlar. Bu çalışmada dağıtık veritabanı tasarımında karşılaşılan zorlukların üstesinden gelinmesine yardımcı olmak için simülasyona yönelik bir test yatağı geliştirilmesi amaçlanmıştır. Bunun için bölümümüzün HPC öbeği üzerinde select, project ve join işlemlerini dağıtık olarak çalıştıran bir sorgu planı işlemcisi implemente edilmiştir. Bunun yanında primary key ve foreign key kısıtlamalarını sağlayabilen bir veri üretim modülü hazırlanmıştır. Test yatağının bir diğer yeteneği ise verilen bir sorgu planın cevap zamanını ölçebilmesi, belirtilen iletişim ağı parametrelerine göre bu zamanı simüle ve tahmin edebilmesidir. Üretilen sonuçların doğruluğunu göstermek üzere deneyler yapılmıştır. Tahmin fonksiyonlarını doğrulamak için tahmin edilen çalışma zamanlarıyla test yatağından elde edilen gerçek zamanlar karşılaştırılmıştır. Bu şekilde tahmin fonksiyonlarının dağıtık veritabanı sorgu iyileştiricilerinde ve dağatık veritabanı tasarım araçlarında kullanılabileceği gösterilmiştir.
High performance computer clusters have become popular as they are more scalable, affordable and reliable than their centralized counterparts. Database management systems are particularly suitable for distributed architectures; however distributed DBMS are still not used widely because of the design difficulties. In this study, we aim to help overcome these difficulties by implementing a simulation testbed for a distributed query plan processor. This testbed works on our departmental HPC cluster machine and is able to perform select, project and join operations. A data generation module has also been implemented which preserves the foreign key and primary key constraints in the database schema. The testbed has capability to measure, simulate and estimate the response time of a given query execution plan using specified communication network parameters. Extensive experimental work is performed to show the correctness of the produced results. The estimated execution time costs are also compared with the actual run-times obtained from the testbed to verify the proposed estimation functions. Thus, we make sure that these estimation functions can be used in distributed database query optimization and distributed database design tools.