Tez No İndirme Tez Künye Durumu
479635
Data replication in large-scale data management systems / Geniş ölçekli veri yönetim sistemlerinde veri yineleme
Yazar:URAS TOS
Danışman: YRD. DOÇ. DR. TOLGA AYAV ; PROF. DR. ABDELKADER HAMEURLAIN ; YRD. DOÇ. DR. ŞEBNEM BORA
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bulut bilişim = Cloud computing ; Performans değerlendirme = Performance evaluation ; Sorgu optimizasyonu = Query optimization ; Ticari kar = Commercial profit ; Veri tabanı yönetim sistemi = Database management system
Onaylandı
Doktora
İngilizce
2017
118 s.
Geniş ölçekli uygulamaların artan yaygınlığı yüksek miktarda verinin üretilmesine öncülük etmiştir. Bu verinin yönetimi, servis sağlayıcılar için güç bir problemdir. Geleneksel sistemlerde, kabul edilebilir bir başarımın ve veri bulunurluğu seviyesinin sağlanması, özellikle dağıtık veri ile çalışan servis sağlayıcılar için temel problemlerdendir. Bu sistemlerdeki veri yineleme stratejileri kullanıcılar için başarımı en üst seviyeye çıkarmayı hedeflemektedir. Ancak, bu yaklaşımları bulut sistemlerine uyarlamak güçtür. Kullanıcıların başarım beklentilerini, servis sağlayıcının karlılığını feda etmeden sağlamak, elastik kaynak yönetiminin kullandığın kadar öde modeli ile ücretlendirilmesi bu bağlamdaki temel güçlüklerdendir. Bu tezde, kullancıların performans beklentilerini sağlarken aynı anda servis sağlayıcının ekonomik karlılığını da garanti altına alan bir veri yineleme stratejisi bulut sistemleri için ortaya koyulmaktadır. Veri yineleme, veritabanı sorgularının tahminlenen tepki sürelerinin, kullanıcı sözleşmesindeki eşik değerin altında kalmasına bağlı olarak planlanmakdadır. Planlanan veri yineleme aynı anda servis sağlayıcı için de karlı bir eylem olmalıdır. Bu doğrultuda, ortaya koyulan bir ekonomik model, bir sorgunun işletilmesi sırasında ortaya çıkan maliyeti ve sorgudan elde edilecek karı dikkate almaktadır. Planlanan veri yineleme eylemi gerçekleştirilirken, yeni kopyaların yerleşimi, erişim süresini düşürecek buluşsal bir yaklaşımla yapılmaktadır. Ek olarak, kopya sayılarının devingen olarak ayarlanmasıyla da kaynakların esnek yönetimi sağlanmaktadır. Önerilen strateji, başka bir veri yineleme stratejisi ile bir benzetim ortalmında karşılaştırılmıştır. Her ne kadar her iki strateji de başarım hedefini sağlasa da, sadece önerilen strateji servis sağlayıcının karlılığını da güvence altına almıştır.
Growing popularity of large-scale applications led to generation of large volumes of data. The management of this data presents a significant challenge for service providers. In traditional systems, meeting objectives such as achieving acceptable performance and ensuring good availability are major challenges for the providers, especially when the data is distributed globally. Data replication strategies that have been proposed for traditional systems intended to maximize performance for the user. However, they are difficult to adapt to cloud systems. Meeting the performance expectations of the tenants without sacrificing the provider's profit, as well as managing resource elasticities with a pay-as-you-go pricing model, are the fundamentals challenges in this context. In this thesis, we propose a data replication strategy that satisfies the requirements of the tenant, such as performance, while guaranteeing the economic profit of the provider. Data replication is only considered if the estimated response time of database queries exceeds a threshold initially set in a contract between the provider and the tenant. Planned replication must also be economically profitable to the provider. We propose an economic model that takes into account both the expenditures and the revenues of the provider during the execution of any particular query. Once the data replication is decided to go through, a heuristic placement is used for new replicas in order to reduce the access time. In addition, a dynamic adjustment of the number of replicas is adopted to allow elastic management of resources. Proposed strategy is compared with another data replication strategy in a simulation environment. Results show that, the two compared strategies satisfied the performance objective. On the other hand, profitability of the provider is only ensured by the proposed strategy.