Tez No İndirme Tez Künye Durumu
392995
A data replication strategy to improve system availability for cloud storage systems / Bulut depolama sistemleri için sistem erişilebilirliğini artıran veri kopyalama stratejisi
Yazar:MURAT ÖZTÜRK
Danışman: PROF. DR. TAKUHİ NADİA ERDOĞAN
Yer Bilgisi: İstanbul Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:Bulut bilişim = Cloud computing ; Sistem dinamiği = System dynamics ; Teknik arıza = Technical failure
Onaylandı
Yüksek Lisans
İngilizce
2015
106 s.
Bulut Bilişim ortamı farklı özelliklerde olan ve oldukça dinamik bir ortamdan oluşur. Bulut Bilişim, büyük ölçekli veri merkezlerini kullanarak yazılım ve donanım altyapısını servisler olarak dışarıya kullanıma açmaktadır. Sonuç olarak, Bulut Bilişim işlem ve veri depolama işini son kullanıcıdan veri merkezlerindeki sunuculara taşımaktadır, bu sayede kullanıcıları uygulama kurulumu ve yönetimi yüklerinden kurtarıp, kullanıcıların sadece kendi uygulamalarının mantığını yönetmelerine odaklanmalarını sağlamaktadır. Ancak, bulut bilişim ortamlarında, veri merkezlerinin depolama düğümlerinde sıklıkla hatalar oluşmaktadır. Sistemin erişilebilirliğini artırmak ve yüksek oranda hata toleransı sağlamak için, verilerin kopyasını oluşturmak iyi bir seçenektir. Kopyalama, aynı servisin farklı düğümlerde farklı kopyalarının olmasını sağlama sürecidir. Gerçek dünyadaki bulut ortamların çoğunda, veri kopyalama veri kaynak havuzlarıyla gerçekleştirilir, veri kopyalarının sayısı geçmiş deneyimlere bakılarak statik olarak karar verilir ve genellikle 3'den küçüktür. Bu strateji çoğunlukla iyi çalışır, ancak zorlu durumlarda hata verecektir. Verilerin sabit sayıda kopyasını oluşturmak ve bunları farklı uygun lokasyonlara koymanın tercih edilen bir yaklaşım olmaması gerekir. Mantıklı ve uygun bir sayıda kopya oluşturmak ve bu kopyaları yerleştirmek için doğru/uygun yerleri seçmek, bulut bilişim çevreleri için çözülmesi gereken bir sorun haline gelmiştir. Bu tez kapsamında, bulut ortamları için geliştirdiğimiz yeni bir dinamik veri kopyalama tekniğini sunuyoruz. Tekniğimiz, optimum kopya sayısını sağlayabilmektedir ve zamanla kopya sayısının artmasını engellemektedir. Ayrıca, bir disk için müsait durumdaki disk boşluğu durumu, istekte bulunan bulut ortam kullanıcılarının talep ettikleri erişilebilirlik değeri ve ver merkezi sunucularındaki her bir düğümün hata alma olasılıklarına bağlı olacak şekilde, kopyaları tüm veri merkezi düğümlerine dengeli bir şekilde yerleştirilmesine imkan sağlamaktadır. Ayrıca bu çalışmayla, bulut kullanıcıları ve veri merkezleri arasındaki uzaklığı da göz önünde bulundurarak, ve verilerin kopyalarını isteği yapan kullanıcılara yakın olan veri merkezlerine sunucularına yerleştirerek veri genişliği kullanımını da azaltabileceğimiz sonucunu çıkardık.
The Cloud environment constitutes a heterogeneous and a highly dynamic environment. The Cloud Computing provides the software and hardware infrastructure as services using large-scale data centers. As a result, Cloud Computing moved away the computation and data storage from the end user and onto servers located in data centers, thereby relieving users of the burdens of application provisioning and management and enabling them to focus on managing of their application logic. However, failures on the data center storage nodes often take place in cloud computing environments. As a result, the cloud environment requires some capability for an adaptive data replication management in order to cope with the inherent characteristic of the Cloud environment. To improve system availability and get high fault tolerance, replicating data is a good choice. Replication is the process of providing different replicas of the same service at different nodes. In most of the real cloud, data replication is achieved through data resource pool, the number of data replicas is statistically set based on history experience and is usually less than 3. This strategy works well at most time, but it will fail at inclement times. Replicating the data with a fixed number of its copies to multiple suitable locations should not be an advisable choice. How to decide a reasonable number and right/suitable locations for replicas has become a challenge in the cloud computing. In this thesis, we present a new dynamic data replication strategy suitable for cloud environments. Our technique provides optimum replica number and prevents the replica number from incrementing in time. In addition, it enables the replicas to be placed to all data center nodes in a balanced way depending on the available disk space for a disk, expected availability of requesting cloud users, failure probability of each node in data center servers. We also conclude that bandwidth usage can be reduced by considering the distance between user and data center servers and locating the replicas nearby users who requests for.