Tez No İndirme Tez Künye Durumu
383279
Fast, efficient and dynamically optimized data and hardware architectures for string matching / Dizi eşleme amaçlı verimli veri ve donanım mimarileri
Yazar:SALİH ZENGİN
Danışman: PROF. DR. HASAN CENGİZ GÜRAN ; DOÇ. DR. ŞENAN ECE SCHMİDT
Yer Bilgisi: Orta Doğu Teknik Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Elektrik ve Elektronik Mühendisliği = Electrical and Electronics Engineering
Dizin:Ağ güvenliği = Network security ; Dizgi eşleme = String matching ; Siber saldırı = Cyber attack ; Sonlu durum makineleri = Finite state machinery
Onaylandı
Doktora
İngilizce
2014
125 s.
Verilen bir dizi kümesini kendi girişinde arayan dizi eşleme modülleri (SMM), ağ sızıntı tespit sistemleri gibi bir çok hesaplama alanında kullanılır. Bir SMM, giriş verisini yüksek hızlarda tararken, doğru sonuçlar üretmesi beklenir. Ayrıca, aranan dizi kümeleri genelde büyüktür ve boyutları da sürekli artmaktadır. Bu tezde, hızlı, doğru ve verimli tasarım gerekliliği motivasyonu ile, büyük miktarda veriyi dizi kümeleri için sıkıştırarak temsil etmek maksadıyla Bloom Filter'leri kullanan bir kaç SMM yapısı önerilmektedir. Bu yapılar,Bloom filtrelerin olumlu eşleme sonuçlarının doğrulanması sebebiyle oluşan ve iyi bilinen yavaşlama problemini çözmeyi hedefler. Bu amaçla, tezin ilk katkısı olarak, doğrulama maksatlı olarak kullanılan ikinci bir filtre içeren Çift Bloom filtreli dizi eşleme modülü (DBF-SMM) oluşturulmuştur. DBF-SMM'in analiz, değerlendirme ve uygulamaları gösterilmiştir. Ayrıca, DBF-SMM'in istenen işlevi, SystemC ortamında ilgili yapı modellenip test edilerek doğrulanmıştır. Analiz ve uygulama sonuçlarımız, DBF-SMM'in Bloom filtre tabanlı diğer SMM tasarımlarından tepki süresinin yüksek dizi saklama verimliliği ve donanım ölçeklendirilebilirliliği ile korunması açısından daha üstün olduğunu gösterir. DBF-SMM sabit boyutlu diziler için tasarlanmıştır. Tezin ikinci katkısı ise, karakterler arası durum geçişleri ile değişken boyutlu dizileri saklayan sonlu makine tabanlı tasarımlardır. Bu maksatla, durum geçişleri sınıfları tanımlanmıştır. Daha sonra, iyi bilinen Aho-Corasick algoritması gerçeklenmesi, Bloom filtreleri ve CAM-RAM tablolarını kullanarak uygun geçiş sınıflarını etkili bir şekilde donanımda saklayacak ve sorgulayacak şekilde değiştirilmiştir. Bu yapıda Bloom filtre DBF-SMM olarak gerçeklenmiştir. Önerilen SMM yapısı, bütün diğer SMM tasarımlarından üstün hafıza verimliliğine, hızlı ve ölçeklenebilir donanım tasarımıyla sahiptir.
Many fields of computing such as network intrusion detection employ string matching modules (SMM) that search for a given set of strings in their input. An SMM is expected to produce correct outcomes while scanning the input data at high rates. Furthermore, the string sets that are searched for are usually large and their sizes increase steadily. In this thesis, motivated by the requirement of designing fast, accurate and efficient SMMs; we propose a number of SMM architectures that employ Bloom Filters to compactly represent the large amounts of data for the string sets. The proposed architectures address the well-known slowdown problem of the Bloom Filters because of the verifications of the positive matches. To this end, the first contribution of the thesis is Double Bloom Filter SMM (DBF-SMM) which employs a second Bloom Filter which acts as a verification engine. We present an analysis, evaluation and implementation of the DBF-SMM. We further verify the required functionality of the DBF-SMM by modeling and testing the architecture in SystemC environment. Our analytical and implementation results demonstrate that DBF-SMM is superior to the existing Bloom Filter based SMM designs in terms of sustainability of the response time with high string storage efficiency and hardware scalability. DBF-SMM is designed for fixed size strings. The second contribution of the thesis is a finite automaton-based design that stores variable size strings as state transitions between characters. To this end, we first identify the classes of state transitions. We then modify the implementation of the well-known Aho-Corasick algorithm to effectively store and query the appropriate transition classes in a hardware architecture that features Bloom Filters and CAM-RAM look-up tables. The Bloom Filter in this architecture is realized as a DBF-SMM. The proposed SMM achieves a memory efficiency that is superior to all previous SMM designs together with fast and scalable hardware design.