Tez No İndirme Tez Künye Durumu
149681 Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.
Türkçe metinlerin sıkıştırılması ve modellenmesi / Compression and modelling of Turkish texts
Yazar:EBRU ÇELİKEL
Danışman: PROF.DR. MEHMET EMİN DALKILIÇ
Yer Bilgisi: Ege Üniversitesi / Fen Bilimleri Enstitüsü / Uluslararası Bilgisayar Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
Türkçe
2004
317 s.
ÖZET "TÜRKÇE METİNLERİN SIKIŞTIRILMASI VE MODELLENMESİ" ÇELİKEL, Ebru Doktora Tezi, Uluslararası Bilgisayar Enstitüsü Tez Yöneticisi: Prof. Dr. Mehmet Emin DALKILIÇ Mart 2004, 282 sayfa Bu tez kapsamında derlenen Türkçe ve standart İngilizce külliyatlar üzerinde bazı kayıpsız sıkıştırma algoritmalarının performans değerleri karşılaştırılmış ve bu algoritmaların dil ve veri tipi duyarlılığı ile kullanılan külliyatlardaki veri tiplerinin algoritma duyarlılığı analizleri yapılmıştır. Dil modelleme konusunda, İngilizce ve Türkçe kaynak dilleri için Kısmi Eşleme ile Öngörü algoritması ile oluşturulan dil modeli kullanılarak, yazar belirleme uygulamaları gerçeMeştirilmiştir. Mevcut sıkıştırma algoritmalarının veri güvenliğini sağlama konusunda bir kaygı ve yaklaşımları bulunmadığı gerçeğinden hareketle, tez çalışmasında güvenli sıkıştırma sağlamayı hedefleyen yeni bir kayıpsız sıkıştırma algoritması geliştirilmiştir. Şifreleme ile sıkıştırma bileşenlerini bir araya getiren ve Şifreleme ile Sıkıştırma Algoritması (ŞSA) olarak adlandırılan bu tekniğin metin tipi veriler üzerinde çalışan bir prototipi gerçekleştirilerek, İngilizce ve Türkçe kaynak dillerinde farklı parametrelerle performans ölçümleri yapılmıştır. Tez kapsamında ayrıca bu yeni algoritmayı güvenlik ve sıkıştırma açısından güçlendirecek yöntemler önerilmiş ve uygulanmıştır. Anahtar sözcükler: dil modelleme, kayıpsız sıkıştırma, şifreleme.
vn ABSTRACT "COMPRESSION AND MODELLING OF TURKISH TEXTS" ÇELİKEL, Ebru Ph.D. in International Computer Institute Supervisor Prof. Dr. Mehmet Emin DALKILIÇ March 2004, 282 pages In tins thesis, performances of some lossless compression algorithms measured on Turkish and standard English corpora are compared. Also, sensitivity analyses of these algorithms towards language and data type changes, as well as algorithm sensitivity analyses of each data type contained in the corpora are presented. For language modelling, a language model created with the Prediction by Partial Matching (PPM) lossless compression algorithm is used for author recognition applications. Motivated by the fact that conventional lossless compression tools do not consider the security issue, a new lossless compression algorithm to provide secure compression has been developed in this thesis. This algorithm combines compression with encryption and is called Compression with Encryption (CwE) Algorithm. A prototype of the new technique running on text type of data has been realised, and its performance with different parameters has been measured on English and Turkish source languages. Suggestions to improve the performance of the CwE scheme, on both security and compression aspects, are proposed and implemented. Keywords: language modelling, lossless compression, encryption.