Tez No İndirme Tez Künye Durumu
379762
Plagiarism detection supported by web usage mining for Turkish textual documents / Türkçe metinsel dökümanlar için web kullanım madenciliği ile desteklenmiş intihal tespiti
Yazar:MÜMİNE KAYA
Danışman: DOÇ. DR. SELMA AYŞE ÖZEL
Yer Bilgisi: Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Dizin:
Onaylandı
Doktora
İngilizce
2015
237 s.
Bu çalışmanın amacı; Çukurova Üniversitesi Bilgisayar Mühendisliği Bölümü için hazırlanan Moodle tabanlı Uzaktan Eğitim Sitesine yüklenen Türkçe ile yazılmış metinsel dokümanlar arasındaki benzerlikleri karşılaştırmak ve intihalleri bir metin eşleme algoritması ile tespit etmektir. Var olan sistemlerin genellikle İngilizce dili için geliştirilmesinden ve Türkçe için kullanılan yeterli sayıda sistem bulunmamasından dolayı bu çalışmayı Türkçe dili için gerçekleştirmekteyiz. Kelime eklerinde değişiklik olduğunda, kelimelerin eşanlamlısı kullanıldığında, kelime grupları, cümle ya da paragrafların yerleri değiştirildiğinde de benzerliklerin tespitini sağlamaktayız. Moodle'daki öğrencilerin davranışlarını da web kullanım madenciliği yöntemleri kullanılarak analiz ederek benzerlik tespitinin sonuçlarını geliştirmeyi amaçlamaktayız. Bu çalışmada, İnternetin akademik ortamda çok kullanılmasıyla artan intihal probleminin çözümleri üzerinde durulmaktadır. Önerilen yöntemde öğrenci ödevlerinin birbirleriyle benzerlikleri Hırslı Metin Eşleme Algoritması ve Kosinüs Benzerliği yöntemleri kullanılarak karşılaştırılmıştır. İntihal tespiti algoritmalarının kullanılmasının metinsel ödevlerin değerlendirilmesi için gereken zamanı ve eforu azalttığı, öğrencilerin intihal yapmasını önlediği ve dersteki başarılarının arttığı gözlenmiştir. Önerilen intihal tespit aracı mevcut araç ve yöntemlerle karşılaştırılmış, örnek metinler üzerinde başarısı sınanmıştır.
The aim of this thesis is to compare the similarities among textual documents in Turkish, specifically student assignments from Çukurova University Department of Computer Engineering Moodle web site, and to detect plagiarism with a string matching algorithm. Since existing systems are developed for English and there are not many systems for Turkish, we designed this study for the Turkish language. We provide the detection of similarities when a change was done in the annexes of the words, the synonyms of words were used or phrase, sentence or paragraph were transposed. We also aim to improve the results of the similarity detection by analyzing the behavior of the students on Moodle using web usage mining methods. This study is focused on the solutions for detecting plagiarism which has increased due to the Internet usage in the academic environment. In the proposed method student assignments were compared with each other using the Greedy String Tiling Algorithm and Cosine Similarity methods. We observed that using the plagiarism detection tool reduces time and effort needed for the assessment of the textual assignments, prevents our students from plagiarizing, and increases their success in their course. Our proposed plagiarism detection tool was compared with the existing tools and methods, and its success was evaluated over sample texts.