Tez No İndirme Tez Künye Durumu
660804
Ters yüz sınıflardaki video izleme davranışları incelenerek veri madenciliği ile başarının tahmin edilmesi / Predicting success by examining the video watching behaviors in flipped classrooms using data mining
Yazar:KADİR BURAK OLGUN
Danışman: PROF. DR. SEVİNÇ GÜLSEÇEN ; DR. ALPER BAYAZIT
Yer Bilgisi: İstanbul Üniversitesi / Fen Bilimleri Enstitüsü / Enformatik Ana Bilim Dalı / Enformatik Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Eğitim ve Öğretim = Education and Training
Dizin:
Onaylandı
Doktora
Türkçe
2021
124 s.
Bu tez çalışmasında ters yüz sınıflardaki video izleme davranışlarına ait veriler kullanılarak öğrencilerin başarı performansları veri madenciliği yöntemlerinden olan sınıflandırma yöntemleri ile modellenmesi amaçlanmıştır. Başarı tahmini öğrenme ortamının daha verimli tasarlanabilmesi ve bireysel dönütlerin verilebilmesi açısından önem arz etmektedir. Çevrimiçi ortamlardan gelen büyük miktardaki veriler kullanılarak gerçekleştirilen tahminler ise eğitsel veri madenciliği alanında oldukça popüler hale gelmiştir. Çalışmada 4 dönem boyunca Temel Bilgisayar Uygulamaları dersine kayıtlı olan farklı bölümlerdeki toplam 404 üniversite öğrencisine ait video izleme verileri kullanılmıştır. Öğrenciler 14 haftalık dönem boyunca yüz yüze eğitim öncesinde araştırmacı tarafından hazırlanan ortalama 15'şer dakikalık ders içeriği ile uyumlu 11 videoyu Moodle öğrenme yönetim sistemi üzerinden izlemişlerdir. Öğrencilerin atlama yapma sayısı, oturum açma sayısı, farklı video görüntüleme sayısı vb. verilerinin kaydedilmesi için öğrenme yönetim sistemi üzerine kurulan bir araçtan yararlanılmıştır. Dijital ortamdan toplanan 11 adet nitelik dışında 6 adet demografik bilgi de anket yöntemi ile toplanmış, veri setinde 17 adet nitelik elde edilmiştir. Öğrencilerin başarı performansı ise başarılı ve başarısız olarak belirlenmiştir. Verilerdeki gizli örüntüleri açığa çıkarmak için kullanılan ve alandaki başarı tahmini çalışmalarında en çok tercih edilen sınıflandırma algoritmalarından olan Rastgele Orman, Destek Vektör Makineleri ve Naive Bayes algoritmaları analiz aşamasında kullanılarak araştırmanın ana problemine yanıt aranmıştır. Veri setinin dengesiz olması nedeniyle SMOTE tekniği kullanılarak sentetik veriler oluşturulmuş ayrıca çapraz geçerlilik yöntemi de kullanılmıştır. Elde edilen sonuçlar incelendiğinde ders başarı performanslarının yüksek doğruluk oranları ile tahmin edilebileceği ortaya konmuştur. En başarılı sınıflandırma oranına sahip algoritma toplamda %83,11 doğruluk oranıyla Rastgele Orman algoritması olmuştur. Destek Vektör Makineleri, Naive Bayes ve Rastgele Orman algoritmalarına oranla oldukça düşük doğruluk oranlarıyla tahmin yapabilmiştir. Başarısız öğrencilerin dönem sonu sınavına girmeden önce doğru tahmin edilebilmesinin, başarı düzeyini arttırabileceği düşünüldüğünde başarılı öğrencileri tahmin etmeye kıyasla daha önemli olduğu görülmektedir. Rastgele Orman algoritmasının başarısız öğrencilerin tahmin edilmesinde %87,67 ile kullanılan diğer algoritmalardan oldukça yüksek bir doğru tahmin oranı yakaladığı tespit edilmiştir.
In this thesis, it was aimed to model students' success levels via the classification methods, which are included in data mining methods, by using the data of video watching behaviors in the flipped classrooms. Prediction of success is important to design the learning environment more efficiently and to give individual feedback. Estimates made by using large amounts of data from online environments have become very popular in educational data mining. In the present study, video watching data were obtained from 404 university students in different departments enrolled in Basic Computer Applications course for 4 semesters. Before the face-to-face education, the researcher prepared 11 videos compatible with course content with the average of 15 minutes. During the 14-week course period, students watched these videos through the Moodle learning management system. To record students' data related to number of jumping, number of logins, number of different video views etc., a tool built on the learning management system was used. 11 qualities collected from digital environment and 6 demographic information collected via the survey method, totally, 17 qualities were obtained in data set. Success performance of the students were determined as successful and unsuccessful. Random Forest, Support Vector Machines and Naive Bayes algorithms, which are among the most preferred classification algorithms in success prediction studies in the field to reveal hidden patterns in the data, were used in the analysis phase to answer the main problem of the study. Since the data set was unstable, synthetic data were created via the smote technique, and cross validation method was also used. When the obtained results were examined, it was revealed that the course success could be predicted with a high accuracy rate. The algorithm with the most successful classification rate was the Random Forest algorithm with a total accuracy rate of 83.11%. Support Vector Machines were able to predict with a very low accuracy rate compared to Naive Bayes and Random Forest algorithms. Considering the fact that success levels of unsuccessful students can be increased before final exams, prediction of unsuccessful students is thought to be more important than prediction of successful students. It was determined that the Random Forest algorithm with a accuracy rate of 87,67% in predicting unsuccessful students achieved a much higher correct prediction than other algorithms used.