Akademik başarının makine öğrenmesi yöntemleri ile tahmin edilmesi
Yükleniyor...
Dosyalar
Tarih
2024
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Bursa Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Makine öğrenmesi, bir yapay zeka alanıdır ve sistemin geçmiş deneyimlerine dayalı olarak yeni bir model oluşturmasına ve gelecekte karşılaşabileceği durumlar hakkında tahminlerde bulunmasına olanak tanır. Bu süreç, bilgisayarın mevcut verileri kullanarak bir model geliştirmesini ve bu modeli gelecekteki veriler üzerinde kullanarak kararlar almasını ve sorunlara çözümler üretmesini içerir. Günümüzde birçok farklı alanda başarılı uygulamalara sahip olan makine öğrenmesinin eğitim sektöründe de kullanılmasıyla birlikte, bu uygulamaların eğitim yaklaşımlarında yepyeni gelişmelere yol açması kaçınılmazdır. Bu çalışmada, öğrencilerin yaşam şartları ve sosyal etkileşimlerinin akademik başarıları üzerindeki etkileri incelenmiştir. Veri seti üzerinde tüm makine öğrenmesi teknikleri kullanılarak modeller oluşturulmuş ve performansları karşılaştırılmıştır. Detaylandırılmış alt kısımlarla birlikte dört ana bölüme ayrılmış olan bu çalışmada öncelikle Giriş kısmına yer verilmiştir. Her bir ana bölüm içeriğine bağlı olarak alt kısımlara ayrılmış olup ana başlıkla ilgili tüm detayları içerecek şekilde hazırlanmıştır. Literatür araştırmasının yer aldığı birinci bölümün ardından ikinci bölüm olan Veri Madenciliği bölümüne geçilmiştir. İkinci bölümde yer verilen veri madenciliğinin tanımsal kavramlarıyla birlikte süreçleri ve modelleri, yol haritalarıyla desteklenip konu bağlamında anlatılmıştır. Bu bölüm, ana fikri destekleme noktasında önem taşımanın yanında çalışmanın üzerine oturtulduğu temellerden biri olarak da görev yapmaktadır. Üçüncü bölüm ise veri madenciliği ile elde edilen verilerden yola çıkarak uygulamaya konulan metot ve analiz kısmına ayrılmıştır. Öğrenci başarılarının tespit edilebilmesi için regresyon ve sınıflandırma yöntemleri uygulanmıştır. Çalışma için öğrenci performans verilerinden oluşan Student Performance veri seti kullanılmıştır. Bu veri seti Portekiz'de iki farklı okulda ortaokula giden öğrencilerin performanslarını göstermektedir. Son olarak algoritmaların sonuçları referans makaleler ile karşılaştırılmış ve referans makalelerden daha yüksek sonuçlar elde edilmiştir. Sınıflandırma algoritmalarından Karar Ağacı algoritması, doğrusal olmayan regresyon algoritmalarından Catboost algoritması ve Doğrusal Regresyon algoritmalarından Çoklu Doğrusal Regresyon algoritması en başarılı sonuçları vermiştir. Elde edilen en yüksek oranlar Karar Ağacı için %93.3, Catboost için %86.9 ve Çoklu Doğrusal Regresyon için %82.9 olarak görülmüştür.
Machine learning is a field of artificial intelligence and it allows the system to build a new model based on past experiences and make predictions about the situations it may encounter in the future. This process involves the computer developing a model using existing data and using this model on future data to make decisions and produce solutions to problems. It is inevitable that machine learning, which has successful applications in many different fields today will lead to brand new developments in educational approaches with its use in the education sector. In this study, the effects of students' living conditions and social interactions on their academic achievement are analyzed. Models were created using all machine learning techniques on the dataset and their performances were compared. This study, which is divided into four main sections with detailed sub-sections, firstly includes the Introduction. Each main section is divided into sub-sections depending on its content and is prepared to include all the details related to the main topic. After the first chapter, which includes the literature review, the second chapter, Data Mining, is presented. In the second section, the definitional concepts of data mining, processes and models, supported by road maps, are explained in the context of the subject. In addition to being important in supporting the main idea, this chapter also serves as one of the foundations on which the study is based. The third section is devoted to the methodology and analysis based on the data obtained through data mining. Regression and classification methods were applied to determine student achievement. Student Performance dataset, which consists of student performance data, was used for the study. This dataset shows the performance of students attending secondary school in two different schools in Portugal. Finally, the results of the algorithms were compared with the reference papers and the results were higher than the reference papers. Decision Tree algorithm from classification algorithms, Catboost algorithm from non-linear regression algorithms and Multiple Linear Regression algorithm from linear regression algorithms gave the most successful results. The highest rates obtained were 93.3% for Decision Tree, 86.9% for Catboost and 82.9% for Multiple Linear Regression.
Machine learning is a field of artificial intelligence and it allows the system to build a new model based on past experiences and make predictions about the situations it may encounter in the future. This process involves the computer developing a model using existing data and using this model on future data to make decisions and produce solutions to problems. It is inevitable that machine learning, which has successful applications in many different fields today will lead to brand new developments in educational approaches with its use in the education sector. In this study, the effects of students' living conditions and social interactions on their academic achievement are analyzed. Models were created using all machine learning techniques on the dataset and their performances were compared. This study, which is divided into four main sections with detailed sub-sections, firstly includes the Introduction. Each main section is divided into sub-sections depending on its content and is prepared to include all the details related to the main topic. After the first chapter, which includes the literature review, the second chapter, Data Mining, is presented. In the second section, the definitional concepts of data mining, processes and models, supported by road maps, are explained in the context of the subject. In addition to being important in supporting the main idea, this chapter also serves as one of the foundations on which the study is based. The third section is devoted to the methodology and analysis based on the data obtained through data mining. Regression and classification methods were applied to determine student achievement. Student Performance dataset, which consists of student performance data, was used for the study. This dataset shows the performance of students attending secondary school in two different schools in Portugal. Finally, the results of the algorithms were compared with the reference papers and the results were higher than the reference papers. Decision Tree algorithm from classification algorithms, Catboost algorithm from non-linear regression algorithms and Multiple Linear Regression algorithm from linear regression algorithms gave the most successful results. The highest rates obtained were 93.3% for Decision Tree, 86.9% for Catboost and 82.9% for Multiple Linear Regression.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri, Bilgisayar ve Kontrol, TECHNOLOGY::Information technology::Computer engineering, omputer Science and Control