توقع أداء الطالب وعوامله المؤثرة باستخدام الانحدار الهجين والتصنيف متعدد الملصقات
Title Predicting Student Performance and Its Influential Factors Using Hybrid Regression and Multi-Label Classification
الباحث الرئيس عبدالله محفوظ محمد امين الشنقيطي
الباحثون المشاركون
التخصص: علوم الحاسب
التخصص الدقيق: machine learning algorithms
المستخلص: يطرح فهم أداء الطلاب في التعليم العالي ونمذجة والتنبؤ به تحديات كبيرة فيما يتعلق بتصميم نماذج تشخيص دقيقة وقوية. بينما حاولت العديد من الدراسات تطوير المصنفات الذكية لتوقع تحصيل الطلاب ، فقد أغفلوا أهمية تحديد العوامل الرئيسية التي تؤدي إلى الأداء المحقق. يعد هذا التحديد ضروريًا لتمكين قادة البرنامج من التعرف على نقاط القوة والضعف في برامجهم الأكاديمية ، وبالتالي اتخاذ التدخلات التصحيحية اللازمة لتحسين إنجازات الطلاب. تحقيقًا لهذه الغاية ، تساهم ورقتنا ، أولاً ، في نموذج الانحدار الهجين الذي يحسن دقة التنبؤ للأداء الأكاديمي للطالب ، ويتم قياسه كدرجات مستقبلية في دورات مختلفة ، وثانيًا ، مُصنِّف مُحسَّن متعدد العلامات يتنبأ بالقيم النوعية للتأثير من العوامل المختلفة المرتبطة بأداء الطالب الذي تم الحصول عليه. يتم إنتاج التنبؤ بأداء الطالب من خلال الجمع بين ثلاث تقنيات مرجحة ديناميكيًا ، وهي الترشيح التعاوني ، وقواعد المجموعة الضبابية ، والانحدار الخطي لاسو. ومع ذلك ، يتم إنشاء التنبؤ متعدد العلامات للعوامل المؤثرة باستخدام خريطة ذاتية التنظيم محسّنة. نحن نحقق ونبرهن بشكل تجريبي على فعالية نهجنا بالكامل على سبع مجموعات بيانات متنوعة ومتاحة للجمهور. تظهر النتائج التجريبية تحسينات كبيرة مقارنة بالنماذج الأساسية الفردية (مثل الانحدار الخطي ، عامل المصفوفة) ، مما يدل على التطبيق العملي للنهج المقترح في تحديد العوامل المتعددة التي تؤثر على أداء الطالب. بينما يعمل المستقبل ، يؤكد هذا البحث على الحاجة إلى التنبؤ بتحقيق الطالب لنتائج التعلم.
Abstract: Understanding, modeling, and predicting student performance in higher education poses significant challenges concerning the design of accurate and robust diagnostic models. While numerous studies attempted to develop intelligent classifiers for anticipating student achievement, they overlooked the importance of identifying the key factors that lead to the achieved performance. Such identification is essential to empower program leaders to recognize the strengths and weaknesses of their academic programs, and thereby take the necessary corrective interventions to ameliorate student achievements. To this end, our paper contributes, firstly, a hybrid regression model that optimizes the prediction accuracy of student academic performance, measured as future grades in different courses, and, secondly, an optimized multi-label classifier that predicts the qualitative values for the influence of various factors associated with the obtained student performance. The prediction of student performance is produced by combining three dynamically weighted techniques, namely collaborative filtering, fuzzy set rules, and Lasso linear regression. However, the multi-label prediction of the influential factors is generated using an optimized self-organizing map. We empirically investigate and demonstrate the effectiveness of our entire approach on seven publicly available and varying datasets. The experimental results show considerable improvements compared to single baseline models (e.g. linear regression, matrix factorization), demonstrating the practicality of the proposed approach in pinpointing multiple factors impacting student performance. As future works, this research emphasizes the need to predict the student attainment of learning outcomes.