本课程是一门面向教育学、信息技术及相关领域研究生的专业课程,旨在系统性地介绍学习分析与教育数据挖掘的核心理论、技术与实践应用。课程内容涵盖了从数据采集、处理到高级建模的完整数据科学流程。
课程首先介绍教育大数据的基本概念与特征,并详细讲授数据科学工作流(CRISP-DM),包括数据探索、数据清洗、预处理及特征工程等关键技术。
在核心算法模块,课程将深入探讨机器学习在教育场景中的应用。监督学习部分将涵盖分类(如决策树、朴素贝叶斯、神经网络)和回归(如线性回归、逻辑回归)算法,用于构建学业风险预警等预测模型,并介绍混淆矩阵、ROC/AUC等模型评价方法。无监督学习部分将聚焦于聚类(K-Means, DBSCAN)以发现学习风格群体,以及关联分析(Apriori, FP-Growth)和推荐系统(协同过滤)在个性化学习路径设计中的应用。
在进阶技术模块,课程将探索学习分析的前沿领域,包括知识追踪(KT)(如BKT, DKT模型)、多模态学习分析(MMLA)(融合视频、音频、生理数据以诊断专注与困惑)以及情感建模(OCC)。
课程社会网络分析(SNA)专题部分,学员将学习使用Gephi等工具,通过分析网络密度、中心性(度、中介等)和凝聚子群,诊断“信息孤岛”与“意见领袖”。课程将通过共享调节学习(SSRL)等案例,展示SNA如何帮助教育评价从传统的“总结性”转向“过程性干预”。
本课程不仅传授技术,更致力于培养学员“用数据说话”的教育思维,将数据洞察转化为可行动的教育策略。