本课程是一门面向教育学、信息技术及相关领域研究生的专业课程，旨在系统性地介绍学习分析与教育数据挖掘的核心理论、技术与实践应用。课程内容涵盖了从数据采集、处理到高级建模的完整数据科学流程。

课程首先介绍教育大数据的基本概念与特征，并详细讲授数据科学工作流（CRISP-DM），包括数据探索、数据清洗、预处理及特征工程等关键技术。

在核心算法模块，课程将深入探讨机器学习在教育场景中的应用。监督学习部分将涵盖分类（如决策树、朴素贝叶斯、神经网络）和回归（如线性回归、逻辑回归）算法，用于构建学业风险预警等预测模型，并介绍混淆矩阵、ROC/AUC等模型评价方法。无监督学习部分将聚焦于聚类（K-Means, DBSCAN）以发现学习风格群体，以及关联分析（Apriori, FP-Growth）和推荐系统（协同过滤）在个性化学习路径设计中的应用。

在进阶技术模块，课程将探索学习分析的前沿领域，包括知识追踪（KT）（如BKT, DKT模型）、多模态学习分析（MMLA）（融合视频、音频、生理数据以诊断专注与困惑）以及情感建模（OCC）。

课程社会网络分析（SNA）专题部分，学员将学习使用Gephi等工具，通过分析网络密度、中心性（度、中介等）和凝聚子群，诊断“信息孤岛”与“意见领袖”。课程将通过共享调节学习（SSRL）等案例，展示SNA如何帮助教育评价从传统的“总结性”转向“过程性干预”。

本课程不仅传授技术，更致力于培养学员“用数据说话”的教育思维，将数据洞察转化为可行动的教育策略。