在数字经济与金融科技(FinTech)迅速演进的背景下,数据正成为金融行业的关键生产要素。从传统的结构化交易信息到非结构化的文本舆情,如何在海量信息中提炼有价值的信号,并利用机器学习、深度学习与大语言模型(LLM)提升金融业务表现,已成为行业人才的重要能力。
课程内容围绕前沿趋势,构建系统性的“数据—算法—场景—大模型”知识框架。课程内容由基础迈向前沿。首先介绍金融大数据的来源、特点及典型应用场景,帮助建立对金融数据生态的整体认识;继而讲解数据清洗、特征工程、可视化以及聚类、决策树、随机森林等核心方法,构成后续建模的技术基础。在时序预测部分,系统梳理从 ARIMA 到 LSTM、TCN 的主要方法体系,对比传统时间序列模型与深度学习在处理复杂金融市场动态中的表现。随后将视角扩展至风险管理,解析大数据风控体系的理论框架,并以 Kaggle 信用风险预测为案例,呈现完整的金融机器学习实践流程。课程的前沿部分聚焦当前最受关注的文本挖掘技术与大语言模型,系统介绍其基础原理与关键技术,深入解析金融领域专用大模型的技术路径与进阶方向(包括检索增强生成),并探讨其在投研、风控与合规等核心场景中的应用潜力与面临挑战。