基于PaddlePaddle云平台的机器学习课程实验案例研究
2022-01-10董如意杜俊杰
董如意,杜俊杰
(吉林化工学院,吉林 吉林 13022)
0 引言
人工智能已经成为支撑国民经济和工业发展的重要技术,并且正在深刻改变着人类的生产生活方式。国务院高度重视人工智能的发展,2017年制定的《新一代人工智能发展规划》明确指出:“人工智能是引领未来的战略性技术”[1]。机器学习已经成为当前技术发展热点,机器学习是通过计算机模拟或实现人类的学习行为,以获取新的知识或技能,并不断改善自身的性能,它是计算机具有智能的根本途径。机器学习技术发展迅速,已日渐渗透到生产和生活服务的各个方面。高校需要与时俱进、顺应时代,加强培养更多具有机器学习理论与应用实践能力的人才。而机器学习具有高度实践性且涉及的算法众多,如何在教学过程中结合项目实践,培养应用型人才,已成为各高校人才培养过程中关注的一个难题。百度的PaddlePaddle是一个易用、高效、灵活和可扩展的深度学习平台,它使得研究人员更容易、更快捷地构建深度学习模型,以及轻松地上传训练数据,训练深度学习模型,执行准确、直观的预测分析,极大提高速度和生产率[2]。
1 机器学习课程实验案例
机器学习课程是人工智能专业的核心专业课程,但机器学习课程建设过程中面临着实训室建设成本较高,机器学习理论艰涩枯燥等问题。因此课题组通过校企合作,引入线上Paddle云平台来解决实训室建设成本问题,并通过项目化的教学模式来贴近企业实际中的应用场景,提高学生的学习兴趣和学习效果。由此,探索形成一套机器学习课程的实验案例方案。
通过案例实践,进一步掌握并验证相关算法的性能及用法,着实提升学生对机器学习算法的解决问题能力及编程应用能力;通过详细查阅相关参考文献,将课程理论知识与未来企业实际需求相结合,以提升学生的技术竞争力。为了实现这些目标,在充分参考现有经典机器学习实验案例的基础上,课题组将实验内容、学科发展及实际需要联系起来,加强实验内容的综合性、系统性、专题性和模块化建设。
2 股票预测实验
本实验案例借助PaddlePaddle深度学习框架,使用Python语言构建基于LSTM神经网络模型,实现股票的预测模型。研究该案例的具体实现及其结合云平台操作的可行性。
2.1 长短期记忆神经网络LSTM
长短期记忆神经网络(Long Short-termmemory, LSTM)是一种特殊的RNN,是为了解决长序列训练过程中的梯度消失和梯度爆炸问题而设计的,相比普通的RNN,LSTM能够在更长的序列中有更好的表现[3]。图1为LSTM网络结构。
图1 LSTM网络结构
2.2 基于PaddlePaddle的LSTM实现
本次试验采用1990—2015年上证指数的开源股票数据集,共6 109条数据,利用历史数据中的开盘价、收盘价、最低价、最高价、交易量、交易额、跌涨幅来对下一日的最高价进行预测。基于PaddlePaddle库构建股票预测的神经网络模型,具体实验流程有以下几方面。
2.2.1 导入库
导入一些关键的库,分别是:(1)paddle.fluid。PaddlePaddle深度学习框架。(2)numpy。用于科学计算,支持大量的维度数组与矩阵运算。(3)matplotlib.pyplot:类似MATLAB的绘图框架,支持数据的可视化。
2.2.2 数据预处理
对股票数据集进行预处理,使得满足模型训练需要。本次实验将数据集中的60%作为训练集,40%作为验证集,划分数据集时进行数据归一化处理,这样可以提高模型的精度以及加快模型的收敛速度。LSTM算法在训练集上进行模型训练,再使用该模型对测试集进行预测,将预测结果与测试集的真实值进行对比,以评估该模型的性能。
2.2.3 搭建模型与训练模型
搭建LSTM模型的关键代码如下所示:
x = fluid.layers.data(name=’x’, shape=[1], dtype=’float32’, lod_level=1)
label = fluid.layers.data(name=’y’, shape=[1], dtype=’float32’)
fc0 = fluid.layers.fc(input=x, size= 4)
lstm_h, c = fluid.layers.dynamic_lstm(input=fc0, size=4, is_reverse=False)
模型搭建完成后开始训练,通过设置训练的回合数、批数据大小等参数,来观察其对训练结果的影响。由此得到较好的预测效果。
2.2.4 训练结果
使用训练后的模型对测试集数据进行股票预测并观察预测效果。将预测值Predicted Value和真实值True Value的折线图绘制在一起进行对比。LSTM神经网络预测结果如图2所示。
图2 LSTM神经网络预测结果
通过图2可以看出,使用PaddlePaddle构建的股票预测深度学习模型展示了预测值Predicted Value和真实值True Value有较好的拟合程度。
3 结语
本文结合实际应用问题,紧跟最新技术的步伐,重点强调教学过程的易懂性和实用性及系统性。通过基于PaddlePaddle平台的机器学习课程实验案例的研究,提高了学生利用机器学习方法解决复杂工程问题的能力,结合交叉学科的现实案例,既让学生能掌握基础的机器学习相关知识,又让学生充分了解机器学习技术的发展前沿。在此基础上学会利用PaddlePaddle进行算法实现和开发,进一步加深对理论知识的理解、概念的建立。除此以外,该课程实验案例研究能让学生在发现问题解决问题的过程中,掌握学科知识的具体应用与实现,极大地调动了学生学习的积极性,可以借此课程实验案例研究引导学生自发学习相关的知识。