APP下载

图书借阅量预测建模方法比较研究

2014-12-25

科技视界 2014年23期
关键词:灰色遗传算法建模

陈 英

(河南农业大学 马克思主义学院,河南 郑州450002)

0 前言

在信息社会, 纸质图书的流通频率对构建学习型社会非常重要,一定周期内的不同类型的图书借阅量反映了该社会公民的整体素养。借阅趋势分析是图书管理员的日常工作之一, 通过对借阅规律分析,管理员能够掌握师生的借阅兴趣和研究状况,各类图书和期刊的采购数量和质量,达到更好的为师生服务的目的。 建立恰当的数学模型能够预测未来一定时间段内图书的借阅规律,常见的借阅规律预测模型建模方法有以下几种:多变量回归分析法、神经网络、灰色系统理论和遗传算法等[1]。 在上述方法中,多变量回归分析方法是基础,其它几种方法都是基于该方法演变而来,是最通用的方法[2]。神经网络算法也是数学建模中常用算法,该算法有很强的非线性拟合能力,可映射任意复杂的非线性关系,学习规则简单,鲁棒性、记忆能力、能力和自学习能力强大,但该算法没能力来解释自己的推理过程和推理依据,训练模型的数据量庞大,计算过程容易造成信息的丢失;与神经网络建模方法相比,灰色系统理论建模过程清晰简单,模型稳定性比较好,但预测精度有待提高。 遗传算法属于全局搜索算法,采用仿生学原理模拟自然进化过程择优搜索,该方法适用范围广,在一定域内总能找到目标解,但模型容易“早熟”,难以到达最优解,属于随机算法[3-4]。 本文对上述四种建模方法的建模过程进行分析,对数学模型的优缺点进行评价,为图书管理员和图书管理科研工作者提供一定的参考。

1 多变量回归建模预测图书借阅量

1.1 建模原理

回归分析是一种分析变量之间关系的数理统计方法。对于待分析的数据和变量,虽然变量之间没有确定的数学关系,但可以找出最能代表它们之间关系的数学表达式:数学模型。 在图书借阅规律研究方面,有两方面的应用,一是根据师生以往和现在的借阅状况,预测图书将来的借阅状况; 二是对影响借阅状况的原因进行分析, 找出哪些是重要因素, 哪些是次要因素, 这些因素之间又有什么关系等等。

1.2 建模过程

使用多变量回归分析方法得到的图书预测模型通常表示为时间变量的多项式,并利用最小二乘原理求得多项式的系数,主要求解步骤如下:

(1)根据待借阅预测的图书数量,预测模型通常可表示为下列多项式:

其中:

式中:y 为各种图书的预测借阅量;m 为n×n 维模型系数矩阵;x为模型计算参数;c 为n 维待求常数向量。

(2)将各种图书历年的借阅数据代入方程式(1)中,计算出系数矩阵和常数项。

(3)将系数带入方程(1),计算借阅预测值。

(4)计算拟合残差,评估预测结果的可靠性。

2 神经网络建模预测图书借阅量

2.1 神经网络建模原理

神经网络建模的基本原理是:各种图书历年的借阅样本数据通过模型的中间层作用于输出层,经过非线形变换,产生输出的模拟值,模型训练的数据包括输入矩阵和期望矩阵。模型输出值和期望值之间的偏差量,通过调整输入层与隐层之间的加权值、隐层与输出层之间的加权值及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(加权值和阈值),训练即告停止。 此时经过训练的神经网络即能对类似样本的输入数据,自行处理输出误差最小的经过非线形转换的信息。 神经网络模型结果如图1 所示。

图1 神经网络模型结构Fig.1 The structure of a neural network model

2.2 神经网络建模过程

(1)模型初始化。给各节点间赋予一个初始权值,一般可以设为(-1,1),设定节点间误差函数e 和计算精度ε,规定最大学习次数M。

(2)输入样本数据,计算各隐层神经节点的输入和输出数据值。

(3)利用模型的输出期望和实际输出,计算误差函数对模型节点的偏导数δm(k);计算隐层和输出层对神经节点的偏导数δn(k)。

(4)利用神经节点的计算值修正节点间的连接权值。

(5)计算综合精度,并判断预测值是否符合要求。

3 灰色系统理论模型预测图书借阅量

3.1 灰色系统建模原理

灰色系统模型预测, 是指对系统行为特征的发展变化进行预测,对既含有白信息又含有灰色信息的系统进行预测。 很多情况下,样本数据中所显示的信息具有随机性,但随机的信息中也包含了时序的特征,灰色模型预测就是利用这种规律来进行预测。 当前使用比较多的灰色预测模型是一阶微分的GM(1,1)模型。它是基于随机的原始时序,经累加后所形成的新的时序,该时序的规律用一阶线性微分方程的解来逼近。

3.2 预测模型建模过程

(1)样本数据处理和GM(1,1)方程的构建

式中:C 为中间值矩阵,Z 为原始样本矩阵。

(3)预测方程精度评估。 精度评估主要是对模型方程的预测值和样本数据进行比较,计算预测残差和数据间的相对误差。

(4)预测实现。

4 遗传算法预测图书借阅量

4.1 遗传算法建模原理

遗传算法是本质上是一种寻优方法,该方法借鉴生命学上的生物优胜劣汰原则,不断的择优搜索系统解。 该方法直接对待优化的系统进行求解,不需要对系统进行连续性限定和对系统求偏导数,因此在应用上更加灵活,并且有较强的全局搜索能力。 能对所有的样本数据进行优化处理,并且自适应的调整搜索的方向,在样本数据的渐次迭代中找到最优预测解, 而且得到的这个解象生物界的生命体进化那样,有更强的适应性。

4.2 遗传算法用于图书预测建模过程

建模的过程参看流程图2。

图2 遗传算法预测模型基本建模过程Fig.2 Prediction model of genetic algorithm

5 实例分析和预测结果比较

5.1 借阅样本数据

表1 显示的是河南农业大学文法学院图书室2005~2012 年间两种图书的借阅量。

表1 2005~2012 年 两种图书借阅量Tab.1 Lending condition among 2005-2012 years

5.2 不同建模方法预测结果比较

(1)表2 显示的是2013 年的两种图书预测结果

表2 回归分析法年借阅趋势预测结果Tab.2 Forecast results of year of variable regression

(2)表3 显示的两种图书的灰色模型预测结果

表3 灰色模型借阅趋势预测结果Tab.3 Forecast results of year of grey system theory

(3)表4 显示的两种图书的神经网络模型预测结果

表4 神经网络借阅趋势预测结果Tab.4 Forecast results of year of neural network

(4)表5 显示的两种图书的遗传模型预测结果

表5 遗传模型借阅趋势预测结果Tab.5 Forecast results of year of genetic algorithm

5.3 预测结果分析比较

从预测结果可以看出,遗传算法模型的预测结果比较精确,绝对误差和相对误差都比较小, 灰色系统理论模型的预测结果相对比较弱,神经网络模型和回归模型的预测结果介于二者之间。 灰色系统理论是对数据进行逐次累加,找到数据间的线性规律,当原始数据间跳跃比较大时,这种叠加出的规律线性度并不明显,所以预测结果比较弱。遗传算法在每一步计算时,都要进行智能择优搜索,而且对数据间的跳跃不敏感,所以在对这类数据进行处理和预测时,结果相对精确。神经网络模型的精度和中间层的数量有很大的关系,对原始样本数据量的要求也比较大,在不满足上述条件时,预测精度比较弱,而回归分析对数据的间的线性度要求比较高。

6 结语

本文分析了多变量回归、灰色系统理论、神经网络和遗传算法在河南农业大学文法学院图书室图书借阅量预测模型构建方面的问题,对四种建模方法的建模过程和建模结果进行了分析。用部分图书的年借阅量作为样本数据,预测了2013 年这两种图书的借阅量,并与记录值进行了比较。比较得出了遗传算法更适合于图书室借阅量预测的重要结论。

[1]刘思峰,等.灰色系统理论及其应用[M].3 版.科学出版社,2007.

[2]陈英,王秀山.基于灰色系统理论的农业院校院系纸质图书借阅管理研究[J].科技视界,2003(3):114-116.

[3]陈英.小型图书室用的智能型多功能入侵报警系统设计[J].科技信息,2013(25):376-377.

[4]赵海涛.数控机床热误差实时补偿关键技术研究[D].上海交通大学图书馆,2006.

猜你喜欢

灰色遗传算法建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
浅灰色的小猪
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
灰色时代
她、它的灰色时髦观
基于遗传算法和LS-SVM的财务危机预测
基于改进的遗传算法的模糊聚类算法