生命周期基金净值预测研究
2019-08-08王宇航张青龙
王宇航 张青龙
摘 要:生命周期基金是我国养老目标投资基金的发展方向,对生命周期基金的净值进行研究具有重大意义。本文运用遗传算法优化的BP神经网络建立了生命周期基金净值的预测模型。通过对汇丰晋信2026基金2016—2018年度的相关数据进行实证分析,并与传统BP网络模型和RBF模型进行对比,表明该模型对基金净值的变化趋势有较好的预测能力,为生命周期基金净值的预测提供了一种可行的方法。
关 键 词:生命周期基金;净值预测;BP神经网络;遗传算法
DOI:10.16315/j.stm.2019.01.005
中图分类号: F224.3
文献标志码: A
Abstract:Life cycle fund is the development direction of pension target investment fund in China, so it is of great significance to study the net value of life cycle fund. In this paper, we use the BP neural network optimized by genetic algorithm to establish the prediction model of net value. Through the empirical analysis of the relevant data of the HFJX 2026 fund from 2016 to 2018, and comparing with the traditional BP network model and RBF model, it shows that the model has a good ability to predict the change trend of the net value of life cycle fund, and provides a feasible method for the forecast of the net value of it.
Keywords:life cycle fund; net value prediction; BP neural network; genetic algorithm
生命周期基金是一种可以根据投资者各个生命阶段的风险收益特征,调整基金中的资产配置比例,以期获得更优收益的基金品种。作为一款主要针对退休的投资产品,目前已日益受到美国等发达国家的养老金计划青睐,但在我国还处于起步阶段[1]。据统计,截止2017年第三季度,美国市场生命周期基金的总规模已经突破1万亿美元,而我国目前只有3只生命周期基金产品,仍处于探索阶段。其规模虽然较小但收益率均较大幅度跑赢基准,这说明此类基金发展潜力巨大。同时随着我国人口老龄化问题的不断凸显,养老金资产的增值保值越来越成为人们关注的焦点,生命周期基金将会是一个有效的选择,在风险管理、多样化资产配置、投资组合调整等方面有独特优势;因此,本文对这一领域进行一些研究,希望能为生命周期基金在我国的发展提供参考。
基金净值是基金的重要评价指标,研究生命周期基金净值可以为投资者提供对此类产品的判断依据,提高投资收益,降低投资风险。而预测基金净值又是判断基金价值走向的最直接方法,对此我国学者做了不少研究。王波[2]利用神经网络理论的辨识特性,建立了基金净值预测的BP神经网络预测模型。王敏[3]建立了基金净值预测的BP神经网络模型,并与灰色模型预测进行了对比,发现神经网络模型预测优于灰色模型预测。在训练样本充足的情况下,BP神经网络对于短期的基金净值数据预测基本可以达到要求,但个别预测值仍有较大误差。刘丽峰[4]提出了一种采用粒子群优化与BP神经网络相结合的组合模型,实证研究表明组合模型比单一模型具有更高的精确度和更快的收敛速度,能准确地捕捉基金净值的变化状况。宋丽平等[5]通过实证分析发现改进的BP模型能够较好的预测研究对象的真实状况。
虽然BP神经网络模型对基金净值的预测比传统的计量方法有优势,但存在收敛速度慢,局部最小值问题等缺陷。而基于遗传算法优化的BP神经网络模型已经在其他研究领域被学者广泛应用,如高玉明等[6]对传统的BP神经网络和经过遗传算法优化后的BP神经网络进行训练和仿真实验,结果表明经过遗传算法优化后的BP神经网络预测模型能加快網络的收敛速度,提高房价的预测精度。李钢等[7]提出运用遗传算法优化BP神经网络的评价方法,避免了传统评价方法确定权重值的主观随意性。叶云等[8]将GABP网络模型用于耕地质量评价中,事先不需要确定指标权重,直接输入网络进行训练,可以减少人为主观影响,取得了较好的试验效果。齐晓娜等[9]利用遗传算法优化BP神经网络的连接权和阈值,实例验证表明在建模样本和预测因子相同的条件下,该模型比传统BP网络的预测结果稳定且精度高。黄宏运等[10]利用具有良好非线性寻优能力的遗传算法来优化BP网络初始权值和阈值,对上证综指开盘指数进行了预测。以上这些研究都表明遗传算法优化BP神经网络对非线性数据进行预测可以取得很好的预测效果。
而目前还没有学者运用基于遗传算法优化的BP神经网络对生命周期基金的净值预测进行研究,为本文留下了一定的研究空间。
1 研究模型
1.1 BP神经网络
BP神经网络是一种多层前馈神经网络,该网络的特点是信号向前传递,误差向后传播。在向前传递中,输入信号从输入层经隐含层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络的权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。BP神经网络由各个神经元连接组成,一般分为三个层次:输入层、隐含层和输出层[11]。
在确定了BP神经网络的结构后,要通过训练样本集对网络进行训练,亦即对网络的阈值和权值进行学习和修正,以使网络实现给定的输入输出映射关系。由于BP神经网络初始的权值和阈值是随机生成的;因此,其训练速度较慢,存在局部极小值等问题。有研究表明通过遗传算法和BP神经网络结合的方式可以在一定程度上改善这些缺陷[12]。
1.2 遗传算法优化的BP神经网络
遗传算法优化的BP神经网络就是用遗传算法来优化BP网络的初始权值和阈值,使优化后的网络参数计算出的结果能够更趋近于期望输出。遗传算法优化BP神经网络的要素包括种群初始化、适应度函数、选择操作、交叉操作和变异操作[13]。
1)种群初始化。个体编码方式采用实数编码,是一个由输入层和隐含层的权值、隐含层阈值、隐含层和输出层的权值和输出层阈值4部分组成的实数串,串上的每1个位置对应着网络中的1个参数。网络的初始权值和阈值按照下式随机获得:
通过以上操作找到最适合BP神经网络的初始权值和阈值组合,再代入到BP神经网络中进行训练,直到满足误差要求为止。
2 实证分析
2.1 指标选择与数据来源
生命周期基金目前在我国只有3只,其中汇丰晋信2026基金的目标日期相对较长。而生命周期基金在目标日期之前,其风险水平才会不断调整;目标日期之后,会演变成低风险低收益水平的偏债型基金,收益比较稳定;因此,本文选择汇丰晋信2026周期混合基金作为研究对象,用其近期的数据研究此类基金在风险收益水平不断调整过程中的净值变化情况。
由于基金净值数据属于时间序列数据,有的学者在预测时直接采用前若干期的单位净值数据作为输入指标,本文认为这是不够合理的。因为基金净值的影响因素复杂多样,单一的数据指标会使预测产生较大误差;因此,本文选择影响基金净值的多个可量化指标,从内部变化和外部环境等不同方面来反映多种因素对基金净值的影响。对生命周期基金而言,在目标日期前属于偏股型基金。参考以往文献并结合生命周期基金自身的特点,选择12个指标作为输入数据的指标集,如表1所示。
其中,持债比例的规律性变化是生命周期基金不同于一般股票型证券投资基金的独有特点。而持债比例的变化会对基金净值产生显著影响;因此,将其作为基金净值的影响指标之一。
本文选择汇丰晋信2026周期混合基金2016年1月4日到2018年3月23日共110周的周数据作为实证样本。其中:基金的净值、累计净值、涨跌幅的周数据来源于同花顺客户端;持股集中度、持仓行业集中度、持债比例来源于天天基金网公布的该基金季度报告直接或计算得出;居民消费物价指数来源于中国统计年鉴。所有数据收集完毕整理后得到实证样本,前100周数据作为训练样本,后10周作为预测样本。
2.2 数据处理
在进行神经网络预测之前,需要对数据做归一化处理。归一化数据是指通过变换处理将网络的输入、输出数据限制在[0,1]范围内。进行归一化是因为各输入数据常常具有不同的物理意义或量纲,归一化之后的数据都在[0,1]之间变化,从而使网络训练一开始就给各输入分量以同等重要的地位。归一化的算法很多,在本文中,采用在[0,1]区间上进行归一化处理,算法如下:
2.3 主要参数选择与设置
本文主要参数的选择和设置分为两方面:一是在BP神经网络中,各层节点数的选择,以及神经网络训练次数、学习率和训练要求精度的设置;二是在遗传算法中,需设置种群规模、最大迭代次數、选择概率、交叉概率和变异概率等参数。
在BP神经网络中,输入输出层节点数取决于输入输出指标的个数;因此,本文输入层节点数为12,输出层节点数为1。隐含层节点数的确认是建立网络的重要部分。隐含层节点数过多或过少都会对网络的性能产生影响,达不到预测效果。本文在选取隐含层节点数时参考以下经验式。
其中:n为输入层节点数;m为输出层节点数;l为隐含层节点数;a为1~10之间的整数。本文中,n为12,m为1,l的取值范围为5~14。分别取该范围内的值建立神经网络,比较不同隐含层节点数下的预测结果的平均误差,取平均误差最小的节点数作为网络最终的隐含层节点数。经过验证得知,当隐含层节点数为11时,预测值的平均误差最小;因此,最终确定隐含层的节点数为11个。其他参数则根据经验设置,本文程序中学习率设为0.5,训练次数设为5 000,精度设为0.001,迭代过程设为100。在遗传算法中,设置种群规模为200,种群个体精度为20,最大迭代次数为1 000,选择概率为0.9,交叉概率为0.4,变异概率为0.2。
2.4 训练学习方法选择
本文参考前人经验,对样本学习方法采用时间移动仿真法。首先,用前100周的数据作为学习样本来进行学习,预测第101周的基金净值,然后以第2周到101周的数据作为学习样本进行学习,预测第102周的基金净值,以此类推,直到预测第110周结束,共进行10次学习和预测。同时,由于遗传算法中初始的权值和阈值是随机获得的,为保证结果的一般性,对网络进行多次学习预测。最后,取预测结果的平均值作为最终结果。
2.5 实证结果与分析
本文运用MATLAB R2017a软件编程来建立神经网络模型。为了对比和检验遗传算法优化的BP神经网络有更准确的预测效果,分别建立BP神经网络模型、RBF神经网络模型和GABP神经网络模型,经多次实验得到各网络的预测结果。RBF网络也是常用的神经网络模型,选择其作为对照更具有普遍性。实验结果数据,如表2所示。
由表2可知,GABP神经网络的预测值最接近真实值,预测误差最小,其平均相对误差为0.47%;其次是RBF神经网络,平均相对误差为1.23%;而BP网络的预测值与真实值之间的相对误差最大,接近于2.00%。这表明,GABP网络预测结果的稳定性和准确性要大幅度优于BP网络和RBF网络。
各模型的曲线对比,如图2所示。
图2中的曲线为依次为预测样本基金净值的真实值曲线,BP神经网络预测曲线,RBF神经网络预测曲线和GABP神经网络预测曲线。从图中可以看出,RBF网络的预测值略优于BP网络,与何树红等[14]的研究结论相吻合,但其起伏变化也比较大。而遗传算法优化的BP神经网络的预测值与真实值的拟合效果较好,预测值基本在真实值附近小幅度波动。实证过程中还发现,与BP网络和RBF网络相比,GABP神经网络的学习收敛速度更快,迭代次数更少。由此可以得到,GABP神经网络模型能够有效改善BP网络在基金净值预测上的不足,提高预测的速度和精度。
3 结论
本文主要研究生命周期基金的净值变化情况,针对BP神经网络在进行基金净值预测时存在收敛速度慢,局部最小值,学习效果不稳定等问题,提出了运用遗传算法优化的BP神经网络模型对生命周期基金的净值进行预测。为了对比验证优化后模型的预测效果,分别建立了BP网络、RBF网络和GABP网络3个模型对汇丰晋信2026基金2016—2018年度的相关数据进行实证分析,结果表明与BP网络和RBF网络相比,利用遗传算法优化后的BP神经网络能够更快速更准确地预测生命周期基金的净值,是一种值得参考的预测模型。
随着我国金融市场制度和产品的不断完善,生命周期基金在我国会逐渐发展起来。本文的预测模型有助于投资者在投资生命周期基金时根据此预测结果管控风险,及时针对净值的变化趋势对资产配置做出调整;有利于生命周期基金产品设计者根据模型结果,对产品相关参数在合规范围内进行修改;也有助于监管者提前发现潜在风险和问题,增强监管的及时性和有效性,适当做出调整。
参考文献:
[1] 席红辉.在企业年金投资产品中引入生命周期基金的探讨[J].保险研究,2008(8):25.
[2] 王波.基于神经网络的投资基金周净值预测[J].上海理工大学学报,2007(3):227.
[3] 王敏.基于神经网络的基金净值预测研究[D].天津:天津大学,2008:50.
[4] 刘丽峰.组合模型的基金净值预测研究[J].计算机仿真,2011,28(5):354.
[5] 宋丽平,李美君.创新型中小企业危机预警模型算法改進研究[J].科技与管理,2014,16(6):96.
[6] 高玉明,张仁津.基于遗传算法和BP神经网络的房价预测分析[J].计算机工程,2014,40(4):187.
[7] 李钢,田丽娜,齐二石.基于BP神经网络和遗传算法的企业信息化评价研究[J].科技进步与对策,2008(5):129.
[8] 叶云,赵小娟,胡月明.基于GABP神经网络的珠三角耕地质量评价[J].生态环境学报,2018,27(5):964.
[9] 齐晓娜,程维刚.基于遗传LMBP神经网络模型的股票预测[J].无线互联科技,2016(3):86.
[10] 黄宏运,朱家明,李诗争.基于遗传算法优化的BP神经网络在股指预测中的应用研究[J].云南大学学报(自然科学版),2017,39(3):350.
[11] 王小川,史峰,郁磊,李洋.MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013:1.
[12] 郝继升,任浩然,井文红.基于自适应遗传算法优化的BP神经网络股票价格预测[J].河南科学,2017,35(2):190.
[13] 田雨波.混合神经网络技术[M].北京:科学出版社,2009:131.
[14] 何树红,吴迪,张月秋.比较BP神经网络和RBF神经网络在基金净值预测中的应用[J].云南民族大学学报(自然科学版),2014,23(2):124.
[编辑:费 婷]