基于MATLAB多元回归方法对中国乳业发展的分析
2017-12-12李怡然
李怡然
摘 要:随着经济发展和人民生活水平提高,乳制品逐渐成为人民生活消费的重要组成部分,中国乳业也相应快速发展。本文主要研究近年來中国乳业销量发展趋势及经济、社会、人口等各方面因素对其发展的影响,数据来源于中国统计年鉴和中国奶业年鉴。用回归分析的方法建立线性模型Y=Xβ+e,用MATLAB软件编程进行求解,求出β的估计值并用MATLAB软件画出残差图,对于结果不理想的数据使用非线性回归分析方法进行分析,并根据计算结果分析各个因素对中国乳业销量发展的影响。依此提出前瞻性发展意见与建议。
关键词:中国乳业;回归分析;MATLAB
中图分类号:S-03 文献标识码:A DOI:10.11974/nyyjs.20171132010
中国乳业发展存在诸多影响因素,其中经济方面的因素主要有人均国内生产总值、居民可支配收入、城镇化水平等,人口方面的因素主要有新增人口数量、人口年龄结构等。除此之外,还有食品制造行业因素、社会舆论方面的因素等。在各个因素的作用之下,中国乳业销量实现快速发展。各个因素之间复杂的内在关系决定了各影响因素与乳业销量的多元线性和非线性关系。通过建立和分析回归预测的模型可以得出不同因素对中国乳业销量发展影响的差别,进而有针对性的提出有利于乳业发展的意见与建议。
1 研究方法与数据来源
1.1 模型建立
设影响因变量Y的自变量数为n, 可以建立多元线性模型。
1.2 自变量和因变量的确定
建立多元线性回归预测模型时,为了确保回归模型能够较好的解释现实状况和准确预测未来趋势,要遵循一些准则来甄选自变量:自变量对因变量的改变影响较大,自变量与因变量呈现较为明显的线性关系;自变量与因变量的线性关系具有真实性,仅仅是形式上的关系不符合要求;自变量之间的关联度应小于自变量与因变量之间的关联度;自变量应当容易确定预测值,统计数据较为完整。对于那些不满足以上要求的自变量,采用非线性回归分析等方法进行简单分析。遵照自变量的选择准则,对前文所选的自变量和因变量进行适定性分析。
人均国内生产总值越高,居民可支配收入越高,消费能力强,乳产品的销量就越大;人口数量越少,新增人口占比越少,乳产品销量越小。这些因素对中国乳业发展有直接且显著的影响,且可能具有密切的线性相关性。
乳产品销量增长和经济、人口因素的相关性显然真实存在,不仅仅是形式上的关系。
由于社会经济发展影响因素众多,各自变量之间存在一定的相关性,但其相关程度不高于自变量与因变量之间的相关性。
中国近年来经济、人口方面的数据资料详细完备,其预测值也较为容易确定,因此可作为自变量的统计数据进行计算和分析。
2 模型估计
2.1 指标选取与数据来源
可以建立模型
,其中 e~N(0,),cov=0,i≠j
选取可以较为准确地反映中国乳业销量发展的指标变量十分关键。为使数据更加科学系统,数据分析的可操作性高,且数据较为容易获取,分别从经济、人口等方面选取指标如下表。
2.2 利用MATLAB软件进行线性回归分析
采用MATLAB估计,程序如下:
残差图如图1,没有可剔除的异常点。
3 模型检验
3.1 统计检验
拟合优度:由程序计算结果可以得=0.9149,模型对样本拟合度较高。
F-检验:针对:,
显著性水平,F-检验值=16.1345,阈值f=0.0002 F>f,应拒绝原假设,该回归方程显著,则城镇居民人均可支配收入、人均国内生产总值、城镇化水平、人口数量、人口出生率、人口自然增长率这些变量结合起来对中国乳产品销量有影响。但是与显著性相关的p值>0.05,说明回归方程中有些变量可以剔除。
3.2 数据的逐步回归
可以进行逐步回归:
stepwise(x,y)
运行结果表明变量和y之间没有显著的线性关系,与y呈现线性关系,得到回归方程Y=133.382-12.9914x5+7.70799x6,模型的评估参数为:R2=0.842053,修正的R2=0.817754,F-检验值=34.6531,p值=6.17051x10-6。
考虑到与因变量不是呈现较为简单的线性关系,故采用非线性回归的方法进行研究。程序如下:
我们可以得到y=e-133.4813 x1+ e-737.8294 x2+ e-878.5684 x3+ e-6.9133 x4-15.0860x5+12.6968 x6。
4 结果分析
4.1 基本结论
通过对相关资料和数据进行的计算和分析,得出以下结论。
人口出生率和人口自然增长率与人均乳产品消费量之间呈现出了较为显著的线性关系。分析认为,人口出生率越高,死亡率越低,自然增长率越高,尤其是在开放二胎政策以后,中国新生婴儿数量也开始了高速增长,且婴儿对乳产品需求量较大,故出现该计算结果。
城镇居民人均可支配收入、人均国内生产总值、城镇化水平与人均乳产品消费量之间没有比较明显的线性关系。表明在一定范围内,随着经济的发展,人均乳产品消费量会渐渐达到饱和,不会简单线性地随着经济增长而发生变化。
4.2 中国乳业发展的几点建议
基于此结果,对于中国乳业发展可以提出如下建议。
4.2.1 根据人口增长状况调节产能
随着全面开放二胎政策的实施,人口出生率会逐渐增长,自然增长率会维持在合理水平。乳制品生产厂家应密切关注人口增长变化情况,并根据人口增长趋势科学规划,合理控制产能增长,保证生产能力与人口增长状况相匹配。
4.2.2 加大产品结构升级换代力度
计算结果揭示,乳产品的市场需求不会随着经济发展而无限增长,乳产品必须通过内涵式发展,优化产品结构,增加高附加值产品比重,更好满足人们对高质量乳制品的需求,才能突破制约瓶颈,拓展新的发展空间。
4.2.3 深度拓展乳产品市场的性价比下降
经过多年的市场拓展,乳产品市场饱和度已经达到一定水平,巨额成本进行市场深度拓展的意义趋于下降。此时生产商应把经营重点由市场外延扩张转向产品质量提升。
4.3 模型的局限性
预测中国的乳业销量发展,在众多资料及数据的支撑基础上使用MATLAB进行多元回归分析能够较为准确地确定不同变量对乳产品消费量的影响程度,并能根据模型作出合理预测。但本模型只选取了一些典型性变量,存在一定的局限性,因此可以更改和扩充已有变量建立新的模型更好了解中国乳产品消费量发展状况,更加合理地预测乳业销量发展走势。
参考文献
[1]刘锐,王莉.中国乳品消费及影响因素研究[J].农业展望,2013(3):71-75.
[2]包凤达,翁心真.多元回归分析的软件求解和案例解读[J].数据统计与管理,2000(5):56-61.
[3]中华人民共和国国家统计局.中国统计年鉴2000-2015[EB/OL].
[4]中国奶业年鉴-2015[EB/OL].
[5]何晓群.回归分析与经济数据建模[M].北京:中国人民大学出版社,1997.endprint