APP下载

人体均衡营养下的中国果蔬发展分析

2017-05-18苗颖婷

科技视界 2016年19期
关键词:主成分分析法

苗颖婷

[摘要]从均衡人体营养角度,对我国的果蔬发展现状进行了估计及预测。建立了果蔬消费估计模型,并结合《中国居民膳食营养素参考日摄入量(2004)》分析出了我国居民营养元素的摄入现状和中国居民的人体营养健康状态的发展趋势。同时给出在营养均衡的条件下的消费选择以及对我国果蔬生产规模进行战略性调整的建议,

[关键词]分段线性插值法;线性回归模型;主成分分析法;聚类分析法;目标规划

1我国居民主要水果蔬菜的消费估计模型

目前我国的果蔬的品种与产量较以往有了较大的提高,居民关于均衡营养问题的意识较以往有了很大的改善,但仍然不能完全摆脱传统的饮食习惯。这对我国果蔬的产量和种类有较大的影响。于是,我国果蔬的消费与生产预测展望,科学合理的规划、调整果蔬的种植形式应该受到广泛的重视。

由于我国果蔬的品种繁多且相关官方数据的缺失,我们只要筛选出有代表性的果蔬即可,一般情况下选取的果蔬要在数量上超过它们各自总量的90%,且营养成分和含量也满足研究的需求。我们运用不同的数学手段筛选出主要的果蔬种类,并建立数学模型对其消费量进行估量,研究其发展趋向。

首先,根据国家粮食局和FAOSTAT的数据可以得到产量达到90%的果蔬品种。再利用選出果蔬的2000年到2010年的产量数据与主要水果蔬菜损耗率结合得到相应年份的消费量。最后,分别利用分段线性插值法和线性回归法对年总消费量进行了估计,并总结其发展趋势。

1.1模型的假设与符号说明

1.1.1模型假设

假设1:为了计算方便,假设各种类的水果蔬菜没有进出口,并且在预测时间内没有政策因素、人为因素等重大变化影响数据预测。

假设2:假定水果蔬菜的总种植面积是不变的。

假设3:种植者收益不考虑种植的生产成本。

假设4:各品种价格按照原有趋势合理变动。

1.1.2符号说明

xi:问题中相对应要求的量;dc:人均日消费量(100g);yc:人均年消费量(万吨);fyy:每日摄取水果各营养成分;fyy0:水果营养成分矩阵;scyy:每日摄取蔬菜各营养成分;scyy0:蔬菜营养成分矩阵;dyy:每日摄取各营养成分;w:人口数(万人);aij:表示冬季或夏季选出的7种果蔬所含的6种营养素的量;d+正偏差变量;d-:负偏差变量;fa(i):水果i的种植面积;fp(i):水果i的价格:fdc(i):水果的单位面积产量;va(i):蔬菜i的种植面积;vp(i):蔬菜i的价格;vdc(i):蔬菜i的单位面积产量;fys(i,j):水果i的营养元素i;

vys(i,j):蔬菜i的营养元素i;bi:表示中国居民人均日摄人参考量;fsh(i):水果i的损耗率;cj:计算出来的7种果蔬的人均日消费量:vsh(i):蔬菜i的损耗率;xj:表示第j种果蔬的人均日消费量;h(j):所选取研究的营养素i;β0,β1:线性回归系数。

1.2筛选主要果蔬的品种

由于我国的果蔬种类众多,全部研究是没有太大的意义的。于是,我们依据国家粮食局给出的数据,可以满足其总计产量分别超过水果和蔬菜各自总产量的90%,而且所蕴含营养素在成分种类上和含量上可以基本满足国民的需求的15种水果:苹果、猕猴桃、梨、葡萄、柑橘类、红枣、香蕉、柿子、菠萝、西瓜、荔枝、哈密瓜、龙眼、草莓、桃;16种蔬菜:西红柿、胡萝卜、土豆、菠菜、蘑菇、菜花、茄子、韭菜、黄瓜、生菜、南瓜、蒜、白菜、油菜、芹菜、圆白菜。

1.3主要果蔬消费量的估计模型

1.3.1数据处理

依据上面分析出的主要果蔬种类,利用查到的各种果蔬的总产量(数据出自国家粮食局、FAOSTAT和国家统计局),结合主要水果蔬菜的损耗率,我们可以得到果蔬的消费总量(这里我们已经假设没有进出口)。计算关系式为:果蔬的消费总量=果蔬总产量*(1-田间地头到大市场损耗率)*(1-大市场到零售市场损耗率)*(1-零售市场到餐桌的损耗率)

利用该关系式可以求得水果和蔬菜的消费总量,如表1,表2所示。

1.3.2主要果蔬消费量的模型建立

1)依据插值法的主要果蔬的消费量估计

我们首先就是对主要果蔬从2000年至2010年的消费xi,(i=2000,…2010)利用分段线性插值法建立估计模型。

简而言之,就是将每两个相邻的节点用直线连起来,由此形成的一条折线就是分段线性插值函数,记作In(w),它满足In(xi)=yi,且In(x)在每个小区间[xi,xi+1]上是线性函数(i=1,…,n),如下:

(1)

用In(x)计算x点的插值时,只用到x左右的两个节点,计算量与节点个数n无关。但n越大,分段越多,插值误差越小。

利用Madab中的一维插值函数interpl进行求解,可以得到年份与果蔬的消费总量之间的趋势图,如图1所示。

根据图1不难得到,我国的主要果蔬的消费总量都是呈上升趋势的。

2)基于回归分析法的主要果蔬的消费量的估计模型

结合2000年到2010年我国主要水果蔬菜的年消费总量,运用下面的线性回归方程:

(2)

其中y代表样水果(或蔬菜)的消费总量,x代表年份,β0,β1代表回归系数,ε表示随机误差。

利用Matlab工具箱函数regress,直接对线性回归函数(2)进行求解。

a)水果总消费量的线性回归估计

利用上面的分析方法得到的水果消费总量与年份的回归函数表达式为:y=-1804912.142+906.307x

并且我们可以得到因变量y(水果消费总量)的83.1%可由模型确定,p值为0.0001远远小于显著性水平0.05,因而模型整体上看来是可用的。

同时得到图2水果消费总量与年份之间的相应的散点图和线性回归线以及图3为了更加精确的建立水果消费总量的线性回归模型所构建的残差分布图:

观察图3,我们可以看到除第1个数据外其余残差的置信区间均包含零点,第1个数据视为异常值,为了将模型正确率提高,我们将异常值剔除后重新计算,可得修正的水果消费总量线性回归模型:

y=-1339353.191+674.339x

此时因变量y(水果消费总量)的98.5%可由模型确定,p值为1.36*10-8远远小于显著性水平0.05,且各项指标相较于前一个模型有明显的改善,因而模型更优于前一个模型。

b)蔬菜总消费量的线性回归估计

利用同样的分析方法我们也可以得到蔬菜消费总量与年份的回归函数表达式为:

y=-2132485.649+1078.319x

并且因变量y(蔬菜消费总量)的92.8%可由模型确定,p值为1,97*10-6远远小于显著性水平0.05,因而模型整体上是可用的。

同时得到图4水果消费总量与年份之间的相应的散点图和线性回归线以及图5为了更加精确的建立水果消费总量的线性回归模型所构建的残差分布图:

同样的我们可以从图5中看到第7个数据时异常的,除了这个数据其他的置信区间均包含零点,于是我们要将第7个数据剔除,重新计算可以得到下面的修正结果:

y=-2496962.489+1259.859x

此时因变量y(蔬菜消费总量)的96.5%可由模型确定,比未修正时提高了,并且p值为4.215*10-7远远小于显著性水平0.05的同时也比未修正时要小,因而模型整体上相较于未修改的模型有较明显的改善。

利用上面得到的水果蔬菜(修改后)的线性回归模型,我们可以对我国水果蔬菜的消费总量进行预测。

1.4发展趋势分析

经过以上的分析结果,我们可以得到年总消费量呈现上升趋势。水果的年消费总量在2003年增长缓慢,但在2004年以后是呈现这稳步线性增长的:蔬菜的年消费总量在2006年有较大的浮动,总量明显降低,但后来有恢复为稳步线性增长。

2我国居民营养素摄入现状及预测

要了解我国居民矿物质、维生素、膳食纤维等营养素的摄入近况。我们利用了回归分析预测至2020年的主要果蔬的年消费量,同时,将国家统计局数据中的历年人口数,利用Logistic模型进行预测,得到至2020年的人口数,从而,得到至2020年的人均消费量。结合各种果蔬的营养素含量和人均消费量,我们可以得到人均攝入量。将此数据与《中国居民膳食营养素参考日摄入量(2004)》进行对比,可分析出营养元素摄入现状和中国居民人体营养健康状况的发展趋势。

2.1我国居民营养素摄入现状分析

为简化问题,选取我国居民消费的三种主要水果:苹果、梨和橘子,以及三种主要蔬菜:大白菜、菠菜和黄瓜作为研究对象。同时为求出我国居民主要水果蔬菜的人均日消费量,还需要从国家统计局得到2000-2010年全国人口数(万人),如表3所示:

根据式(3),式(4),式(5)和式(6)求得2000-2010年我国居民从主要的果蔬(每100g)日人均所摄取的各营养成分量。

(3)

(4)

(5)

(6)

根据所求数据以及对比《中国居民膳食营养素参考日摄入量(2004)》,我们得出以下结论:

(1)我国居民从主要的果蔬(每100g)日人均所摄取的营养成分量中,维生素c、E大致能够达到日摄入量最低需求;

(2)仅依靠主要果蔬,膳食纤维、钙、镁、锌及其他维生素并不能达到日摄入量需求:

(3)我国居民从主要的果蔬(每100g)日人均所摄取的营养成分量呈逐年增长趋势,

2.2预测2011-2012年我国居民营养素摄入状态

为简化问题,我们仍选取我国居民消费的三种主要水果:苹果、梨和橘子,及三种主要蔬菜:大白菜、菠菜和黄瓜作为研究对象。

根据水果和蔬菜的年消费总量的线性回归模型,我们可预测出2011-2020年苹果、梨和橘子以及大白菜、菠菜和黄瓜的年消费总量。再结合2000-2010年全国人口数,利用人口logistic模型,对2011-2020年全国人口数量的预测,如表4:

可得到相应年份我国居民主要果蔬的人均年消费量,由此得到2011-2020年我国居民从主要的水果蔬菜(每100g)日人均所摄取的营养成分量(此处仅列出部分计算数据):

根据所求数据,对比2000-2010年和2011-2020年我国居民从主要的果蔬(每100g)日人均所摄取的营养成分量以及《中国居民膳食营养素参考日摄入量》,我们得到以下结论:

1)2011-2010年我国居民从主要的果蔬(每100g)日人均所摄取的营养成分量均高于2011-2020年我国居民从主要的果蔬(每100g)日人均所摄取的营养成分量:

2)维生素C、E日摄入量的需求达中等水平;

3)仅依靠主要的水果蔬菜。膳食纤维、钙、镁、锌以及其他维生素仍不能达到日摄入量需求,但与日摄取量的需求差距进一步缩小了。

由此,我们能够进一步得出结论:至2020年,中国居民的人体营养健康状态逐步改善。

3保证均衡营养下的消费选择模型

3.1基于主成分分析法的果蔬营养素分类模型

考虑到各种果蔬所含的营养素的种类之间必然存在较强的相关性,为了避免造成信息的重叠及数据处理的方便性,我们利用主成分分析法将大部分果蔬的营养素分类,将其转化成少数几个不相关的综合营养素指标。

根据果蔬的常见性和所含的营养素的含量和广泛程度,挑选出以下果蔬作为研究对象,苹果、梨、桃、枣、哈密瓜西瓜、菠萝、桂圆、荔枝、香蕉、柑橘、葡萄、柿、猕猴桃、草莓、胡萝h、茄子、西红柿、黄瓜、南瓜、蒜苗、韭菜、大白菜、油菜、圆白菜、菜花、菠菜、芹菜、生菜。

用x1,x2,…,x21表示以上果蔬所含的营养素(能量、蛋白质、…、烟酸)。用i=1,2,…,29表示29种主要果蔬种类,以上果蔬所含的营养素x1,x2,…,x21的取值表示为[ai1,xi2,…,xi21],构造矩阵A=(aij29×21

这里我们对21种果蔬所含的营养素含量利用Matlab进行主成分分析,并得到相关系数矩阵的特征根及贡献率(由于数据过多,这里不一一列举)。

可以结果可看出,前7个特征根的累计贡献率就达到了85.3%,主成分分析效果很好。下面就选取前7个主成分进行分析。

由此可得果蔬营养素的七大主成分分别为:

3.2基于聚类分析的果蔬分类模型

为了研究29种果蔬的相似性及替代性,我们用上面主成分分析法得到的7个主成分作为指标对29种果蔬进行聚类分析,进而得到果蔬按照7种主要的营养素的相似性分类。我们先对每个指标的数据分别进行标准化处理,样本间相似性采用欧氏距离变量,

它等于G1,G2中两两样本点距离的平均,式n1,n2中分别为G1,G2中的样本点个数。

利用Matlab求解得到下面这样的聚类图,如图6。

依据上面显示的结果。我们可以将水果分为5类:第一类为红枣;第二类为胡萝卜;第三类为菠菜;第四类为梨和猕猴桃;第五类为其他的果蔬。各类果蔬在营养学角度是可以相互替换的。

3.3利用目标规划建立夏冬季果蔬的消费战略

首先,我们在聚类分析法的分类结果中结合当今各种类的果蔬价格,得到冬季和夏季相对便宜的7类水果,如表6所示,来满足在营养摄入合理的前提下达到购买成本最低得到条件:表6分季节筛选的果蔬品种

然后,根据我国居民营养素摄入量的分析结果,不难发现纤维素、维生素A、钙、钾、铁、锌,这6种营养素的缺失量相对较大,是我们亟待解决的问题,为此,我们主要依据这6种营养素的摄入来提供消费战略。

我们想到达到的目標是尽量满足对上面6种营养素的人均日摄入量,而且由营养素摄入量的分析可以看出目前我们所摄取的量是达不到参考值的,

下面,我们假设aij(i=1,…,6:j=1,…,7)表示冬季或夏季选出的7种果蔬所含的6种营养素的量,bi表示中国居民人均日摄入参考量,cj表示已经计算出来的7种果蔬的人均日消费量。则xi表示第i种果蔬的人均日消费量,相应的目标规划为:

利用Lingo软件求解得到相对最优的消费量,于是我们就得到分季节的建议人均日消费量,如表7,表8所示。

从上面的表格中可以看出,冬季我们可以多消费梨、枣和大白菜来满足我们人体每日所需要的营养素;夏季我们应该多消费梨、枣和黄瓜来满足我们每日的营养素需求,同时还可以使得我们的购买成本比较低。

综合上面得到的结果,我们可以看到梨、枣这两种水果是全年理想的消费品种。

4我国果蔬生产规模的战略性调整

4.1基于目标规划法的人均年度合理消费模型

为实现人体营养均衡满足健康需要,同时思考经济等方面的因素,国家需要对各类果蔬的生产规模做出战略性调整。

a.选取研究对象:利用主成分分析法和聚类分析法所得到的对常见水果蔬菜的分类,对其中的其他水果和其他蔬菜进行价格排序以及产量排序,我们各选取以下七种主要水果和蔬菜进行研究:

b.数据来源:根据中国种植业信息网查到的2009年以上水果和蔬菜各品种植面积,产量以及亩产量,以及从FAOSTAT网站查得2009年主要水果和蔬菜各品种的年平均价格数据。

c.模型构建:假定水果蔬菜的总种植面积是不变的,我们给营养均衡、购买成本最小化以及种植收益最大化三个目标赋予不同的权重,利用目标规划原理,对各类果蔬的种植面积进行最优化分配,分别重新得到各类果蔬的种植面积,并根据单位面积产量以及各类果蔬的损耗量,能够重新计算求得2009年我国居民主要果蔬的合理人均年消费量,模型如下:

4.2模型评价及调整战略

根据Lingo目标优化模型,我们同时考虑营养均衡,购买成本最小化,种植收益最大化以及土地面积因素,所求得的2009年的主要果蔬的种植面积与2009年的实际种植面积进行对比。由于在优化过程中考虑因素较多,在选择影响因素时,主观因素对分析结果有一定影响,所以至2020年我们对主要果蔬的生产规模作以下定性调整:

1)减少苹果的种植面积,增加猕猴桃的种植面积,其他水果面积暂时不进行调整:

2)大幅减少大白菜的种植面积,减少胡萝h、茄子、黄瓜的一定种植面积,大幅增加芹菜的种植面积,其他蔬菜种植面积暂时不进行调整。

另外。由Lingo目标最优化模型受启发,水果生产不同于蔬菜,各种水果都有最佳的生长地区,只有生长在最佳相宜地区的水果,才能健康生长,其水果风味才能达到最佳。是以,今后应该逐步取消不适合种植水果区域的生产,重点发展最适宜地域。

4.3进出口贸易因素及战略调整

考虑进出口贸易因素,我们以水果研究为主。由FAOSTAT数据整理得到表10.2000-2007年我国水果进出口贸易分析,图7为我国水果进出口总量分析!

结合前面的分析可知,水果总产量呈现出平缓的连续增长趋势,占总供应量的99%上下,是中国水果市场的主要供应来源,水果进口量虽逐年上升,但只占到我国水果总供应量的1%左右,对我国水果供应量变化的作用较低。

此外,尽管水果出口量快速增加,但出口量占水果生产量的比例仍较低。我国水果产业已进入买方市场,水果供应量已经能满足国内消费和出口的需求,可是水果剩余的征象越来越显著,供给大于需求的矛盾日渐锋利。

5政策建議

依据前面的研究结果显示,以改善我国居民的营养素摄入现状为目标。本文提出以下几点建议:

5.1实现果蔬品种和地区化的合理配置

在未来十几年内,我国果蔬总量生产基本保持稳步的增长。在保持果蔬总产量增加的同时,我们应该把重点放在提高果蔬质量和品种结构调整上。应适当减少需求空间涨幅不大的水果种类,更新好的品种以获得高效益,相关部门应研究制定果蔬种苗生产管理办法,着力抓好市场管理:不同的水果有其最适宜生长的地区,相关部门应该重点发展最适宜地区的水果生产,

5.2保护国内市场,积极开发国际市场促进果蔬出口

我国是果蔬的生产、消费大国。相关部门应该制定有效、合理的果蔬进出口政策,一方面要符合国际农产品协议的有关市场准入规定,尽量保护国内果蔬生产和国内市场不受国外进口果蔬冲击。另一方面,果蔬出口是解决国内过剩果蔬的一条途径。

5.3提高果蔬质量和人民的消费水平

近几年我国城镇居民的生活、消费水平快速提升,一定程度上促进了我国果蔬业的快速发展。而城镇居民对果蔬的要求也逐步提高,因此今后对城镇的策略是以提高果蔬质量和进行果蔬加工转化为主,同时由于城镇中的低收入家庭及偏远农村地区对水果的要求还处在数量需求阶段,因此他们将在很长一段时期内对加快我国果蔬的国内销售起到促进作用,

5.4加强果蔬市场体系建设,维护果蔬市场秩序

在研究解决的过程中,我们需要查询大量的果蔬数据,包括各年份果蔬的年平均价格、年产量、年种植面积等数据。由此我们受到启发,相关部门应当对果蔬的产销市场秩序进行约束,防止果蔬价格大幅度波动,积极开发市场,创设完善的市场信息网络体系,加大果蔬批发市场的建设监管力度。

[责任编辑:王伟平]

猜你喜欢

主成分分析法
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析