不同储粮生态区稻谷脂肪酸值变化情况大数据分析研究*
2022-04-19姜友军顾雨熹单晓雪陈晋莹
王 锦 姜友军 李 理 顾雨熹 单晓雪 陈晋莹
(中储粮成都储藏研究院有限公司 610091)
我国是世界上最大的稻谷生产国和消费国,水稻播种面积约占世界总面积的20%。作为一个发展中的人口大国,水稻也是我国第一大口粮作物。水稻在收获后,除少部分被直接食用外,大部分是以稻谷或糙米的形式被储藏起来[1,2]。稻谷在储藏过程中,随着环境条件和储藏时间等的变化以及微生物和害虫生命活动的影响,粮食品质极易发生劣变,造成损耗[3-6]。研究稻谷在储藏过程中品质变化的规律,对建立健全粮食安全保障体系,确立粮食经济合理的运行模式,指导轮换工作,减少稻谷在储藏期间的损失具有重要意义。
我国地域辽阔,不同地区气候特点、生态条件以及与储粮安全紧密相关的气候、温度、相对湿度等主导因素各不相同,我国科研人员参考各地的农业耕作制度、风能、太阳能等区划和不同储粮生态区域的仓储害虫分布,经过多年的调查研究、资料比对、反复研讨、培训示范、布点验证,确定了能够反映我国不同储粮生态区域的安全储粮模式,据此把我国储粮生态区划分为七个(图1),分别为高寒干燥储粮区、低温干燥储粮区、低温高湿储粮区、中温干燥储粮区、中温高湿储粮区、中温低湿储粮区、高温高湿储粮区[7-9]。因自身特性原因,以及各生态区稻谷产量等多因素综合考虑,我国稻谷主要储存在第二到第七生态区[10-12]。
图1 我国七个储粮生态区域划分示意图
目前,我国稻谷储备数量庞大,储存周期长,存储方式各异,与稻谷储藏品质相关的质量检测数据体量大,类型繁多,数据分析起来困难较大。随着现代信息技术的不断发展,世界已跨入了互联网+大数据的时代,大数据与粮食企业的融合,通过对长期积累的海量数据整合和挖掘,应用综合分析工具,从时空多维度洞察发现大数据中隐含的价值和规律,将粮食安全储藏提升到精细化管理的新层面[13-15]。利用大数据分析探索不同储粮模式下粮食品质变化规律,对于探索适宜的粮食储藏条件,改善仓储设施,确立储备粮经济,安全的储藏运行模式,科学指导轮换工作具有极其重要的意义[16,17]。
本研究针对我国不同储粮生态区内稻谷的储藏品质变化展开研究。利用大数据分析探究稻谷(粳稻和籼稻)在不同年限、不同生态区域,不同储粮条件的储存品质和质量品质的变化情况以及对已有稻谷质量检查情况的分析,掌握稻谷关键品质指标——脂肪酸值的变化规律,从而探索不同地区的稻谷质量标准及合理轮换周期,为不同储粮生态区稻谷保质技术措施的提出提供理论依据。
1 材料与方法
1.1 数据采集与提取
本研究中所涉及的数据来源于我国稻谷主要储粮生态区内相关粮食储存库点2014~2018年稻谷质量品质检验数据,数据采集周期通常为半年1次,一年2次。通过大数据模型分析剔除异常值和空值,筛选获得67393条有效数据,其中粳稻检验数据24135条,籼稻检验数据43258条。初步分析后发现,每批样品进行连续4次检测以上数据具有良好的统计分析特性,故在针对品质指标分析时,主要采用连续储存超过1.5年的连续数据,共计3639条数据集。其中粳稻的连续数据有1034条,主要集中在第三、第四生态区,五、六生态区次之,第二生态区几乎没有,因此不进行第二生态区品质变化分析。籼稻的连续数据有2605条,主要集中在第五生态区,第四、六、七生态区次之,具体分布见图2。
图2 分析数据分布情况
1.2 分析方法
1.2.1 品质指标变化情况分析 本研究通过大数据分析探究我国稻谷在不同年限、不同生态区、不同储粮条件的储存品质和质量变化情况。根据GB/T 20569-2006《稻谷储存品质判定规则》中规定[18],稻谷品质指标的判定主要包括色泽、气味、脂肪酸值和品尝评分值,而色泽、气味和品尝评分值受主观性影响较大,因此本研究中主要以脂肪酸值变化进行分析。分析中以连续储存超过1.5年的数据为基准。
1.2.2 相关性分析 相关性分析是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析,是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。在本研究中,我们采用皮尔逊相关系数进行品质指标相关性分析,其值介于-1与1之间[19,20]。该相关系数也称作“皮尔逊积矩相关系数”。
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:
对样本皮尔逊相关系数则定义为:
1.2.3 差值分析 为探究稻谷品质指标在收获后随时间变化的规律,我们选用具有连续检测数据进行差值分析。考虑到粮食入库时已储存时间不同,本研究按每批粮食入库时的已储存年份(入库时间-收获时间),分为了储存0年、0.5年到5年共11个类别,利用这些粮食入库后每半年的检测数据,分析稻谷脂肪酸值随储存年份的变化规律。本文计算每批粮食每两次检测数据的差值。例如一批样本2014年秋季收获,收获之后2014秋季,2015年春季和秋季,2016年春季共有4个连续检测数据,则这批粮食的检测数据对应产生入库后2年内每半年的变化量。
2 结果与讨论
2.1 稻谷品质指标变化情况
2.1.1 稻谷脂肪酸值变化情况 本研究提取了各储粮生态区内稻谷连续储存的数据,绘制箱线图,其中“0101”表示储存第一年入库数据,“0202”则表示第二年秋季入库数据,以此类推。
如图3所示,各生态区内稻谷脂肪酸值随着储存时间的增加均呈现不断上升的趋势。第三生态区内,粳稻脂肪酸值50%的数据集中在15(KOH/干基)/(mg/100g)~25(KOH/干基)/(mg/100g)之间,随着储存时间增加,箱体大小无明显变化,存储前两年存在较多异常值点,需重点关注,储存到第三年后,脂肪酸值大幅上升(图3A)。第四生态区内,粳稻脂肪酸值50%的数据集中在15(KOH/干基)/(mg/100g)~25(KOH/干基)/(mg/100g)之间(图3B),籼稻脂肪酸值50%的数据集中在18(KOH/干基)/(mg/100g)~28(KOH/干基)/(mg/100g)之间(图3E),两者均随着储存时间增加,箱体大体保持稳定。第五生态区内,粳稻脂肪酸值50%的数据集中在15(KOH/干基)/(mg/100g)~25(KOH/干基)/(mg/100g)之间(图3C),籼稻脂肪酸值50%的数据集中在17(KOH/干基)/(mg/100g)~25(KOH/干基)/(mg/100g)之间(图3F),两者均随着储存时间增加,箱体大小基本不变,脂肪酸值分布较为集中。但粳稻在储存2.5年后脂肪酸值平均水平大幅增加,而在整个储存期间,籼稻脂肪酸值增长放缓。在第六生态区内,粳稻脂肪酸值50%的数据集中在17(KOH/干基)/(mg/100g)~26(KOH/干基)/(mg/100g)之间(图3D),籼稻脂肪酸值50%的数据集中在15(KOH/干基)/(mg/100g)~25(KOH/干基)/(mg/100g)之间(图3G)。第七生态区内,籼稻脂肪酸值50%的数据集中在20(KOH/干基)/(mg/100g)~30(KOH/干基)/(mg/100g)之间,随着储存时间增加,箱体逐渐变短,脂肪酸值变化逐渐趋于稳定(图3H)。
图3 稻谷连续储存数据脂肪酸值箱线和折线图
2.1.2 稻谷脂肪酸值差值变化情况 从上文可知,各储粮生态区内稻谷脂肪酸值均存在显著上升的趋势,为了更好地为稻谷的储存提供良好的建议,我们进一步讨论了随着储存时间的增加,稻谷品质指标的具体变化规律。
如图4所示,横坐标是储存半年后稻谷脂肪酸值的变化量,例如“v0102-0201”指的是连续数据入库后第一次检测与第二次检测稻谷脂肪酸值的变化量,后续各个生态区可类推。第三生态区内,粳稻脂肪酸值差值变化箱线图整体差异较小,储存前两年,差值分布存在右偏特征(图4A)。同时存在较多异常值点,储存前两年表现不稳定。第四生态区内,粳稻脂肪酸值差值变化箱线图整体较短,大部分差值集中在0~2.5(KOH/干基)/(mg/100g)之间。并且在储存前两年均存在较多异常值点,需要重点关注(图4B)。籼稻脂肪酸值差值变化箱线图整体较短大部分差值集中在0~5(KOH/干基)/(mg/100g)之间(图4E)。在第五生态区内,粳稻脂肪酸值差值变化箱线图整体波动较大。而储存一年以内的粳稻脂肪酸值,大部分差值集中在0~5(KOH/干基)/(mg/100g)之间(图4C)。籼稻脂肪酸值差值变化箱线图整体较短,波动较为集中,但存在较多异常值点,说明前两年存在较大波动。而储存两年以内的籼稻脂肪酸值,大部分差值集中在0~5(KOH/干基)/(mg/100g)之间(图4F)。第六生态区内,粳稻脂肪酸值差值变化箱线图整体波动较大。而储存一年以内的粳稻脂肪酸值,大部分差值集中在0~5(KOH/干基)/(mg/100g)之间(图4D)。随着储存时间增加,籼稻脂肪酸值差值变化箱体图逐渐变短,大部分差值的均值集中在0~3.5(KOH/干基)/(mg/100g)之间(4G)。
A
2.2 相关性分析
为了进一步全面了解品质指标的变化规律,我们还需要明确哪些指标与稻谷品质指标密切相关,因此需要对稻谷脂肪酸值做相关性分析。在本研究中,我们采用皮尔逊相关系数进行稻谷脂肪酸值相关性分析。其结果如表1所示。
从表1可以看出,在第二生态区内,粳稻脂肪酸值与水分、储存年份均表现出明显的负相关性。在第三生态区内,粳稻脂肪酸值与黄粒米的相关性是0.02,与出糙率的相关性是0,对比6个生态区第三生态区的数据内部存在很大的噪声。第四生态区内,粳稻脂肪酸值和储存年份的相关性为0,说明脂肪酸值随时间的变化很微弱。籼稻脂肪酸值与储存年份的相关性为0.07,是所有生态区中最高的,所以第四生态区籼稻脂肪酸值随时间变化的趋势最强烈;同时,与品尝评分值的负相关关系也是所有生态区中最强的。第五生态区内,粳稻脂肪酸值和水分的相关关系相对于其他生态区来说是比较高的,同时,脂肪酸值和品尝评分值的相关性仅次于第二生态区。籼稻脂肪酸值除了和储存年份有轻微的正相关关系之外,和其他指标的相关性都为0,说明第五生态区的数据存在比较大的干扰。第六生态区内,粳稻脂肪酸值和出糙率的相关性在全国范围内是相对较高的,与黄粒米的相关性也仅次于第二生态区,但是由于数据量的关系,几乎可以认为第六生态区的脂肪酸值和黄粒米的相关性是所有生态区中最高的。籼稻脂肪酸值和储存年份之间是负相关的关系,与水分相关性较高,说明第六生态区的籼稻储存受水分影响较大。第七生态区内,粳稻脂肪酸值与出糙率、杂质和水分的相关性都非常高,所以在实际储存中可以综合出糙率、杂质和水分的变化情况来推断脂肪酸值的变化。籼稻脂肪酸值和出糙率、杂质和水分的相关性都显著不为0,与储存年份仍然是正相关关系,同时与品尝评分值的关系也是负相关,和全国范围内的规律也是一致的。
表1 储粮生态区内稻谷脂肪酸值与其他指标相关系数
2.3 差值分析
对各生态区内稻谷的脂肪酸值进行半年期差值分析,以探究稻谷脂肪酸值在入库后随时间的变化规律。将所有相同入库已储存年份的稻谷每半年脂肪酸值的变化量汇总平均,得到的结果绘制变化趋势图如图5所示。
图5 各生态区内稻谷脂肪酸值半年差值变化趋势
从第二生态区粳稻脂肪酸值的半年差值由正到负,说明脂肪酸值会先上升后下降(图5A)。第三生态区内,粳稻脂肪酸值的半年差值都在0以上,说明脂肪酸值随着储存时间增加大致呈增加态势,当储存时间达到3年后,脂肪酸值会大幅上升(图5B)。第四生态区内,除起始年份之外,随着储存时间的增加粳稻脂肪酸值的差值基本在0附近波动,说明粳稻的保存状况较好,可以把脂肪酸值控制在稳定的水平(图5C)。籼稻脂肪酸值的差值在大多数年份都是正值但都接近0,说明随着时间增加第四生态区籼稻脂肪酸值虽然会增长但是增长趋势并不明显(图5F)。第五生态区内,粳稻在储存2年到2.5年的时间内,脂肪酸值的变化最大(图5D)。籼稻脂肪酸值随时间增长的趋势非常明显,尤其是储存1.5到2年左右的时间段内,上升速度达到最大(图5G)。第六生态区内,在储存的初始年份,粳稻脂肪酸值的变化较高,到了储存的后半期,脂肪酸值的变化会减缓,有一部分还会有下降趋势,这样就导致了脂肪酸值和储存年份的负相关关系(图5E)。籼稻脂肪酸值的变化随着时间变化的分布基本不变,而且略微有下降趋势,这就导致了脂肪酸值和储存时间之间的负相关关系(图5H)。第七生态区内,籼稻的脂肪酸值随储存时间变化的波动较大,而且有随着储存时间的增加波动越来越剧烈的趋势,但是脂肪酸值上升的趋势依然没有变,与其他生态区相比,第七生态区籼稻的脂肪酸值上升速度要更快(图5I)。
3 结论
从上述连续数据统计的结果可以看出,稻谷的脂肪酸值是随着储存时间的增加而不断上升的趋势,生态区之间差异明显,上升幅度因生态区会有所差异。此外,同一生态区内不同稻谷品种之间脂肪酸值的变化也有一定的差异。主要结论如下:
(1)第二生态区:粳稻脂肪酸值与水分、储存年份的相关系数显著,表现出明显的负相关关系。脂肪酸值的半年差值由正到负,说明随着储存时间增加,脂肪酸值会先上升后下降。
(2)第三生态区:粳稻脂肪酸值整体处于上升趋势,但仍未达到轻度不宜存阈值(25(KOH/干基)/(mg/100g))。同时,粳稻脂肪酸值和其他指标的相关性在所有生态区中最低,说明第三生态区的数据内部存在很大的噪声。
(3)第四生态区:脂肪酸值整体向上波动。粳稻在第四生态区的保存状况比较好,粳稻脂肪酸值随时间的变化很微弱。而籼稻脂肪酸值随时间变化的趋势最强烈,籼稻脂肪酸值和品尝评分值的负相关关系也是所有生态区中最强的。
(4)第五生态区:稻谷脂肪酸值整体存在向上的波动趋势。粳稻脂肪酸值和水分的相关性较高,同时,可以用品尝评分值的变化来近似推断第五生态区粳稻脂肪酸值的变化方向。籼稻脂肪酸值除了和储存年份有轻微的正相关关系外,和其他指标的相关性都为0,说明第五生态区籼稻的数据存在比较大的干扰。
(5)第六生态区:粳稻数据量较小,会存在较大的随机因素。籼稻脂肪酸值和储存年份之间是负相关的关系。另外,该生态区内籼稻脂肪酸值和水分相关性较高,说明第六生态区的籼稻储存受水分影响较大。
(6)第七生态区:粳稻脂肪酸值与出糙率、杂质和水分的相关性都非常高,在实际储存中可综合出糙率、杂质和水分的变化情况来推断脂肪酸值的变化。籼稻脂肪酸值与出糙率、杂质和水分的相关性都显著不为0,与储存年份正相关,与品尝评分值负相关。同其他生态区相比,第七生态区籼稻的脂肪酸值上升速度更快。
以上结论的提出将为探索不同地区的稻谷质量标准及合理轮换周期提供一定的指导意义,为不同储粮生态区稻谷保质技术措施的提出提供理论依据。