2012-2018年中国马铃薯批发市场交易价格调查统计数据集
2022-10-08安民孙伟韩昀杨入一闫燊孔繁涛曹姗姗
安民,孙伟,韩昀,杨入一,闫燊,孔繁涛,曹姗姗*
1.中国农业科学院农业信息研究所,北京 100081
2.国家农业科学数据中心,北京 100081
3.中国农业科学院国家南繁研究院,海南三亚 572024
4.中国农业科学院农业资源与农业区划研究所,北京 100081
5.中国农业科学院特产研究所,长春 130112
引 言
马铃薯是继小麦、水稻和玉米的世界第四大重要粮食作物,除直接食用外还可以作为原料应用于食品加工、石油化工、纺织造纸、医疗卫生等多个领域[1],适应性强、产量高,且营养丰富、用途广,在全球都有较为广泛的种植[2-4]。中国是马铃薯生产大国,近年马铃薯种植面积及总产量均居世界首位,种植区域分布较广,种植面积排名前10的省份主要分布在北方和西南方向[5-6]。
马铃薯在我国多数区域的地方经济中占有非常重要的地位,马铃薯产业更是新时期农业结构调整和农民持续增收的支柱产业[7]。近年来,我国马铃薯产业稳定发展,但受气候、种植政策以及国内外消费趋势等的影响,马铃薯价格剧烈波动时有发生,危害马铃薯产业的健康平稳发展,损害了薯农利益。因此,以马铃薯历史价格数据整理及分析为依托,研判马铃薯价格波动特点及影响因素,对预测马铃薯价格变化趋势、提出稳价控价政策,具有非常重要的意义[8]。
目前,马铃薯平均价格信息多出现在一些农产品价格信息网站上,与其他种类的蔬菜价格信息混在一起,专门的马铃薯平均价格信息数据集较少。为便于科学研究,本研究收集了全国31个省(自治区、直辖市)的219个农产品批发市场2012-2018年的马铃薯日均交易价格数据作为基础研究数据。为了得到较为精确的马铃薯价格数据,从不同的时间尺度、地理空间分布尺度进行分析整理,定量展示马铃薯价格的波动,经过筛选及计算,得到2012-2018年马铃薯价格文本信息共计 43831条,其中包括数据连续性较好的 25个省(自治区、直辖市)平均价格信息 12073条,变化率信息22168条;6大地理区划范围的马铃薯平均价格信息2898条,变化率信息5322条;全国马铃薯平均价格信息483条,变化率信息887条,为马铃薯价格分析及预测提供数据支撑。
1 数据采集和处理方法
本数据集的基础数据是2012-2018年全国219个农产品批发市场的马铃薯日均交易价格信息数据。信息主要来源为全国农产品商务信息公共服务平台、全国农产品批发市场价格信息系统等平台和基金项目组实际市场调研数据。按照完整性、连续性、一致性等原则,在对收集整理的各类信息进行对比查证、筛查、鉴定、剔除、拟合填补缺失值等规范化处理后,最终得到马铃薯批发市场日均交易价格数据332007条,作为研究基础数据。表1为价格数据收集所涉及的不同地理区划范围的所有省(自治区、直辖市)内的市场数量。
表1 数据涉及区域及市场个数Table 1 The number of markets in data involved regions
本数据集利用Excel中的AVERAGEIFS函数,选取6大地理区划、25个省(自治区、直辖市)的日度价格数据,经过计算获得不同时间尺度的平均价格及其环比、同比价格变化率等,信息共计43831条。本数据集数据来源上涉及统计数据、调研数据等,空间尺度上有全国数据、地理区划数据、省域数据,时间尺度上有年度数据、季度数据、月度数据、周度数据,数据类型上有文本数据类型、图像数据类型。图1展示了本数据集生成的技术路线。
图1 数据集生成技术路线图Figure 1 The generation technology roadmap of the data set
2 数据样本描述
2.1 文本数据
数据集包含6个EXCEL文件,共有文本数据43831条。文本数据涉及平均价格、环比变化率、同比变化率等数据项(表2)。其中,华北地区包括北京市、天津市、河北省、山西省、内蒙古自治区等,共计8220条信息;东北地区包括辽宁省、黑龙江省等,共4110条信息;华东地区包括上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省等,共10960条信息;中南地区包括河南省、湖北省、湖南省、广东省、广西壮族自治区等,共8220条信息;西南地区包括四川省、云南省等,共4101条信息;西北地区包括陕西省、甘肃省、宁夏回族自治区、新疆维吾尔自治区等,共6850条信息。
本数据集EXCEL文本数据的数据项主要包括平均价格及其变化率,平均价格单位为“元/千克”,变化率为百分比。文本数据从时间上涵盖2012-2018年期间的周度、月度、季度和年度4个尺度,从空间上分为25个省(自治区、直辖市)、6大地理区划(华北、东北、华东、中南、西南、西北)和全国3个尺度,各时空尺度下的数据项主要包括马铃薯平均价格、环比变化率和同比变化率。其中,数据均为浮点型数据,平均价格数据按原始数据计算价格保留小数位,最长为小数点后9位,变化率保留小数点后1位。表3展示的是数据集中华北、东北两大地理区划的部分周平均价格(单位:元/千克)及其环比、同比变化率。
表2 数据项列表及信息数量说明Table 2 Data item list and the description of information quantity
表3 文本数据样例Table 3 Samples of the text data
单位:元/千克
2.2 jpg图件
根据已获取的2012-2018年全国、25个省(自治区、直辖市)、6大地理区划的周度、月度、季度、年度的马铃薯平均价格(单位:元/千克)及变化率数据绘制价格波动折线图、环比及同比变化率折线图。以浙江省周均价格为例,图2分别展示了浙江省2012-2018年马铃薯周平均价格、周均价环比变化率及同比变化率的折线图。本数据集中包含了25个省(自治区、直辖市)、6大地理区划的价格波动折线图、环比及同比变化率折线图,其中反映25个省(自治区、直辖市)价格波动的折线图共227张,反映6大地理区划的价格波动折线图共66张,反映全国范围价格波动的折线图共11张。
图2 浙江省2012-2018年周平均价格及其环比、同比变化率折线图Figure 2 The broken line chart of ZheJiang Province"s weekly average price and its sequential and year-on-year change rates from 2012 to 2018
3 数据质量控制和评估
本次研究基于全国农产品商务信息公共服务平台、全国农产品批发市场价格信息系统等平台提供的批发市场马铃薯日均交易价格数据,充分结合项目组实际市场调研数据,扩充与完善基础数据。按照完整性、连续性、一致性等原则,比对平台提供数据及项目组实际市场调研数据,将当日各来源价格数据进行算术平均,取均值;剔除以自然周为最小单位,缺失一周及以上日度价格数据的省(自治区、直辖市);缺失值较少的,通过拟合填补缺失值,以此得到各批发市场的日度马铃薯批发价格基础数据集。采用AVERAGEIFS函数进行数据处理,以25个省(自治区、直辖市)、6大地理区划及全国为空间单位,逐步计算自然周、月度、季度、年度马铃薯市场价格算术平均值,并分别以2012年第1自然周、2012年1月、2012年第一季度及2012年为基期,计算得到批发价格环比、同比变化率,对所得数据集进行人工质量检验,数据处理均按步骤逐步操作完成,最终得到反映25个省(自治区、直辖市)、6大地理区划马铃薯年均价格及其变化的数据及图像。
4 数据价值
大数据、地理信息系统迅猛发展,为蔬菜历史价格的存储整理及预测分析提供了更高层次的平台及工具[9]。本数据集通过调研与平台统计数据相结合的方式,获得原始、真实的2012-2018年马铃薯批发市场交易价格数据信息,数据时间跨度较长,可满足经济分析的基本要求。本数据集的价值体现在:一是为开展马铃薯价格波动研究提供重要的数据支持。数据有利于总结马铃薯价格波动规律的特征,较为精确地分析季节、天气、政策、节假日等因素对马铃薯价格波动的影响[10],并以此预测其价格变化趋势,实现价格波动的监测预警;二是为政府部门的调控与管理提供科学决策依据,全面掌握全国乃至世界范围内马铃薯的价格变动趋势,充分发挥政府和市场的消费引导能力,加大宣传马铃薯主食化产品[11],扩大国内消费市场,维护薯农及消费者权益;三是可以成为马铃薯产业从业者生产经营决策的有效工具,帮助马铃薯产业的龙头企业、农民合作社、家庭农场、种植农户等相关从业者把握产业发展状况,更好把握市场形势和价格走势,科学做出生产经营决策和投资策略选择[12]。