基于解释性的中药材产量与价格预测预警模型指标体系的构建
——以湖南山银花为例
2021-11-04蒋煜坤漆超朱春晓李自强彭立宏杨良贤唐银肖深根
蒋煜坤漆超朱春晓李自强彭立宏杨良贤唐银肖深根
(1.湖南农业大学园艺学院,湖南 长沙 410128;2.湖南数定智能科技有限公司,湖南 长沙 410113;3.怀化市金泉生态农业发展有限公司,湖南 溆浦 419315;4.湖南现代万农科技有限公司,湖南 溆浦 418000)
中药材价格受到产量、需求量、炒作等诸多因素影响出现暴涨暴跌的情况,许多学者借助“蛛网模型”、“向量回归模型”、“ARCH模型”等模型进行研究并取得了一定的效果[1-3]。然而,构建模型时部分指标名称范围未统一,使得后续调用指标数据造成混淆。产量作为市场供给,是价格的决定性因素,研究药材价格时必须考虑产量,但现有产量统计方法没有区分药材生长年限、实际收获面积等情况,导致了产量计算比较笼统。针对以上问题,通过界定中药材产量和价格指标名称、细化不同产量及筛选主要指标、划分层级、编号等方法,建立指标之间可解释因果关系的指标体系,旨在后续构建预测预警模型指导生产奠定基础。
1 指标体系构建原则与方法
1.1 指标体系构建原则
1.1.1 精简性原则
选择影响产量与价格的主要指标,次要指标和深层次的指标归入其它或暂不考虑;指标层级设置不超过5级。
1.1.2 适用性原则
选择适用于模型输入、可获取数据的指标。
1.1.3 可解释原则
指标关系是具有逻辑、可解释的因果关系。
1.1.4 独立性原则
产量与价格系统的指标相互可联系、反馈,且系统之间独立;指标名称与编号在指标体系中独立唯一,可供后续模型直接调用。
1.1.5 层次性原则
指标体系中具有严格的层级关系,指标之间不越层级考虑。
1.2 指标体系构建方法
1.2.1 指标概念界定
依据生产、加工和销售等实际,通过指标范围界定、名称命名、编号等方法,对现有不规范、容易混淆的指标重新命名、确定唯一性编号。
1.2.2 指标编号
参考第四次中药资源普查样本编号格式,采用“指标名称(1位字母加2位数字)加指标数据来源(1位数字)加数据日期(8位,年月日)加序号(001~999)”15位编号形式。指标数据后续调查途径分为实地调查、文献收集、网络收集及其它,用1~4编号。如后续数据较多可拓展至18位。
1.2.3 指标选取与分级
从生产、初加工与销售等实际角度,采用参考相关文献、专家咨询等方法,选取产量与价格系统的主要影响指标并根据指标之间的因果、层次关系细分指标层级。
1.2.4 指标关系与权重确定
对于定性、函数关系不清晰、具有突发性等特点的指标,按照主观与客观赋值相结合的方法确定权重。对于定量、函数关系清晰的指标,确定其函数关系。
1.2.5 预警指标阈值确定
定性指标根据其程度、对应的相关领域等区分阈值等级。定量指标借助历年数据、文献等设置异常阈值,难以预测、关系不清晰的指标依据文献、专家经验等方法确定初始阈值,供后续验证修改。
2 产量与价格指标体系构建研究
2.1 产量指标体系构建研究
2.1.1 产量指标选取与编号研究
根据构建原则及方法,选取了25个指标,以市场供给总量代表药材在市场流通交易中的干品总产量,定义采挖系数评价对野生蕴藏量的采挖程度,划分新播期、初产期、盛产期和衰老期4个时期的产量,选取采收系数评价实际收获面积,具体见表1。
表1 产量体系指标选取与名称编号表
确定产量指标名称的编号规范后,根据后续数据的调查途径、数据日期、序号,形成15位指标编号,如指标A01当年产新量通过实地调查,得到2020年8月1日的1个数据,表示为A01120200801001。
2.1.2 产量指标分级与层级关系研究
以市场供给总量作为一级指标,当年产新量、库存量作为二级指标,关系表达为“市场供给总量=当年产新量+库存量”。栽培采收量和野生采挖量作为当年产新量的三级指标,关系表达为“当年产新量=野生采挖量+栽培采收量”。野生蕴藏量和采挖系数作为四级指标,其乘积得到野生采挖量,单位面积蕴藏量和分布面积作为五级指标计算得到野生蕴藏量。栽培采收量等于四级指标新播面积产量、初产期产量、盛产期产量和衰老期产量之和。四级指标新播面积、初产期、盛产期、衰老期产量由五级指标计算得到,公式:
Yi=Si×Xi×Ki
式中,Yi指各时期的产量;Si指各时期的收获面积;Xi指各时期的单位面积产量;Ki指各时期的采收系数;i范围为1~4,指新播面积、初产期、盛产期、衰老期的收获面积。在山银花中新播面积不计当年产量,单位面积产量与采收系数数值为0。
形成1个一级指标、2个二级指标、2个三级指标、6个四级指标、14个五级指标的产量指标体系,见表2。
表2 产量指标体系层级关系
2.2 价格指标体系构建研究
2.2.1 价格指标选取与编号研究
根据构建原则与方法,选取了27个指标[1-5],将在市场中流通交易的价格定义为药材价格,药材价格的成本与利润区分为药材采购成本与药材销售利润。在产地从种植户等直接收购的鲜品价格区分为产地收购价格。除人工、种苗和土地成本外,生产中农资、技术及其它所有成本统一界定为农资与其它成本,具体见表3。
表3 价格体系指标选取与名称编号表
确定价格指标名称编号后,根据后续数据的调查途径、数据日期、序号,形成15位编号,如指标B21药材价格通过实地调查得到2020年9月1日的1个数据,表示为B21120200901001。
2.2.2 价格指标体系分级与层级关系研究
以药材价格作为一级指标,以药材采购成本与药材销售利润作为二级指标,关系为“药材价格=药材采购成本+药材销售利润”。产地收购价格与折干率是药材采购成本的三级指标,关系表示为“药材采购成本=产地收购价格×(1/折干率)”。供需比、初加工价值和市场因素同属三级指标影响药材销售利润,设置权重为0.6、0.2、0.2。市场因素涵盖游资炒作与CPI,山银花受炒作影响较大权重设置为0.8,CPI设置为0.2。市场供给总量与市场需求量作为四级指标,其比值等于供需比。市场需求量受到药材出口量、产品开发量、突发疫情和替代品价格影响,权重设置为0.1、0.2、0.5、0.2。初加工成本和初加工利润作为四级指标评价初加工价值,关系表达为“初加工价值=初加工成本+初加工利润”。加工人力成本与初加工生产技术成本计算得到初加工成本。生产成本与生产利润作为四级指标构成产地收购价格,层级关系表达为“产地收购价格=生产成本+生产利润”。生产成本是人工成本、种苗成本、土地成本、农资及其它成本4个指标之和。最后,形成1个一级指标、2个二级指标、5个三级指标、8个四级指标、11个五级指标的价格指标体系,见表4。
表4 价格指标体系层级关系表
2.3 风险预警指标阈值研究
根据确定方法,自然灾害参照地质灾害预警,程度由高到低划分红、橙、黄和蓝4个等级。突发疫情参考公共卫生事件响应机制,程度由高到低划分为I、Ⅱ、Ⅲ和Ⅳ 4个阈值等级。游资炒作设置药材价格超过6倍以上的严重炒作、4~6倍的较重炒作、3~4倍的一般炒作和2~3倍的低炒作4个等级。
供需比在0.5~0.9、2~4是轻度预警,在4以上、0.5以下属于重度预警。新播面积与种植面积比值在0.5~2属于轻度预警,达到2以上时属于重度预警。将单位面积的生产成本除以对应的单位面积产量得到单位生产成本,产地收购价格与单位生产成本比值在0.5~0.8、2~4属于轻度预警,在0.4以下、5以上属于重度预警。
3 结论
根据指标体系构建的原则与方法,构建了1个一级指标、2个二级指标、2个三级指标、6个四级指标、14个五级指标的产量指标体系和1个一级指标、2个二级指标、5个三级指标、8个四级指标、11个五级指标的价格指标体系,并构建了3组定性预警指标和3组定量预警指标,为后续构建模型提供理论支撑。指标具体构建分析时以湖南山银花为例,指标后续应用或更换其它药材时可根据实际情况进行调整。