主成分分析法在商品分类指标体系构建中的应用∗
2019-06-01李诗瑶
李诗瑶
(河海大学商学院 南京 210000)
1 引言
在构建商品分类指标体系时,选取的指标并不是越多越好。一些指标属性与商品的目标属性相关程度不大,甚至有一些指标属性中包含较多的噪音,对分类指标体系的精度反而有负面影响。精简商品分类指标的数量,有利于降低分类指标体系的输入空间维数,缩小数据采样的规模,降低计算难度,减小工作时间。在选取商品分类指标时,选取的原则是:所选的指标都必须与商品的管理密切相关,同时尽可能地精简[1~2]。
2 商品分类指标体系
商品的每个指标属性都会影响到商品部门对其的关注程度。不同的指标对商品管理人员进行商品分类决策的贡献不同。综合各个指标属性的总体关注程度越高,则越需要对相关商品进行重点管理[3]。
“单价”反映的是单位商品的采购成本,反映出商品管理的经济性因素。商品单价越高,越需要重点关注。对于高价值的商品,需要调高对其的关注度。
“采购提前期”反映的是商品从发单到入库的时间长度,表征的是商品采购的难易程度[4]。购提前期越长,不确定因素越多,缺货可能性越大。对于采购提前期较长的商品,需要调高对其的关注度。
“消耗周期”反映的是商品的消耗时间。商品的消耗周期越短,说明商品的需求量越高,进货量越大。对于消耗周期较短的商品,需要调高对其的关注程度。
“年消耗量”反映的是商品的消耗量的大小。商品的年消耗量越大,相应的需要调高对其的关注程度[5~6]。
“重要度等级”反映的是商品对经济效益影响的大小和缺件时造成时损失的程度的大小。商品重要性等级越高,说明商品对经济效益的重要性程度越大、商品缺货造成损失的程度也越大。对于重要性等级高的商品,需要调高对其的关注度。
“商品保质期”反映的是商品保持其性能的时间期限,保质期不同,商品管理人员对其的关注程度不同[7]。保质期越短,其保持性能的时间越短,对其的关注程度越高。
“历史消耗量”反映的是商品自采购以来总的消耗量,体现的是该商品性能的总体稳定性。对于历史消耗量越高的商品,需要调高对其的关注程度[8]。
“供应商等级”反映的是商品供应商的综合素质。供应商等级越高,表明其供货的质量、服务水平越高。对于等级低的供应商[9],需要调高对其提供的商品的关注程度。
本文综合考虑商品的特点,制定了一个商品分类指标体系,如表1所示。
表1 商品数据集属性
3 主成分分析法
主成分分析是利用降维的思想,将多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线形组合,主成分保留了原始变量绝大多数信息,且各个主成分之间互不相关[10~12]。其本质是通过找出原始变量的相关性,寻求对相关变量的综合替代,并且将转化过程中信息的损失控制在较小的范围内。反映原始观测指标变动程度最大的综合指标称为第一主成分;反映原始观测指标变动程度次大的为第二主成分;依此类推,以反映原始观测指标变动程度的大小顺序排列[13~15]。
先对p个变量的n个观测点求第一条最佳似合直线,使得这n个观测点到该直线的垂直距离的平方和最小,称这条直线为第一主成分;然后再求与第一主成分不相关的,并与n个观测点的垂直距离平方和最小的第二主成分;接着再求第三主成分,第三主成分必须与前两个主成分都不相关,且使它与n个观测点的垂直距离平方和最小;如此继续,直至求出前k个主成分[16]。
设P维观测样本矩阵(xij)np,其相关矩阵R=(rij)pp,其中:
R的特征值为λ1≥λ2≥…≥λp≥0对标准正交化特征向量为由R求得的第i个主成分,其中:
为x经标准化变换得到的标准化向量[17]。为第i个主成分的称为主成分z1,z2,…,zk的贡献率[14]。
在实际问题中,选取多少个主成分比较合适,往往要通过累计贡献率来决定。累计贡献率反映了前k个主成分所代表的原始指标信息的百分比,一般要求累计贡献率不少于85%。
4 实例分析
本文以某单位商品管理部门的商品为研究对象,随机抽取了30种商品,根据商品的使用情况分别提取各商品的分类指标值,如表2所示。
应用Matlab2008a软件进行主成分分析运算。
表2 商品的分类指标值
图1 方差贡献
各个主成分的方差越大,则说明其贡献率越大,则对应的主成分反映原始分类指标的能力越强,反之则越弱。图1各个主成分的样本方差反映了原始分类指标的能力强弱。
图2 各个主成分贡献率及累计贡献率
表3 各个主成分贡献率及累积贡献率
由图2及表3可知,前5个主成分的累计贡献率达到86.48%,已经超过85%,而且从第6个主成分开始,贡献率均小于6%。表明原来由8个指标反映的商品分类指标体系可由5个主成分反映全部信息的86.48%,从而可使研究问题大大简化。因此商品分类指标简化为单价、订货期提前期、消耗周期、年消耗量、重要度等级。这样支持向量机的输入空间维度由8维降为5维,缩小了商品管理数据的规模,降低了数据采集难度,减小了工作时间。
5 结语
对商品进行合理的分类是商品管理工作中重要的一环,建立科学有效的商品分类指标体系是对商品进行分类的基础和必要依据,本文根据日常工作经验选取了单价、订货期提前期、消耗周期、年消耗量、重要度等级、商品保质期、历史消耗量、供应商等级8个指标构建商品分类指标体系。通过主成成分分析法对8个指标进行分析筛选最终简化为单价、订货期提前期、消耗周期、年消耗量、重要度等级5个指标构建商品分类指标体系,有效地缩小了商品管理数据的规模,降低了数据采集难度,减小了工作时间。