因子分析在中国城市物流技术指数模型上的应用
2018-10-17陈建军
夏 艳,张 旭,陈建军,徐 露
(上海工程技术大学 航空运输学院,上海 201600)
0 引言
我国物流信息化建设成为了物流行业发展的必然趋势,但在建设物流信息化、自动化、智能化的同时,也存在价格战、重复建设等难题。
随着大数据时代的到来,越来越多的人开始关注大数据,海量数据的挖掘和利用,为生产率带来了新一轮的增长。而现代物流更是依托于大数据和物联网发展,积累的大量信息。因此,有效地组织和使用大数据成为了现代物流发展的突破口。
在未来,物流公司可以依托大数据和物联网,积极建设智能物流体系和绿色快递服务,使用户体验好感度提高,结合大数据来增强物流竞争力,提升物流效率,从而节约物流成本,让用户体验到“精、快、好、省”的现代物流服务。
1 中国城市物流技术指数模型建立
近年来的发展经验表明,物流对城市经济发展具有巨大的拉动作用,尤其是对于地处交通枢纽的城市,物流的迅速发展将大大提高其在该地区的经济中心地位。在此背景下,如何找到一个合理的测评体系,来对中国不同城市的物流竞争力的方方面面进行科学分析?这将会指导中国物流业未来的发展。否则各地政府及业界盲目投资物流项目,并不能有效协同全国性的物流网络并发挥各城市的资源优势。
然而纵观现有的较权威的物流评价体系,要么视角过于宏观,没有深入到城市或偏重于物流中的个别环节。此外,在构建评价体系时只使用了从问卷调研中获得的主观数据,没有通过大数据分析工具去采集分析实践中的大量客观数据,评价体系相对片面。
开发与研究中国城市物流技术指数模型的度量指标需要建立一个全面而客观的中国不同城市的物流技术指标体系,通过标杆及借鉴,促进不同城市和区域间的产生竞争,为提升城市物流竞争力提供基于数据的科学指导,促进物流业与政府合作,提高物流运作效率;为政府制定物流产业规划与促进城市和区域合作提供科学依据。
1.1 研究和建立中国城市物流技术指数模型
模型中并不局限于物流领域中的个别主题,而是应该涵盖物流价值链中的关键环节及资源,从中识别影响物流技术发展的核心要素,分别为:环境、技术就绪、技术应用。
进一步地,需要研究各类“定性指标”和“定量指标”对物流技术的单独/协同影响机理,从而建立较为全面的城市物流技术指数模型。
结合城市的真实情况,从功能性、可获得性、可比性、非重叠性等原则出发,选择政治和监管环境指数、商业和创新环境指数、基础设施及使用成本指数、人才素质指数、企业应用指数、政府应用指数、个人应用指数7个指标作为二级指标,如图1所示。
图1 城市物流技术二级指数体系
1.2 我国城市现代物流技术指数评估模型数据收集
本文以广州、深圳、上海、南京、杭州、苏州、北京、青岛、宁波、武汉、天津、大连、重庆、成都、郑州、厦门、南宁、长沙、西安、贵阳、沈阳、昆明、乌鲁木齐这23个城市作为研究对象,城市现代物流技术指数评估体系中有3个一级指标,分为环境、技术就绪、技术应用指标;7个二级指标,分为政治和监管环境指数、商业和创新环境指数、基础设施及使用成本指数、人才素质指数、企业应用指数、政府应用指数、个人应用指数,指标类型为定量指标和定性指标。
(1) 定量指标
定量指标的数据需要遵守准确、权威、易查询原则,主要来源于《中国统计年鉴》、《中国城市统计年鉴》、国家知识产权局网站、《中国互联网感知数据报告》、《六普公报》、中国软件评测中心、《中国政府网站绩效评估指标体系》、网络搜索等。
(2) 定性指标
城市现代物流技术指数评估体系中定性指标的数据(如:企业应用指数中的企业信息共享水平、企业创新能力、企业物流技术应用等)通过设计问卷对物流企业和物流企业客户进行现有物流技术情况调查,包括企业技术应用、政治和政策监管、商业创新环境。将政治和政策监管、商业创新环境方面指标相应题目答案划分为7个等级,分别为(完全不同意、基本不同意、不太同意、不确定、部分同意、基本同意、完全同意),对应得分为(1,2,3,4,5,6,7)。定性指标根据问卷答案得出相应的指标得分。
(3)问卷数据效度分析
经过量化以后的数据再通过SPSS软件进行问卷数据效度分析,本文问卷数据的检测结果如表1所示,指标个数为36个。经过计算KMO统计量的值为0.713;Bartlett球形检验的显著性P=Sig=0(<0.05),表明选取的问卷数据样本适合做主成分分析。
表1 KMO和巴特莱特球性检验
(4)一些可量化的公开数据收集
定量指标的数据需要遵守准确、权威、易查询原则,主要来源于《中国统计年鉴》、《中国城市统计年鉴》、国家知识产权局网站、《中国互联网感知数据报告》、《六普公报》、中国软件评测中心、《中国政府网站绩效评估指标体系》、网络搜索等。
2 因子分析法
因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。
因子分析主要优点在于:①通过对原始变量间相关关系探测,将原始变量进行重新组合,即将相关性高的变量分为一组,用共性因子代替该组变量;②寻找共性因子,简化数据,减少分析变量个数。
结合城市现代物流技术指数体系的特征,为保证准确度,降低随机性,避免主观因素,拟选取因子分析法作为主要的研究方法对城市现代物流技术进行研究分析。
因子分析法一般分析步骤:
(1) 检验数据信度
因子分析法研究分析的要素之间需要有较紧密的关联度,因此在分析之前,需要用SPSS软件对数据进行信度检验分析,检测数据的可靠性。信度是指采用同一种方法对同一种对象测量时所得到结果的一致性程度。本文采用的是α信度系数法。
α信度系数法信度计算公式为:
其中,K为量表中题项的总数,S2i为第i题得分的题内方差,S2T为全部题项总得分的方差;
α检测的是数据内在的一致性;
当α信度系数小于0.7时,说明要素的数据不可靠,不适合做分析;
当α信度系数大于0.7时,说明要素的数据可靠,适合做分析,信度系数越大数据则越可靠,最好在0.8以上。
将问卷量化数据与公开数据整理整合,再通过SPSS软件用α信度系数法进行数据信度分析,本文数据的检测结果如表2所示:
表2 可靠性统计
本文Cronbach's alpha系数为0.958大于0.8,因此,本文数据内在一致性程度高,可以使用。
(2) 原数据标准化
通过对定性数据与定量数据的整理分析,再经过数据标准化公式。
SPSS标准化数值是变量值与其平均值的差与标准差的比值。
设标准化数值为z,标准化公式为:
本文选择使用最值法,最值法也称离差标准化,是对原始数据的线性变换,使结果落到[0.1]区间,转换函数如下:
其中:max{xj}为样本数据的最大值,min{xj}为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。
(3)因子相关性的检验
相关系数矩阵中的大部分相关系数大于0.3,适合作因子分析。
另一方面可以从变量共同度的角度分析因子的相关性。共同度是指某一个在所有因子上的因子载荷平方和,它代表了所有因子合起来对该条目的变异解释量,因子是用来代替繁多的条目的简化测量指标,那么共同度高即代表某个条目与其他条目相关性高。
例如:政治和监管环境下的x1:政府对物流业的支持的共同度为0.863。根据Kaiser准则,变量的共同度最好在0.70以上,本文变量共同度都满足要求(如表3所示),变量转为公共因子时,保留大量信息,数据分析效果明显。
表3 变量共同度(部分)
(4)抽取共同因子,确定因子的数目以及因子求解的方法
碎石检验准则是根据因子被提取的顺序绘出特征值随因子个数变化的散点图,根据图的形状来判断因子的个数。散点曲线的特点是由高到低,先陡后平,最后几乎成一条直线。曲线开始变平的前一个点被认为是提取的最大因子数。后面的散点类似于山脚下的碎石,可舍弃而不会丢失很多信息。
如图2所示,有7个成分的特征值超过了1,只考虑这7个成分即可。
(5)使因子更具有命名可解释性
通常最初因素抽取后,对因素无法作有效的解释。这时往往需要进行因子旋转(rotation),通过坐标变换使因子解的意义更容易解释。
图2 碎石图
转轴后,要决定因素数目,选取较少因素层面,获得较大的解释量。在因素命名与结果解释上,必要时可将因素计算后的分数存储,作为其它程序分析的输入变量。
表4 旋转后的因子载荷矩阵(部分)
城市物流技术指数体系中一共有36个三级指标来补充二级指标,把36个三级指标分为7个二级指标后取平均,由主成分表和因子评分系数矩阵可知,F1因子主要描述的是政治和监管环境,所以命名为政治和监管环境因子;以此类推,F2可以称为商业和创新环境因子;F3称为人才素质因子;F4命名为企业应用因子;F5命名为个人应用因子;F6命名为政府应用因子;F7命名为基础设施和使用成本应用因子。因此,7个因子分别为F1:政治和监管环境因子;F2:商业和创新环境因子;F3:人才素质因子;F4:企业应用因子;F5:个人应用因子;F6:基础设施和使用因子;F7:个人应用因子。
(6)计算各样本的因子得分
因子分析的最终目标是减少变量个数,以便在进一步的分析中用较少的因子代替原有变量参与数据建模。本步骤正是通过各种方法计算各样本在各因子上的得分,为进一步的分析奠定基础。
通过SPSS软件和公共因子得分函数,可以得出评价城市现代物流技术7个因子的得分,并将方差贡献率作为因子权重,计算因子的综合得分和23座城市现代物流技术的排名情况。所以由上述的方差贡献率可得综合的因子得分,计算出广州、深圳、上海、南京、杭州、苏州、北京这些城市的因子得分较高。
3 大数据创新
创建指数评价体系并不提倡局限于传统方法,即单纯通过问卷调研、档案数据或二者的结合来开发指数评价体系。在大数据时代,我们期望在传统数据分析的基础上有所突破,能够针对一些特定的实时数据,使用相应的技术和工具和进行大数据分析,开发出一些具备更好的时效性与实践价值的指标。
4 机遇与挑战
运用从问卷调研中获得的主观数据以及通过大数据分析工具去采集分析实践中的大量客观数据构建以上评价体系,可以使得政府、企业和学术界获得差异化的收益。在政府端,对于中央及各地方政府,可以在区域物流规划、线路网络优化、物流服务体系建设、招商引资、政策支持等方面为其提供建议。在企业端,对于各类组织化物流企业(物流/快递/冷链)、非组织化物流企业(零担/货代)、交通运输企业(铁/公/空/港)、园区企业、第三方服务企业等,可以在优化现有业务、拓展新区位、寻找新业务增长点等方面为其提供建议。在学术界端,期望开发的指数体系能够成为权威的二手数据源之一,推动相关领域的学术研究,履行社会责任。
一是虽然通过大数据分析工具去采集分析实践中的大量客观数据可以使得评价体系更加客观全面。但如何有效地组织和使用大数据变成了新的挑战。怎样获取有质量,权威性的数据成为了首要难题。二是大数据的来源十分广泛,一般单位主要用的是自身场景下积累的数据,算法不尽相同,这会导致评估结果在不同单位存在差异。三是个人隐私保护及信息安全问题。大数据的来源依赖个人的互联网交易记录以及社交网络数据,这样会使得隐私泄露风险放大。四是企业与企业、内部部门之间信息孤岛现象普遍存在,数据不能及时交互、共享和集成,这样数据融合应用价值就很难被有效的挖掘利用。
5 未来的研究方向
不同类型的货物运到不同城市的物流成本/服务质量的差异?导致成本/质量变动的因素有哪些?分别会导致怎样的变动方向?这些因素中的哪些核心因素会显著地帮助一座城市成为业务想来的地方?基于多期指数,可以挖掘哪些隐含的变化趋势?