APP下载

灰色关联度分析法的应用热点和方法改进

2022-02-22任秋静刘露石燕黄宗海钟艳梅温川飙罗悦

电脑知识与技术 2022年36期
关键词:计量分析研究方法应用

任秋静 刘露 石燕 黄宗海 钟艳梅 温川飙 罗悦

关键词:灰色关联度分析法;VOSviewer 计量分析;应用;研究方法

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2022)36-0001-04

灰色关联分析法是基于行为因子序列的微观或宏观几何接近,以分析和确定因子间的影响程度或因子对主行为的贡献测度而进行的一种分析方法。该方法基于灰色系统,可在不完全的信息中对所要分析研究的各因素在随机的因素序列间找关联性[1]。灰色系统是我国学者邓聚龙教授1981 年在上海召开的中-美控制系统学术会议上提出的。邓聚龙教授将灰色系统定义为只掌握或只能获得部分控制信息的系统,相应的部分数学特征性确知、部分元素确知的矩阵为灰色矩阵;部分数学特征已知但具体数值未知的参数为灰色参数[2-3]。与灰色相对的还有白色与黑色,白色表示信息完全已知与掌握,黑色则表示信息完全未知,对于白色与黑色在此不再赘述。灰色关联度分析在灰色系统理论提出后产生并应用于各个领域,从1982年開始应用至今积累了大量的应用实例,同时灰色关联分析法也在应用过程中逐步改进和发展。对于过去灰色关联度分析法在过去三十多年的应用和成果,本文将利用可视化分析软件VOSviewer从实例应用和分析方法发展改进两方面进行可视化阐述。

1 灰色关联度

分析分析流程与方法灰色关联分析通过确定参考数据列和若干比较数据列的集合形状相似程度判断其联系的紧密程度,并以此确定关联度。灰色关联分析法的分析流程[4]分为六步(如图1)。

1.1 收集数据

灰色关联分析法第一步要根据分析目的确定相关因素并进行数据收集。该方法对数据分布没有特定要求,可以任意分布。需要注意的是在进行灰色关联度计算中需注意值不能为负,以免出现运算中的抵消。当出现负值数据时,将所有数据项与最小负值绝对值相加,后续运算采用相加后的数据。

1.2 确定数据列

确定参考数据列与比较数据列。参考数据列是根据分析目的确定的一个理想比较标准,各影响因素作为比较数据列。以比较数列作为算法子序列与参考数据列即算法母序列进行比较。

1.3 对数据进行无量纲化处理

各比较数列由于其值不同,甚至单位的不同,如体重和身高,导致数据差异过大,因此在进行计算之前要对数据进行无量纲化处理。在灰色关联度分析法中进行无量纲化处理采取均值化法或者初值化法。均值化是将包括参考数据列在内的每项数据列各自相加然后求其平均值,然后再以数据列内各数据除以平均值,得到均值化结果。初值化是将包括参考数据列在内的每项数据列的第一行数据作为1,使用数据列中其他数值除以第一行数据得到初值化结果。均值化和初值化处理的目的都是为了将原本数据之间的差异减小,使数据化为相近的无纲量数据,后续计算都采用无纲量化后的数据进行计算,以处理后的数据进行计算可以有效避免计算结果出现偏颇,同时缩小计算误差。

1.4 计算关联系数

以公式对比较数据列与参考数据列的关联系数进行计算:

1.6 关联度排序并得出结论

对关联度结果进行大小排序,其值越大则关联度越高。

2 研究方法与数据来源

2.1 知识图谱与VOSviewer 分析软件

目前广为人知的知识图谱其全称为科学知识图谱,是显示知识的发展进程与结构关系的一种图形,用可视化技术描述已有知识资源及其载体,绘制、挖掘、分析和显示科学技术知识以及相互之间的联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入,其以科学知识为计量研究对象[5]。VOSviewer是由荷兰莱顿大学科研究中心的Nees Janvan Eck 和Ludo Waltman于2009年开发并免费开放使用的知识图谱分析软件。Vosviewer的开发弥补了当时知图谱分析软件仅能满足低于100条数据的项目分析,对大量数据分析无力的缺陷。相较此前的计量分析软件,VOSviewer通过增加和改进缩放功能、特殊标注等手段使其具有更完备的功能[6]。VOSviewer运用概率论的思想,采用关联强度算法,对共现数据进行归一化处理具有优势,因此适合对大规模网络进行可视化分析[7]。本文采集的数据有两千多条,因而选取VOSviewer软件作为分析工具。

2.2 数据来源与数据格式转换

将中国知网作为来源数据库,以“灰色关联度分析法”为检索词进行检索,检索条件:(主题%='灰色关联度分析法' or 题名%='灰色关联度分析法' or title=xls('灰色关联度分析法') or v_subject=xls('灰色关联度分析法') );检索范围:CNKI总库。共计算结果3669 条,排除会议、学位论文和不相关文献后共计2753篇期刊文献,人工排除无作者文献和重复文献。结果符合纳入文献为1987年01月-2021年10月合计2726篇,其中中文文献2535篇,英文文献191篇。检索日期2021年10月19日。

将检索到的结果以Endnote样式导出为txt格式,再在Endnotex9中导入题录。经人工筛选排除重复和无作者文献后导出题录,设置导出样式为VOSviewer 支持的RefMan(RIS)保存为txt格式记事本,后修改文件后缀名为“.ris”。本文使用的工具软件为VOSview⁃er_1.6.13。

3 数据分析

3.1 发文趋势

灰色关联度分析法的应用论文最早见于邓聚龙于1985年发表的《灰色系统与农业》[8]文中列举了灰色关联分析在汾河输沙量和果树产量实例中的应用。其后歭英与石书琰[9]于1987年利用灰色关联度分析法对棉花品系进行评价,并且将灰色关联度分析法与模糊评价方法进行比较。二者评价结果完全一致,但是灰色关联度分析方法具有计算更加简便的优点。之后灰色关联度分析法逐渐应用在更多的领域,并且在应用中逐渐改进。发文量趋势图(图2)可以看出灰色关联度分析法相关文献在1987年至2015年一直呈上升趋势,其中2004-2015年上升趋势相对较快;在2015年发文量达到顶峰,年发表论文258篇;2015年之后发文量出现下降趋势。

3.2 灰色關联度分析法应用可视化

3.2.1 高频次关键词可视化

将2726条文献题录导入VOSviewer软件进行分析,以关键词出现频率≥10筛选聚类得到高频关键词标签图(图3)。从图3可以看出灰色关联分析法主要应用在农艺、经济,主要研究内容是影响因素测定和评价指标测定。

程叶青等[10]将灰色关联分析法应用于东北地区单位面积粮食产量的性状特征的动态变化研究,并且通过分析成功得出影响单位面积粮食产量变化的重要因素是农业机械总功率、化肥消耗和有效灌溉面积,而提高单位面积粮食产量的有效途径是建设农田改良基础,开垦中低产田等。潘雄锋[11]则是将灰色关联度分析应用于城市建设和经济协同发展系统。利用协同学、灰色理论、数值分析的相关理论建立城市建设与经济协同发展系统的数学模型,并以此对大连市的城市建设和经济协同发展关系进行分析,得出提高GDP对城市建设与经济协同发展系统向高级有序状态发展极为重要的结论,为城市建设决策提供了参考。

导入题录屏蔽针对灰色关联度分析法本身的研究得到和高频关键词密度聚类图(图4)。根据图4可以看出,灰色关联度分析法的应用主要分为三个热度板块:一是以农艺性状和农产品集中分布的农业板块;二是与农业密切关联的综合评价应用;三是以经济增长为核心设计到影响因素和产业调整的经济增长模块。

马素英[12]利用灰色关联度分析法对海洋经济效益进行了测评。通过对海洋经济第一、第二、第三产业占比以及海洋经济与国民经济关系的分析,获得了海洋经济产业结构的构成和变化趋势;同时计算海洋经济GDP在国民GDP中的比重,获悉海洋经济与整体经济之间有的相关性。

由上述高频关键词的标签聚类和密度聚类可以得到灰色关联分析法应用的最主要范围是农艺性状和农业产品的评价,其次则是经济增长方面的应用;同时对于农业和经济的产业结构也通过灰色关联分析法进行分析调整。对于灰色关联度分析法的应用内容在于综合评价分析,利用灰色关联分析法的部分已知属性对整体进行评价探索。

3.2.2 低频次关键词可视化

将2726条文献题录导入VOSviewer软件,以关键词出现频次≥2聚类分析得到低频关键词标签图(图5)。图中由冷色到暖色调的过渡过程表示时间从远至今的显示,图中字标大小表示关键词出现频次,字标越大则出现频次越高。由图5可以看出出现频次最高的仍旧是农艺性状和综合评价,综合分析其原因是在2010年前累计研究发文多集中在农业和综合评价方面。随着研究方法越来越成熟,越来越多的行业出现了灰色关联度分析法的应用。2010年至2015年出现了医药、房地产市场、消费结构等方面的应用;2015年至2021年期间灰色关联度分析法的应用扩展到制造业、物流业、网络等行业。

蔡萍等[13]对杜仲药材有效成分与环境因子的关系进行了灰色关联度分析。通过对影响杜仲皮和叶中有效成分含量产地差异性的主要环境因子的分析,得出碱解氮、速效钾、有机质、年平均相对湿度、年平均最高气温为排名靠前的影响因素,据此为合理施肥及环境调控来提高杜仲次生代谢产物的含量提供参考,也为杜仲的适宜种植区选择提供了依据。梁雯等[14]通过灰色关联度分析,找到影响物流业全要素生产率的主导因素和潜在因素,并成功得出技术效率的提高是增加物流业全要素生产率的主要动力,而技术进步则并未真正起到促进作用的结论。该团队还据此提出了提高物流业全要素生产率的两个途径。

根据上述低频次关键词聚类可以清晰地了解到灰色关联度分析法的应用脉络,其在农业方面的应用是时间最早、范围最广且时间跨度最大的。除此以外其应用从早期的农业行业扩展到医药、物流、制造、技术等各个行业,目前灰色关联分析法的应用已经涵盖三大产业。

3.3 灰色关联分析法研究方法可视化

灰色关联度分析法在实例应用中发挥了很重要的作用,同时也在此过程中暴露了其关联度计算中客观性不足、评价精度低等弊端。后来的学者针对灰色关联度分析法的弊端在应用过程中引入了相应的改进和弥补方法。

将文献题录导入VOSviewer软件,筛选以联合研究技术≥5的关键词聚类分析得到技术关键词标签图(图6)。根据图6可以看出其联合技术方法以层次分析法即Analytical Hierarchy Process(AHP)为主要分析方法,并且以层次分析法为核心向熵值法、topsis(距离分析法)和聚类分析等方法扩展和延伸。

灰色关联度分析法关联度计算公式对各样本采用平权处理[15],在计算中显现出客观性较差,不符合某些更为重要的样本的实际情况[16]。对此,钟登华[17]于1994年使用层次分析法与灰色关联度分析法相结合的方法对水利工程决策方案进行研究,利用层次分析法确定权重,针对难以数量化的定性和定量指标采用灰色关联度进行分析使得开发方案的决策方法更加直观明了和便捷实用。王敬敏等[18]在2005年将层次分析法和距离分析法分别引入灰色关联度分析法,并且在评价河北省农村电力消费影响因素实例印证中对两种改进方法做出了比较研究。结果显示层次分析法需要先人为地进行层次划分,并且对每一层的相对重要性给予定量表示,这一过程具有主观性,在易于请到专家的条件下用层次分析法改进应用较好;与此相对的距离分析法的权重计算具有客观性强的优点,因此在数据齐全且应用者熟悉数学计算的情况下采用距离分析法更易于操作和客观。

针对灰色关联度分析法评价精度低的弊端,李国良等[19]于2006年将熵值理论[20]引入灰色关联分析法,利用数据本身的信息无序化效用值进行权重系数的计算,从而消除权重计算中的人为干扰,并利用该方法对雨水资源开发利用潜力进行综合评价。结果显示基于熵权的灰色关联分析模型较单纯灰色关联分析法的评价结果更加合理准确。邵军义[21]、邹立岩[22]则是将TOPSIS 法与灰色关联度法结合建立GRATOPSIS模型,并引入OWA[23]算子加权,该方法能有效弥补灰色关联度分析法评价精度低和TOPSIS法不能很好反应数据的态势变化和无加权处理的弊端。其团队在承包商选择的实例应用中也成功证实引入OWA算子赋权的GRA-TOPSIS模型能充分发挥模型各自的优点,避免单一模型使用的局限性。

邱学军[24]于1995年将聚类评估引入灰色关联分析,提出灰色聚类关联分析法(GCRAM),并且在复杂医学病类诊断上进行了实例验证,并表明其可以使用于医学、经济、科技等多个领域。未必贵等[25]于2010年将指数表达式引入灰色聚类关联分析法,将灰色聚类关联分析法的白化函数进行改进,使之能够更加充分合理地利用已知信息,够做出更加准确的评价。其团队将改进后的方法应用于阜新市大气环境质量评价,其结果显示改进后的灰色聚类关联分析法拓宽白化函数范围,信息利用率更高,评价结果也更加客观准确。

4 结果与讨论

本研究对灰色关联度分析法自提出以来的应用和方法改进做出了可视化分析,分析结果显示其主要范围是农艺性状和农业产品的评价,其次则是经济增长方面的应用;同时对于农业和经济的产业结构也通过灰色关联分析法进行分析调整。随着研究方法越来越成熟,越来越多的行业出现了灰色关联度分析法的应用。其应用也从早期的农业行业扩展到物流、制造、技术等各行业。

灰色关联度分析法在应用过程中暴露出关联度计算中客观性不足、评价精度低等弊端。因此产生了以层次分析法即Analytical Hierarchy Process(AHP)为主要分析方法向熵值法、topsis(距离分析法)和聚类分析等方法扩展和延伸的复合研究方法。除此以外在近几年人工智能的浪潮下,正则化径向基神经网络[26]、正交设计[27-28]、直觉模糊灰色关联分析(IFGRA)[29]、灰色-响应曲面法(GRA-RSM)[30]等更多的方法也开始应用于灰色关联分析法的研究应用中。

灰色关联度分析法实用性高,在过去三十年的应用中已经积累了大量实例经验,这些经验也充分证实了灰色关联度分析法对于小样本、部分可知的系统分析的适宜性,该方法宜推及如中医中药等正值与现代科技相碰撞和融合时期的传统领域。

猜你喜欢

计量分析研究方法应用
能源诅咒视角下成都经济区绿色发展研究
关于“学案导学,分层互动”教学模式中学情的研究
谈谈翻译史的研究方法
社会主体研究方法在中国特色社会主义体系中的运用