基于复杂网络视角的商贸流通业研究热点分析
2019-09-05黄义兵刘玉林
黄义兵 刘玉林
内容摘要:本文以中国知网654篇商贸流通业文献为实证数据,进行描述性分析讨论商贸流通业研究活跃度,并基于Python分词对文献摘要分词并构建词袋模型,在词袋模型基础上对高频词应用复杂网络技术可视化,然后对高频词网络进行拓扑特性研究,以此探讨商贸流通业文献研究热点的表现。
关键词:商贸流通业 Python 词袋模型 复杂网络算法 热点
改革开放历经40余年,我国商业流通领域的理论研究和实践探索都取得了可喜成绩。此时,采集中国知网收录的文献并进行热点分析,有力于厘清商贸流通业的研究现状,总结发展经验和讨论未来的发展趋势。
数据准备
在对中国知网以“商贸流通业”为篇名检索后,在“中国学术期刊网络出版总库”中共计654篇文章,时期跨度为1995年至2018年共24年时间。
首先,以年维度进行分组后汇总如图1所示,在对商贸流通业研究方面,我国自1995年开始,总体上呈现出逐年增长的态势,2017年收录文献达152篇,说明商贸流通业成为经济管理研究的热门领域之一。
其次,在检索文章基金方面,图2显示30%的文献比例是有基金项目支持的,并且在有基金支持的文献中6%来自国家自然或者社科基金。从图3年分布角度看,2002年以前文献没有任何基金支持,从2002年开始逐年增长,2012年占比近50%,2017年基本占比超过40%。可见国家、企事业单位等对商贸流通业问题研究给予了很大重视和支持。
最后,在作者发表文献数量方面,表1显示654篇文献共有作者63位,平均每位作者發表10.38篇,长期研究作者(3篇及其以上)仅7位(占比3.17%),反应出我国在商贸流通业问题研究持续性方面还有待于进一步提升。
复杂网络可视化分析
在对商贸流通业文献研究内容分析时,最主要的数据来源是摘要。摘要是对论文的高度概括,其中往往表明作者对论文的研究目的、研究内容、研究方法和结论等具体阐述。以往对文献计量研究较多集中在关键词、参考文献等方面,虽然也能体现文献信息的丰富性,但均不及摘要对于研究内容的关键性强。本文以中国知网654篇商贸流通业文献摘要为实证对象,利用Python分词技术,进行词袋模型分析,识别文献与词袋模型的关联关系,并建立复杂网络,从高频词网络图中分别对网络形态和拓扑性质进行分析,探析商贸流通业文献研究热点。
(一)Python词袋模型分析
在Python编程中调用jieba分词进行高频词统计,在利用高频词进行词袋模型制表时,首先设置词频阈值为100,其次人工删除“本文”、“相关”、“基于”等无实际意义高频词,以及“商贸流通业”等检索性质高频词,最终总结出48个高频词用于词袋模型分析,具体见表2所示。
基于筛选高频词建立的词袋模型见表3所示。在表3中对文献根据发表时间进行编号,从1-654号。每个高频词作为列,如果在文献摘要中出现记数字1,不出现记数字0。
(二)基于词袋模型的高频词研究热点网络
利用表3中的词袋模型分别对高频词复杂网络化,通过网络拓扑性质进行高频词拓扑特性研究。
图4高频词网络拓扑图显示出48个高频词具有非常紧密的关联性,在商贸流通业研究网络中呈现紧密合作关系。具体表现在:连通性检查为高频词网络为连通图,说明48个高频词在654篇商贸流通业文献中为高度连通性,即两两节点均能实现连接;网络密度density=0.193,说明实际边连接数与最大连接数之比为19.3%,同时平均路径长度为2.37,两个数值在复杂网络中较好,呈现出较好的网络连接性,说明高频词合作性较强;图5显示高频词网络度分布集中在40-50区间,说明每个高频词均有较强的热点表现;同配系数r= -0.05818,说明高频词网络中变现出较小的异配性,即总体上度大的高频词节点有微弱倾向于连接度小的高频词,即不存在巨型关键词,48个高频词均表现出较好的关键性;利用割集理念对图3进行路劲分割计算,使表4成为不连通网络需要分割的节点数为42,这进一步说明高频词的高度紧密性。
当然,通过对高频词网络进行最小生成树算法,结果如图6所示,图6表明虽然48个高频词均有较好的表现,但“城乡”高频词节点变现出较好的中心性,是网络中连通的最佳节点。
研究热点分析
通过对654篇商贸流通业文献摘要词袋模型和网络化分析,总结研究热点如下:
城乡商贸流通业被高度关注。随着我国城镇化进程加快,城乡商贸流通业协调发展获得研究的高度关注,是热点之一。例如,李秀丽浅析我国城镇化与商贸流通业的互动发展,韩英讨论我国商贸流通业城乡市场分割的表现及统筹发展途径,方维研究城乡商贸统筹背景下我国商贸流通业的转型升级问题,柳春岩基于农村商贸流通业的农产品供应链研究商贸流通业城乡协调发展战略等。
互联网流通成为新热点。互联网购物作为“中国新四大发明”之一,发展迅速,影响力广,并且极大带动了商贸流通业发展,因此互联网流通成为新研究热点之一。例如,方巍巍研究“互联网+”背景下我国商贸流通业与GDP增长的协同发展情况,郭莉娜思考“互联网+”背景下商贸流通业发展战略选择,张文宏研究基于“互联网+”与消费升级环境的商贸流通业发展路径,黄岩比较“互联网+”背景下我国商贸流通业竞争力等。
商贸流通业问题和实证研究一直受青睐。商贸流通业发展和改革中的具体问题和实证研究,一直备受研究界关注,比如,殷少明特别研究新疆商贸流通业发展的现状、问题与对策,谢红对拉萨市商贸流通业发展进行关注和思考,冯丹探索江苏省商贸流通业竞争力提升路径,王雪锋关注四川商贸流通业发展的现状、问题及对策。
商贸流通业技术创新不断被提及。技术、创新是变革商贸流通业的重要力量,受到学者持续性关注和研究。例如,沈飞认为投入服务化技术创新可以影响商贸流通业碳生产率,王晓栋探索互联网技术对商贸流通业协同发展影响,学者俞静认为技术创新提高商贸流通业转型升级的作用一直呈递增趋势。
结论
本文通过对中国知网1995-2018年654篇商贸流通业文献进行采集和数据预处理,基于描述性分析发现商贸流通业研究呈现出持续向好的局势,包括数量的提升、基金的支持等。本文通过以商贸流通业文献摘要为基础,利用Python分词技术构建词袋模型,并设置阈值和人工筛选出48个高频词,基于词袋模型和复杂网络技术讨论48个关键词在654篇商贸流通业文献中的活跃表现,得出“紧密合作,高度影响”的现状,并基于48个高频词定性剖析出四大研究热点,即城乡商贸流通业被高度关注、互联网流通成为新热点、商贸流通业问题和实证研究一直受青睐、商贸流通业技术创新不断被提及。
参考文献:
1.李秀丽.浅析我国城镇化与商贸流通业的互动发展[J].商业经济研究,2015(19)
2.韩英.我国商贸流通业城乡市场分割的表现及统筹发展途径[J].商业经济研究,2016(2)
3.方维.城乡商贸统筹背景下我国商贸流通业的转型升级[J].商业经济研究,2016(13)
4.柳春岩.基于农村商贸流通业的农产品供应链—商贸流通业城乡协调发展战略研究(之一)[J].中国市场,2007(49)
5.方巍巍.“互联网+”背景下我国商贸流通业与GDP增长的协同发展研究[J].价格月刊,2017(3)
6.郭莉娜.“互联网+”背景下商贸流通业发展战略选择与思考[J].商业经济研究,2017(5)
7.张文宏.基于“互联网+”与消费升级环境的商贸流通业发展路径转变[J].商业经济研究, 2017(16)
8.黄岩,武云亮.“互联网+”背景下我国商貿流通业竞争力比较分析[J].商业经济研究,2017(19)
9.殷少明.新疆流通业发展的特征与对策[J].中国商贸,2014(19)
10.谢红,唐雨虹.关于拉萨市商贸流通业发展问题和对策的思考[J].中国商论,2017(27)
11.冯丹.江苏省商贸流通业竞争力提升路径研究[J].物流技术,2015(21)
12.王雪锋.四川商贸流通业发展的现状、问题及对策[J].中国商贸,2013(28)
13.沈飞.投入服务化技术创新背景下商贸流通业碳生产率时空演进及影响因素研究—基于长三角的实证[J].商业经济研究,2017(23)
14.王晓栋.互联网技术与商贸流通业协同发展对技术创新的影响—基于省级面板数据[J].商业经济研究,2018(2)
15.俞静,单涛.技术创新对商贸流通业转型升级的影响[J].商业经济研究,2018(17)