基于知识图谱分析的库存管理研究
2018-03-29叶勇
叶 勇
(安徽农业大学信息与计算机学院,合肥,230000)
库存管理一直是企业管理人员和研究者关注的热点领域。该领域最早的研究可以追溯到Harris提出的经济订单数量(EOQ)模型[1],这是第一个帮助管理者确定库存补货订单的规模和时间的决策模型。之后EOQ模型的扩展形成了三个重要分支——经济生产数量(EPQ)模型,再订货点的概念及随机EOQ模型[2-3]。总体上库存管理大致分为确定性或随机性策略,确定性模型假设需求和交货时间是完全确定的库存系统,其管理策略主要为提前对需求建模,数学结构较为简单。随机库存模型最早由Arrow等和Dworetzky等提出,研究库存管理中的不确定性和变异性,例如考虑服务水平或订单满足率等因素,此类模型的数学结构更复杂[4-7]。知识图谱是科学计量学中用于分析和发现知识领域的结构或功能并以全面透明的格式将其可视化的工具。为了捕获库存管理研究中的热点,本文以Webofscience数据库为数据来源,使用最新版本的Citespace和VOSviewer软件来绘制知识图谱,以期对库存管理研究提供有价值的参考信息。
1 数据来源和研究方法
2017年3月15日,笔者使用主题词“Inventory-management”从WebofScience共检索到了13770篇相关文献。与RomoFernandez等人所做的研究(即选择一个期刊,从该期刊中提取关键词进行分析)[8]相反,本文从该领域期刊上刊载的全部可引用文献中提取关键词进行分析。首先,我们以库存为主题在运营管理学和管理学两个类别中检索发表时间在1986—2017年之间的所有文献,共8040篇。去除自引后,所有文献的被引频次总计83741次。去除自引后,所有文献的施引频次共33784次。所有这些文献都导入到文本文件中,进行关键词规范化后用于知识图谱构建。
首先,关键词规范化这一过程主要采用Levenshtein编辑距离和最佳字符串匹配算法Damerau-Levenshtein距离来识别相似词。其中,Levenshtein距离(Levenshtein,1966)是将一个字符串转换为另一个字符串所需的最少编辑操作数[9]。Damerau-Levenshtein距离的改进在于最佳字符串的匹配,除了插入、删除和替换之外,它还包括2个字符的转置[10]。具体来说,关键词规范化一共三步:①消除没有任何意义的标点符号,例如计数标记;②统一单数和复数;③基于Levenshtein和Damerau-Levenshtein距离进行类似关键词的组对。经过规范化以后的关键词数量会减少,便于生成一个共词网络,形成聚类。Neff和Corley的研究指出,共词分析网络可以用来表征和分析不同出版物中的研究领域[11]。为了产生这个网络,我们设置4000篇为关键词出现频率的最低阈值,共有979个关键词符合这个要求。
其次,Waltman等人提出了一种在VOSviewer中实现基于加权和不同参数模块化聚类的可视化方法[12],通过改变参数,产生不同粒度的分类。因此本研究使用最新版本的VOSviewer软件,通过改变吸引力和排斥参数,提取WoS格式文件中的题名和摘要中的主题词并进行主题词聚类分析,反映近5年库存管理研究的热点。
2 库存管理研究的可视化图谱分析
2.1 库存管理研究的聚类分布和主题词分析
运行VOSviewer软件可以生成图1的共词网络。其中,标签的字体大小和圆的大小取决于每个关键词相关联的文档数量,共词簇由颜色进行区分,共得到5个聚类。
#1聚类(红色)共包括253篇文献,其中包含的关键词主要有:库存技术、牛鞭效应、RFID、信息共享、仿真模型、预测技术、供应链绩效、分析模型、案例研究等。
#2聚类(绿色)共包括212篇文献,其中包含的关键词主要有:库存分布、运输、调度、遗传算法、路线规划、鲁棒优化等。
#3聚类(蓝色)共包括199篇文献,其中包含的关键词主要有:优化策略、基本存储策略、库存控制、成本函数、补货周期、订货不足费用、系统参数等。
#4聚类(黄色)共包括185篇文献,其中包含的关键词主要有:定价、订货量优化、销售价格、需求函数、报童模型、博弈、协调、存储成本、渠道、竞争等。
#5聚类(紫色)共包括130篇文献,其中包含的关键词主要有:经济订货模型、需求率、生产率、灵敏度分析、变质、存货周期、优化方案等。总体上该区域占据较少的外围,从左下方区域开始穿过中心区域,与其他聚类特别是聚类3交叉产生。
图1 共词网络可视化的聚类分布
图2是共词密度的可视化,其中有7个区域以红色突出显示。在密度图中颜色越深代表该领域的研究热度越高。换句话说,它们代表研究前沿。图中7个红色区域并非与图1中的5个聚类一一对应,这也意味着并非所有聚类具有突出的区域,因为它们缺乏内部粘性。结合图1的聚类分布,图2中特别突出的4个区域分别是:左下蓝色区域#3聚类,其主要对应于库存术语:优化策略;第二个在左上黄色区域#4聚类中,其主要对应于库存术语:定价;第三个在右上红色区域#1聚类中,其主要对应于库存术语:库存技术;第四个在右下绿色区域#2聚类中,其主要对应于库存术语:库存规划。
图2 共词密度的可视化
2.2 共词聚类结构及时间演化分析
共词密度可视化的结果可以看出,聚类的专题集群是库存优化策略、库存定价和库存技术三大研究领域,在此基础上研究其聚类结构和时间演化,以此捕捉库存管理领域的研究趋势。
首先进行文献筛选。本研究以论文和综述为主,排除了书评和信件往来等文献类型,以消除数据库中的“噪音”,共保留2010—2017年发表4000篇文章。选择该期间数据主要有两个主要原因:首先从2010年开始,库存领域的期刊的数量急剧增加;第二,主要关注库存管理学科知识进化的最近发展。
其次,扩展数据库。Chen等建议被引文献也应包括在数据库中,因为被引文献提供了关于各种概念和理论之间的知识联系[13]。为了完全捕捉聚类结构和库存管理研究的演变过程,我们使用嵌入在WOS中的“创建引文报告”功能来扩展被引文献。在纳入被引文献后,库存优化策略、库存定价和库存技术三大研究领域数据库分别达2086条、1652和656条。本文主要选取不同的聚类结点对这三大集群做共词网络和时间演化分析,在不特殊说明的情况下每个timeslice中提取50个被引次数最高的文献,即TopN=50,TopN%取10,另外将每个timeslice中的被引文献按被引次数排序后,保留最高的10%作为聚类结点。
2.2.1库存优化策略聚类结构和及时间演化
以研究机构作为聚类结点,库存优化策略聚类结构由49个被引集群构成,图3是库存优化策略的共词可视化网络,从图3中的剪影值排序结果来看,可以得到最大的5个集群,分别为:
图3 库存优化策略的共词网络可视化
最大的集群(#0)有29个成员,剪影值为0.725,集群最积极的引证指数为0.1,来自Chen(2010)的论文“Optimalseatallocationfortwo-flightproblemswithaflexibledemandsegment”。
第二大集群(#1)拥有24个成员,剪影值为0.844。集群最积极的引证指数为0.12,来自Chang,CT(2010)的论文“Optimalmanufacturer'sreplenishmentpoliciesfordeterioratingitemsinasupplychainwithup-streamanddown-streamtradecredits”。
第三大集群(#2)拥有23个成员,剪影值为0.771。集群最积极的引证指数为0.13,来自Schmitt(2010)的论文“Inventorysystemswithstochasticdemandandsupply:propertiesandapproximations”。
第四大集群(#3)拥有23个成员,剪影值为0.86。集群最积极的引证指数为0.13,来自CK(2010) 的论文“Anintegratedvendor-buyerinventorymodelwithorder-processingcostreductionandpermissibledelayinpayments”。
第五大集群(#4)拥有21个成员,剪影值为0.865。集群最积极的引证指数为0.14,来自Mutlu(2010)的论文“Ananalyticalmodelforcomputingtheoptimaltime-and-quantity-basedpolicyforconsolidatedshipments”。
图4是库存优化策略的时间线,图4的横坐标将每一聚类按时间顺序排列,相邻聚类常常对应相关主题(聚类间共引)。聚类之间的知识流向也可从时间(色彩)上看到(由冷色到暖色)。
表1是研究机构的引文数量排名,表2是研究机构的中心度排名。从表1中的引文数量来看,排名第一的是密歇根大学(2000),所属集群#2,引文数为46;第二个是香港大学(2010),所属集群#0,引文数为38;第三个是德克萨斯州达拉斯大学(2009),所属集群#0,引文数为36。第4名是香港城市大学(2010),所属集群#0,引文数为36;第5名是清华大学(2009),所属集群#2,引文数为35。从表2的研究机构中心度来看,排名第一的是新加坡国立大学(2000),所属集群#3,中心度为0.18;第二个是香港大学(2010),所属集群#3,中心度为0.16;第三个是中国科学技术大学(2009),中心度为0.16。
2.2.2库存定价聚类结构及时间演化
以关键词作为聚类结点,图5是库存定价的关键字共词网络集群,可以看出其聚类结构由9个被引集群构成。利用Citespace的export功能得到分析报告,按照剪影值排序得到最大的2个集群为:最大的集群(#0)拥有45个成员,剪影值为0.623,集群最积极的引证指数为0.16,来自Feng(2000)的论文“Perishableassetrevenuemanagementwithmarkoviantimedependentdemandintensities”。 第二大集群(#1)拥有40个成员,剪影值为0.625,集群最积极的引证指数为0.12,来自Halati(2010) 的论文“Analysisofsupplychainswithquantitybasedfixedincentives”。
表1 研究机构的引文数量排名
表2 研究机构的中心度排名
图5 库存定价的关键字共词网络集群
图6 库存定价的关键词排名
图6是库存定价的关键词排名,从1999—2017年排在前10位的关键词有:库存模型、定价级别、经济订货批量、缺货、范围限定、数量折扣、通货膨胀、收益管理、价格折扣模型和需求。
以文献作者作为聚类结点,表3是文献作者的被引数量排名,从被引数量来看,排名第一的是ChenX(2004),所属集群#0,被引次数为17;第二是LiYJ(2012),所属集群#0,被引次数为12;第三是GeunesJ(2006),所属集群#17,被引次数为12。
2.2.3库存技术聚类结构及时间演化
以发表期刊作为聚类结点,图7是库存技术的聚类时间线,可以看到库存技术聚类结构由5个被引集群构成,按照剪影值排序得到最大的2个集群为:最大的集群(#0)有6个成员,剪影值为0,集群最积极的引证指数为0.67,来自Huang(2010) 的论文“Exploringthedeteriorationfactorsofrcbridgedecks:aroughsetapproach”;第二大集群(#1)有5个成员,剪影值为0,集群最积极的引证指数为0.4,来自Kim(2010)的论文“Multi-agentbaseddistributedinventorycontrolmodel”。
表3 文献作者的被引频次排名
从被引频次来看,排名第一的是集群#2中的OperationsResearch&ManagementScience,被引次数为504;第二是Engineering,所属集群#2,被引频次为354;第三是Engineering-Industrial,所属集群#2,被引频次为251;第四是Engineering-Manufacturing,所属集群#2,被引频次为215。第五是集群#4中的Business&economics,被引频次为168。
以关键词作为聚类结点,图8是库存技术的共词网络可视化,可以看出库存技术聚类结构由26个被引集群构成,中心排名最高的是集群#0中的库存设计,中心度为0.15;第二个是集群#5中的时间,中心度为0.15;第三是物流,所属集群#2,中心度为0.15;第四是集群#6的补货,中心度为0.15。第五是集群#1中的库存控制(2003),中心度为0.13。
图7 库存技术的聚类时间线
图8 库存技术的共词网络可视化
3 库存管理研究趋势与展望
研究趋势的演变需要借鉴有关学科领域的知识积累,也就是说发表在TOP期刊上的论文代表该领域的前沿,而这些文献中引用的参考文献组成了这些论文的知识库14-15]。本文在对库存管理研究实现知识图谱可视化的基础上,用书目共现分析系统BICOMB对近5年的WebofScience数据库中用“Inventorymanagement”作为主题提取了4000篇核心文献(剔除论文、综述以外的文献)进行统计分析,得到表4。从表4可以看出,前10种期刊累计被引占全部的64.15%,其中InternationalJournalofProductionEconomics出现频次最高为730次,EuropeanJournalofOperationalResearch为497次,InternationalJournalofProductionResearch为427次。
表4 被引频次最高的前10种期刊
表5是被引作者统计,被引频次最高的前5位的研究学者的累计被引百分比为112%。其中Minner是德国慕尼黑工业大学管理学院教授,研究专长是物流与供应链,他还是国际库存研究协会(InternationalSocietyforInventoryResearch,ISIR)主席、欧洲物流协会研究发展委员会委员以及德国物流协会专家委员会委员;Taleizadeh是伊朗德黑兰大学工业工程系教授,研究专长是库存系统优化;这两位作者的被引频次都为27次。此外,台湾中原大学工业与系统工程系Wee教授和墨西哥蒙特雷工程与科学学院的Cardenas-Barron教授的被引频次都为23次。
表5 被引频次最高的前5位作者
通过前面对库存管理研究领域共引集群的分析,选择被引半衰期(Half-life)、中心度(centrality)、频次(Freq)和突变(Burst)等参数对前面三个专题集群的聚类进行数据挖掘。在Citespace软件中利用Export的SummaryTable功能将数据导出,然后针对以上参数排序整理后得到表6的库存管理研究趋势。从表6研究领域来看,被引半衰期较大的关键词一般代表比较经典的文献;而被引半衰期较小的关键词则说明研究较为新颖或倾向于技术的文章,所以其文章作为被引文献的时效性较高。
(1)库存优化策略:美国、香港和中国仍然是主要的研究机构,较为经典的研究关键词主要针对的是经济订购批量、库存规模、补货、分配、动态定价、相关需求、供应链和信息等;而较新的研究关键词主要针对的是生产库存问题、收益管理、可控提前期、易腐产品、渠道协调、运输政策等方面。
(2)库存定价:较为经典的研究关键词主要有相关需求、经济订货批量模型、动态定价、分配、决策、供应链管理、需求模型,系统等;而较新的研究关键词主要有生产决策、价格分级、环境、定制、机会损失、最小的最大后悔值准则、供应链管理、委托合同、约束等。
表6 库存管理研究趋势
(3)库存技术:较为经典的研究关键词主要有设计、绩效、不确定性、产业、需求、供应链、信息、模型、管理、时间;而较新的研究关键词主要有仿真、质量、模拟退火、预防性保养、制造业、预算约束、分配、库存控制、混合整数规划等。
4 结束语
本研究发现,基于知识图谱构建的库存管理研究在过去30年有着丰富的文献沉淀,且经历了从关注库存优化策略到库存定价,再到库存技术应用的时间演变过程[16-17]。生产库存问题、易腐产品、渠道协调、供应链管理以及仿真技术等仍然是库存管理领域研究的热点主题。本文研究结果可为国内相关学者了解库存管理的重点领域和热点问题提供帮助,也可为我国库存研究发展方向的主题凝练提供直观有价值的参考信息。
[1]HarrisFW.Howmanypartstomakeatonce[J].Factory,TheMagazineofManagement,1913,10(2):135-136
[2]TaftEW.Themosteconomicalproductionlot[J].IronAge,1918,101(18):1410-1412
[3]WilsonRH.Ascientificroutineforstockcontrol[J].HarvardBusinessReview,1934,13(1):116-128
[4]WhitinTM.Inventorycontrolresearch:Asurvey[J].ManagementScience,1954,1(1):32-40
[5]ArrowKJ,HarrisT,MarschakJ.Optimalinventorypolicy[J].Econometrica:JournaloftheEconometricSociety,1951:250-272
[6]DvoretzkyA,KieferJ,WolfowitzJ.Theinventoryproblem:I.Caseofknowndistributionsofdemand[J].Econometrica:JournaloftheEconometricSociety,1952,20(2):187-222
[7]DvoretzkyA,KieferJ,WolfowitzJ.Theinventoryproblem:II.Caseofunknowndistributionsofdemand[J].Econometrica:JournaloftheEconometricSociety,1952,20(3):450-466
[8]Romo-FernándezLM,Guerrero-BoteVP,Moya-AnegónF.Co-wordbasedthematicanalysisofrenewableenergy(1990-2010)[J].Scientometrics,2013,97(3):743-765
[9]LevenshteinVI.Binarycodescapableofcorrectingdeletions,insertionsandreversals[J].Doklady.AkademiiNaukSSSR,1965,163(4):845-848
[10]DamerauFJ.Atechniqueforcomputerdetectionandcorrectionofspellingerrors[J].CommunicationsoftheACM,1964,7(3):171-176
[11]NeffMW,CorleyEA.35yearsand160,000articles:AbibliometricexplorationoftheevolutionofEcology[J].Scientometrics,2009,80(3):657-682
[12]VanEckNJ,WaltmanL.Softwaresurvey:VOSviewer,acomputerprogramforbibliometricmapping[J].Scientometrics,2010,84(2):523-538
[13]ChenC,Ibekwe-SanJuanF,HouJ.Thestructureanddynamicsofcocitationclusters:Amultiple-perspectivecocitationanalysis[J].JournaloftheAmericanSocietyforInformationScienceandTechnology,2010,61(7):1386-1409
[14] 殷辉,陈劲.我国物流学科研究热点的共词可视化分析[J].图书情报工作,2011,55(20):129-133
[15] 梁伟波.美国NSF资助物流项目的知识图谱分析[J].情报杂志,2016,35(10):114-119
[16] 黄正伟,杨艳妮.基于知识图谱的国内供应链管理研究分析[J].中国流通经济,2013,27(9):42-47
[17] 王莉,李世宇.基于CiteSpace的国内“互联网+传统行业”研究热点与前沿分析[J]. 情报科学,2017(2):150-156