中国可达性研究知识图谱分析
2021-01-08林孝松罗军华
罗 彬,林孝松,罗军华,王 敏
(重庆交通大学建筑与城市规划学院,重庆 400074)
可达性是指通过特定交通方式到达某一位置的便捷程度,反映了某一区域与其他区域相联系并进行社会经济往来和技术交流的潜能和机会[1],是分析和评价公共服务设施及空间规划布局合理性的一个重要指标[2]。中国诸多学者对景观、教育、医疗、道路和居民点等不同的公共服务设施开展了可达性的研究,学者对可达性的内涵理解不同,研究时采用的方法也有所不同,如潜能模型[3]、两步移动搜索法[4]、改进潜能模型[5]、改进的两步移动搜索法[6]等。可达性与区域的交通密不可分,区域的发展和交通的便捷不断提升着可达性,同时可达性的提升也可增强区域的区位优势,从而促进区域的发展,使得各地区间的联系和往来更加密切,因此可达性的研究对区域的社会经济的发展意义重大。
当前,中国对于可达性研究成果进行系统性总结还相对缺乏,同时由于文献量巨大,导致使用传统方法相对困难,分类标准也难以统一,易导致主观性和片面性。科学知识图谱是可视化显示知识资源及其关联的一种方法[7],是以科学知识为对象,将计量学的共现分析、引文分析和数学、图形学等方法结合,利用可视化的图谱形象地展示出学科的核心结构、发展历史和学科前沿等,显示知识群之间隐含的多种复杂关系[8],能很好地辅助探究研究领域的发展和前沿。CiteSpace软件是目前中国绘制科学知识图谱应用最为广泛的工具之一。如罗杨等[9]基于该软件完成了中外有关重金属生物可给性领域的主题演进、研究现状、研究进展及发展态势分析;韦永圣等[10]通过科学计量分析方法和关键词共现分析方法分析了中国医学教育信息化研究现状和发展趋势;井世洁等[11]基于CiteSpace软件可视化功能探求了中国校园暴力研究的现状和发展脉络。
现以中国知网数据库中关于可达性研究领域的各类文献为数据基础,借助软件CiteSpace进行统计量化分析、网络分析和聚类分析,绘制我国可达性研究知识图谱,通过节点间关系、关键词聚类等分析可达性的研究现状、核心作者、发文机构、历年的研究热点及研究前沿等,分析研究的结果可为可达性的后续深入研究提供切实的、有价值的参考。
1 数据与方法
1.1 数据来源
数据来源为中国知网数据库,在论文高级检索框中,输入主题词为“可达性”,选择发表时间为1990—2020年,具体时间为1990年1月1日—2020年1月1日,跨库选择只选择学术期刊、博士、硕士以及重要会议论文四种类型,进行精确匹配,获得检索结果共计4 252条。对检索结果进行人工剔除,删除摘要集等无关和无效文献,最终共获得4 202条有效文献数据。
1.2 研究方法
1.2.1 共现分析法
此次利用CiteSpaceV.5.3.R4软件进行文献共现分析。在CiteSpace软件中对下载的数据文献进行预处理,将Refworks格式数据转换为软件可识别的数据格式,然后在Network configuration功能和参数区设置各项参数,包括时区设置、时间切片设置、显示阈值设置及算法设置等。时间切片的作用是对文献数据进行按时区进行分割;显示阈值的作用是设定各时区内所要提取对象的数量,阈值越大,数据分析就越为全面;算法的作用是对网络中生成的连线进行剪裁,以降低连线的密度,从而可以提高结果的视觉性和可读性。
共现分析是将各种信息中所包含的共现信息进行定量化的分析方法,以显示信息间内容的相关性和特征项以及其中所隐含的寓意,可分为作者共现、关键词共现、期刊共现和论文共现四种类型。作者共现分析是用于探究某学科领域的核心作者以及学者之间的互引关系与合作强度[12]。在CiteSpace软件中,设置节点类型为作者,时间切片为1年,阈值为50,进行作者共现分析操作,再利用PathFinder寻径算法优化作者合作网络;机构共现分析用于明确该研究领域的空间力量在空间和地域的分布情况。在CiteSpace中,设置节点类型为Institution,算法为Minnimum Spanning Tree,进行机构共现分析;关键词共现分析通过对文献高度概括词即关键词的分析,了解和掌握研究领域历年来的研究热点以及动态变化。在CiteSpace中,节点类型设置为Keyword,剪枝算法设置为Minnimum Spanning Tree,时间切片设置为2 a,阈值设置为40,进行关键词共现分析;突现词指在一段时间内被引用的次数或共现的次数变化较大的词汇,可以反映出这段时间内影响力较大的研究领域[13],还可以了解和预测学科前沿和发展趋势。在CiteSpace软件中,节点类型设置为Keywords,聚类词类型Term Type设置为Burst Term,进行关键词突发性检测。
1.2.2 时序分析法
时序分析法是以有关的历史资料的数据为依据,整理出时间统计数据图,借以分析数据随时间分布特征。利用Excel对可达性的研究发文数量随时间的分布特征进行研究。以中国知网下载的数据为基础,利用知网的可视化分析功能,统计1990—2020年来各年度期刊、博士、硕士和会议论文四种类型的年发文量,制成表格,再作出文献的时序分布图表,分析发文量随时间的变化趋势。
2 结果分析
2.1 发文量时间分布特征
文献的发文量随时间的分布特征在一定层面可以反映出该研究领域的学科水平和发展速度[14],以发文量随时间的变化趋势分析和探究该领域在某一段时间内的发展状况和阶段特征。从1990—2020年期间可达性4 202篇文献的时序分布折线(图1)来看,学术期刊数量最多,达2 939篇,占总数的69.94%;博士学位论文为90篇,占比2.14%;硕士学位论文872篇,占比20.76%,会议论文301篇,占比7.16%。
从时序变化来看,中国关于可达性的研究大致可分为四个阶段:①1990—2001年的起步阶段,在该阶段内各类型文献的发文数量总体上较少,呈小幅度波动状态,文献类型以期刊论文为主,会议论文占少部分,没有博士、硕士论文;②2001—2010年的快速发展阶段,在该阶段各类文献随时间呈现上升的趋势,尤以硕士论文最为明显,论文数量随时间变化逐年增长,增长率达52.27%,其次是期刊论文,年发文量在60篇以上,增长率达23.74%,博士论文和会议论文也有小幅度的上升;③2010—2018年的高速发展阶段,学者对可达性的研究愈发深入,年度发文量都在100篇以上,增长率达13.38%,主要体现在期刊和硕士论文类型;④2018至今的成熟平稳阶段,该阶段发文量略有下降,主要是博士论文和硕士论文的发文数量略微下降,期刊和会议论文仍有缓慢上升的趋势。
从研究文献的类型来看,期刊论文的数量随时间呈明显增长趋势,2019年发表数量更是高达350篇;博士学位论文方面,从2001—2019年一直处于小幅度波动的状态,最高年发表数量达15篇,增长趋势不明显;硕士学位论文方面,年发文量在2000—2018年区间呈持续增长状态,2019年至今数量具有下降趋势;会议论文方面,2000—2020年区间一直在小幅波动,增长速度较为缓慢。综合来看,自2000年起,可达性研究领域开始萌芽,得到中国学者的广泛关注,可达性的研究随时间的推移不断增加,研究内容及涉及方面不断深入和拓宽,学科体系建设不断完善,培养了大量的专业人才,但是博硕士学位论文占比依然较低。近三年来,学术期刊的发文数量开始趋于平缓,而博硕士学位论文的发文数量略有下降,表明可达性研究需要注入源源不断的新活力,需要学者们继续钻研和探索。
2.2 作者共现分析
基于检索的文献数据,利用CiteSpace软件得到作者共引图谱如图2所示,作者发文频次前20的排名见表1。图谱共有561个节点,392条连接,图谱中节点的大小与作者出现的频率正相关,节点越大,代表作者出现的频率越高;节点的颜色表示作者的文章被引用的年份;各个节点之间的连线数量与粗细反映了作者群之间的合作关系与合作强度。
由图2、表1可以看出,南京师范大学的陆玉麒是图谱中最大的节点,发文数量达44篇;其次是南京大学的徐建刚,发文数量为25篇;排名第三的是江西师范大学的钟业喜,发文17篇,发表文献数量在10篇及以上的作者有10人,主要分布在江苏、云南等地,且大都从事于师范类学校。
通过PathFinder寻径算法优化作者合作网络后,网络节点数量没有发生变化,但是连线数量大大地减少,分析得到中国空间可达性研究的5个研究群体,分别为南京师范大学陆玉麒、张莉;南京大学徐建刚、尹海伟;辽宁师范大学郭建科、付加森、王利;中国科学院南京地理与湖泊研究所吴威、曹有挥;东北师范大学修春亮、魏冶。除此以外还有一些连线关系较为简单的群体以及较多分散的独立作者,表明可达性研究得到了中国学者的高度关注。但图谱中各个作者群之间的连线稀疏,网络密度仅为0.002 5,表明各个团体之间的互引关系比较弱,学术交流及学术探讨方面比较薄弱,彼此间合作关系并不强,长此以往容易形成学术隔离和学术堡垒,不利于空间可达性的全面深入研究和可持续发展。
图1 1990—2020年可达性研究发文数量时序分布图Fig.1 Time series distribution diagram of the number of papers published in the accessibility study from 1990 to 2020
图2 1990—2020年可达性研究共引作者图谱Fig.2 Co-citation authors of accessibility studies from 1990 to 2020
表1 1990—2020年发文数排名前20位的作者及其机构名称
2.3 发文机构共现分析
分析得到发文机构共现图谱如图3所示,发文数量排名前十的发文机构如表2所示,半衰期排名前5的发文机构如表3所示。
在发文机构共现图谱中,共有305个节点,179条连接,网络密度为0.003 9。由表2所示,可达性研究领域发文数量排名前十的机构依次为南京师范大学地理科学学院、南京大学建筑与城市规划学院、中国科学院地理科学与资源研究所、同济大学建筑与城市规划学院、中国科学院大学、武汉大学资源与环境科学学院、南京大学地理与海洋科学学院、北京大学城市与环境学院、东北师范大学地理科学学院、西北师范大学地理与环境科学学院。其中,节点最大,排名第一的正是发文量最多的作者陆玉麒所在的机构南京师范大学地理科学学院,第二的南京大学也是发文量第二的作者徐建刚所在的机构,表明机构的影响力和权威力和机构的学者密不可分。
发文数量是评价机构研究成果的其中一个重要的指标,为了更加科学全面地分析发文机构的研究成果的质量,需要比较和分析另一个指标——半衰期,半衰期是指某学科被引用的文献总量中,一半数量的文献失去作用和效率所经历的时间,即文献的老化速度,也表示文献在研究领域中被关注的时间长短,半衰期越长,表明该机构文献被关注时间越久,文献质量越高,文献的可利用价值越大。由表3可知,长安大学公路学院的半衰期最长,半衰期为12年,其次是同济大学建筑与城市规划学院、中山大学地理科学与规划学院、清华大学建筑学院、中国城市规划设计院和东北林业大学,半衰期均为9年,中国科学院地理科学与资源研究所和东南大学建筑学院排名第三,半衰期为7年,其中长安大学公路学院发文量仅为9篇,但是半衰期却最长,影响力最大,表明文献的质量和影响力与发文数量并无明显相关性。
图3 1990—2020年可达性研究发文机构共现图谱Fig.3 Co-occurrence map of publishing institutions for accessibility research from 1990 to 2020
表2 1990—2020年可达性发文数量排名前10的发文机构
纵观全图,主要的发文机构分布在南京、上海、北京、武汉等大城市,如南京师范大学、中国科学院、北京大学、武汉大学、同济大学等。说明大城市对可达性研究更为重视,这也是由于大城市的发展,城市空间结构的改变,大城市人口的不断增加导致城市用地愈发紧张,道路交通和基础设施的可达性成为了学者的研究对象,可达性分析能够直观地揭示公共服务设施空间分布均衡性及便捷程度[15],所以研究可达性对于城市经济健康发展和城市合理规划具有重要意义。其中比较大的节点是南京师范大学地理科学学院,其次是中国科学院地理科学与资源环境所,还有就是南京大学建筑与城市规划学院,都是地理学专业影响力较强的学校,各节点之间连线较多,表明各机构之间也是存在较为密切的学术联系和合作,有利于可达性研究的全面性和丰富性。
表3 1990—2020年可达性半衰期排名前5的发文机构
图4 1990—2020年可达性研究关键词共现图谱Fig.4 Co-occurrence atlas of key words in accessibility studies from 1990 to 2020
2.4 关键词共现分析
图4为可达性研究关键词共现图谱,图谱中共有271个节点,424条连接,网络密度为0.011 6。其中最大的节点就是可达性,其余节点之间连接密切,网络密度大。图谱中出现的关键词大致可分为五种类型,第一类如“北京”“中国”等地方性名词,显示了可达性研究的地域分布,代表着这些城市在可达性研究领域的研究较多,与杰出的学者和机构的地域分布相呼应;第二类如“能达性”“空间可达性”“交通可达性”等,为可达性研究的类型,不仅是空间上的可达性,时间上的可达性也值得研究;第三类如“公园绿地”“公共交通”“高速铁路”“公共服务设施”等词条,是学者对于不同领域的可达性的研究,说明可达性分析作为公共设施布局合理性的评价方法,已经被广泛应用于城市规划、交通规划和地理相关学科领域,以研究人们所能获得的活动机会以及经济建设活动所能获得的潜在经济效益;第四类如“引力模型”“空间句法”“petri网”“空间分析”以及“地理信息系统”等在做可达性分析时所使用方法的词条也出现较多,表明对于可达性研究的已经非常成熟;第五类如“空间布局”“空间结构”“空间分布”“土地利用”等关键词,表明可达性与空间规划建设和土地利用的关系紧密,这些都直接或间接地均属于可达性的相关研究内容和研究方法。
中心度是用以节点的“度数”表示与该节点存在直接联系的节点数目,大小与其在共现网络中的受关注程度成正比[13]。计算关键词的中心度可以了解历年来的年度关键词,了解研究热点的变化和研究趋势。在CiteSpace软件中,调整时间切片为1年,统计分析历年来中介中心性大于0.05的关键词,对数量少和关键词中心度小于0.05的年限作统一表达见表4。其中“可达性”的中心度最大,其次是交通可达性和能达性,表明从2004年开始,地理信息系统成为研究可达性的一种重要的方法和手段,21世纪来地理信息系统和科技的发展,使得可达性的研究手段更加丰富。再者中心度较高的是空间格局,表明对可达性的研究是针对空间格局来研究的,城市社会经济发展所带来的城市空间格局和土地利用问题,使得空间格局与可达性的研究密切相关。
从年份来看,1990—2007年,可达性的研究主要倾向于空间分布、空间格局和空间结构,城市规划布局不合理、人口增长过快以及用地紧张等一系列问题使得可达性的研究成为需求;2008—2010年,公园绿地成为热门关键词,表明人们开始关注于生活环境的品质和绿色生态问题;2011—2020年,交通和公共服务设施逐渐成为人们研究的热点,交通与城市的发展密切相关,公共服务设施的建设也和城市的经济发展有很大的联系;2004年开始,大数据、潜能模型、两步移动搜索法开始应用于可达性的研究,由此可见可达性的发展前景可观。
表4 1990—2020年各年份关键词中心度排序
2.5 关键词突现分析
研究前沿指学科内正在讨论和探索,并且即将发生的具有代表性的科学问题。由表5可知,突现度最高的关键词为“能达性”,突现的年限为1990—2005年,突现度32.493 5;其次是“petri网”,突现的年限为1994—2009年,突现度13.535;然后是“可达性”,突现的年限为1991—2020年,突现度9.641 8。“可达性”从1991年至今都是历年来的热点词,表明可达性的研究前景可观;“两步移动搜索法”和“ArcGIS”这两个关键词在近三年里突起,也是目前学者研究可达性比较常用的模型和方法。
3 结论
(1)中国可达性研究大致可分为起步阶段(1990—2001年)、快速发展阶段(2001—2010年)、高速发展阶段(2010—2018年)和成熟平稳阶段(2018至今)。
(2)中国可达性研究大致分为几个作者群,各作者群之间的互引关系比较弱,学术交流比较薄弱,长此以往容易形成学术隔离和学术堡垒,不利于空间可达性的全面深入研究和可持续发展。
(3)各发文机构之间存在较为密切的学术联系和合作,有利于可达性研究的全面性和丰富性。通过半衰期指标的比较表明文献的质量和影响力与发文数量并无明显相关性。
(4)发文机构大都分布在上海、北京、武汉、南京等大城市,说明大城市对可达性研究十分重视,研究空间可达性对于城市经济健康发展和城市合理规划具有重要意义。
(5)可达性研究与城市的发展密不可分,涉及城市空间布局、土地利用以及基础设施建设等方方面面,近几年来越来越多的模型和方法运用于可达性的研究,可见可达性的发展前景可观。