基于CNKI和CiteSpace的国内地热研究知识图谱分析
2021-04-09万晓帆
万晓帆,张 昊
(中国地质大学(武汉)资源学院,武汉 430074)
地热能是一种清洁可再生的绿色能源,具有热流密度大、传输容易、流量稳定和使用方便等优点[1],在世界范围内得以广泛利用。近20年来,在能源转型的推动下,中国地热资源的开发利用蓬勃发展,尤其是梯级利用,不同温度的地热资源可用于不同的生活场景,如供暖制冷、洗浴疗养、医疗、温室种植、养殖业和发电等各个方面[2]。大力开发和利用中国地热资源,可以改善能源供给结构以达到缓解能源供给压力、促进城镇绿色发展、协调地区经济发展的目的[3]。
地热资源开发利用的美好前景吸引了大量来自不同领域的研究人员对其进行探索,包括地质学、构造学、工程学、经济学、水文地质学、地球物理、地球化学、空间信息与系统等学科领域,同时,矿山地热[4]、油田地热[5]、海洋地热等领域的基础性研究也日益深入,并在实践中取得了丰硕的成果。知识图谱主要通过可视化数据挖掘、信息数据分析、科学数据计量和可视化图形绘制等一系列处理手段,来记录和展现某一相关学科研究领域的重要知识结构脉络与关系,是知识管理过程中的一种方法,具有知识导航的作用[6]。使用美国德雷塞尔大学信息科学与技术学院陈超美教授开发的可视化文献分析软件CiteSpace,对中国知网(CNKI)中有关地热的研究文献进行机构合作网络、作者合作网络、关键词共现和突现词等分析,旨在从个人和机构层面上认识国内CNKI文献中地热研究的主要贡献力量、知识来源、知识结构现状、跨学科特征、主要研究领域和前沿研究热点,明确国内地热研究现状和发展趋势。
1 数据来源和研究方法
1.1 数据来源
研究数据来源于国内信息量规模最大的学术期刊全文数据库——中国知网(CNKI)[7]。由于CNKI收录期刊较多,为保证数据的准确性和有效性,在选取数据时,采用高级检索的方式,选择“主题检索”,检索词为“地热能”并含“地热”,期刊类型为“全部”,时间跨度为“2000—2019”。采用以上检索方案是为了使所得数据能够适用于对某一领域做系统全面的专题性研究[8],近20年的时间长度既能保证所选文献的完备性,又能避免时间过老导致趋势反映不准确的现象。为使结果更为准确,对与研究主题相差较远(如声明、介绍、会议通知等)、作者或刊名不健全的文献进行了剔除,最终选取11 294篇有效文献。同时,还针对“地热+干热岩”“地热+碎屑岩”“地热+碳酸盐岩”等关键词组合做了单独的检索,以分析不同岩性地热研究的现状。
1.2 研究方法
基于大数据网络分析和图论的科学知识可视化是文献计量学的一个新兴领域[9]。对此已经专门开发了9个有代表性的软件,其中CiteSpace是一个基于java环境的免费可视化软件,由于其功能先进且易于操作,在世界范围内得到广泛的应用[10]。使用CiteSpace(5.5.R2)软件分析CNKI中地热相关文献,主要步骤如下:①将检索得到的文献采用Refwork格式导出,并在CiteSpace的Data项目中对文献的原格式进行转换,以便软件能够进行运算;②选择合适的参数,将时间跨度设置为2000—2019年,以1年为单位进行时间切片,在时间切片中选择Top50的关键词,设置软件默认的Pruning sliced network(剪切连线网络)共引参数;③选择节点为Author(作者)、Institution(机构)、Keywod(关键词),对机构合作网络、作者合作网络及研究热点等进行可视化分析;④利用Timeline视图对聚类与时间的关系进行梳理,从而探讨研究趋势与前沿热点。
2 CiteSpace可视化结果与分析
2.1 合著网络
科学合作是各单位为了深入科学研究而建立的协同关系,其形式多样[11],现主要进行合著分析。合著是科学合作中最具体、记录最详细的形式之一[12],包括个人、机构、国家合著等。CiteSpace的合著共被引分析有助于从微观和中观角度了解不同作者之间的协作网络,了解不同单位对地热研究的开展情况。
2.1.1 作者合作网络
作者是科学领域的本体,通过建立作者发文的共被引关系网络,可以反映出某一领域具高影响力的作者及作者群的合作情况[13]。利用CiteSpace软件,以作者为网络节点,生成作者合作网络知识图谱,如图1所示。图中节点大小表示作者发表论文的共被引频次(参与作者共被引的是参考文献中的作者,并且仅仅是第一作者),节点外的灰度圈厚薄表示其中心性高低,节点之间的距离和链路的厚度表示作者之间的合作水平与紧密度[14],以上因素共同反映了该领域的高影响力作者。
图1 作者合著网络知识图谱
从图1可知:共被引频次最多的作者是郭清海团队,包括何瞳和吴启帆,累计被引65次;其次是王贵玲团队,被引52次;方肇洪、庄庆祥、胡圣标、吴能友、龚鲁义、刁乃仁、舟丹、庞忠和等作者也被引次数较多。反映了这些作者是目前国内地热的高影响研究者。被引次数较多的作者大多是2010年以后开始出现,这种现象可能与中国《可再生能源发展“十二五”规划》的出台有关,受国家政策趋势引导,可再生能源开发被大力支持,地热能这一清洁能源也逐渐受到人们的重视。
图1中总节点数为628个,连线为687条,整体密度为0.003 5,说明地热研究领域百家争鸣,参与研究的作者较多,但彼此之间倾向于在小的群体中合作,合作强度整体较弱,各作者之间交流不够。从作者群角度看,地热研究目前还处于分散状态,各研究者基本上是局限于自己的研究团队,互引合作关系十分微弱。如郭海清、吴启帆、何瞳团队均专注于高温地热流体水文地球化学研究,多次共同撰写论文、联系紧密;庞忠和、胡圣标、汪集旸团队均在中国科学院地质与地球物理研究所地热资源研究中心工作,探讨合作较多,但交集并不紧密(图1)。作者群之间相互关系表现稀松[15],各学术团队、各作者之间学术联系较弱,不能有效地分享最新研究成果,长此以往将不利于国内地热研究发展。不同团队间的紧密合作应该在今后的地热研究中引起重视。
2.1.2 机构合作网络
某一研究领域核心科研力量关键在发文机构[16]。利用CiteSpace软件,以与形成作者合作网络相同的方式,形成机构合作关系网络知识图谱如图2所示。图中节点共399个,连线共165条,整体密度为0.002 1,说明国内地热领域研究机构还不多,合作关系也相对较弱,各研究机构间学术沟通交流还需要大力加强。图2显示地热研究机构出现的区域大多位于中国北方及沿海一带,推测这可能与我国大地构造背景及热流值的分布存在一定的相关性。
图2 机构合著网络知识图谱
从图2可知:共被引频次最多的机构是天津地热勘查开发设计院,作为第一单位累计129次;它是国内以地热地质工作为主,集科研、生产为一体的地勘单位,主要针对天津地区地热资源开展评价及综合研究[17]。其次是中国科学院地质与地球物理研究所,累计被引56次;地热学作为地球物理学的一个分支学科,该所是国内地热领域最核心的研究机构,并多次编著了全国的热流数据[18-19]。中国地质大学(武汉)、中国石化集团新星石油有限责任公司、中国地质科学院水文地质环境地质研究所、中国科学院广州能源研究所、中国科学院大学、北京市地质勘察技术院、福建省能源研究会、山东省第一地质矿产勘查院、北京市地热研究院、吉林大学等也是共被引次数较多的机构。地热研究机构以地球科学类研究院所为主,高校、企业为辅,研学体系已有基本雏形,存在跨学科、跨门类的合作。但是,目前开展地热研究的高校还不多,仍需做出进一步规划和推动;国内地热领域研究机构间的相互合作也还需要进一步加强。
2.2 关键词共现网络
关键词往往高度概括和浓缩文章主要内容,因此统计分析关键词可研究某一领域的热点话题[20-21]。
2.2.1 关键词网络图谱
在关键词网络图谱中(图3),节点外圆圈大小表示关键词频次,频次的高低表示研究的广泛程度;节点外灰色圈表示节点为高中心性节点,中心性主要用来衡量节点权力的大小,反映该节点的重要性[22];线条代表关键词之间的联系,节点间连线的条数反映其连接节点的共被引频次和研究的广泛性与重要性。
图3是以关键词为节点类型,利用相似度比例算法(loglikelihood ratio test,LLR)聚类所得。图中节点数为176个,连接数为232条,密度强度为0.015 1,显示了地热研究涵盖面广、涉及多领域的特点。由图3可知:圆圈最大的是地热,其次是干热岩、开发利用、地热井和地源热泵等,其频次分别为571次、233次、232次、196次和154次,这些高频次节点反映了研究关注程度的广泛性;灰色圈最厚的是开发利用,其次是矿产资源和地热发电、地源热泵、地温梯度等,其中心性分别为0.75和0.57、0.50、0.34、0.30,高中心性的关键词反映了这些研究的重要性;节点间连线条数较多的是地热供暖、浅层地热、地下热水、增强型地热系统、干热岩等聚类,揭示了这些关键词共被引频次高,是地热研究关注的热点。高频词、高中心性、强联系的关键词存在重叠,这表明目前地热研究主要聚焦在利用地源热泵,开发利用浅层地热能方面,干热岩和地热发电也越来越引起关注。
图3 “地热”关键词共现图谱
2.2.2 不同类别关键词共现网络
为进一步深入分析地热研究的现状和特点,以“地热+碎屑岩”“地热+碳酸盐岩”“地热+干热岩”分别进行了关键词检索,同样使用LLR算法绘制了关键词聚类网络图谱,如图4~图6所示,以期探讨不同岩石类别地热研究的主要内容和热点。
图4揭示了碎屑岩地热研究的现状和特点。图中节点数为90,连线数为103,密度强度为0.025 7,较为重要的节点是热储层、成因模式、地热井、地下热水、评价、开发利用和数值模拟等。这些关键词不仅在频次、中心性和连线数上表现突出,字体也较其他粗大,显示了是近几年碎屑岩地热研究的热点。这也表明在进行碎屑岩地区地热勘查时,研究者们多关注碎屑岩的热储、成因、地热井和热水。岩石热导率受孔隙度和渗透率影响,砂砾岩富水性强,孔渗条件好,传热、储热、储水性能优良[23],多作为热储。通过数值模拟进行成因模式探讨和地热评价是碎屑岩地热研究的主要方法。
图4 “地热+碎屑岩”关键词共现图谱
图5反映了碳酸盐岩地热研究的现状和特点。图中节点数为45,连线数为33,密度强度为0.033 3,较为重要的节点是地下热水、水化学特征、同位素、温泉和成因模式等。这说明地热水资源在碳酸盐岩等非火山地区起着不可忽视的作用[24],地热水矿化度较高,成分复杂,含有多样的微量元素及气体组分。地热流体水化学组分及同位素特征通常保留着地热系统在形成演化过程中蕴含的地球化学信息[25],故研究者常通过分析这两点来探索地热资源形成机制、赋存环境及循环机理等。结合图中其他关键词,可知中国在雄安新区建立地热能区域性高效开发利用示范区,这一举措吸引了大量学者研究碳酸盐岩地热成因模式。
图5 “地热+碳酸盐岩”关键词共现图谱
图6反映了干热岩地热研究的现状和特点。图中节点数为142,连线数为186,密度强度为0.018 3,较为重要的节点是增强型地热系统、地热发电、水力压裂、数值模拟、开发利用和共和盆地等。可见中国干热岩的勘查开发重点在青海共和、贵德等地进行,干热岩开发相比普通地热水,对环境污染小,受制约条件低,主要用于发电[26]。据统计,大部分干热岩开发项目为增强型地热系统[27],它的迅速发展得益于压裂技术的进步,研究者们通过压裂技术,使干热岩的热体积增加,渗透率大幅度提高[28],从而达到利用更充分、高效的目的。在干热岩的研究中,数值模拟也是一个主要的研究方法。
图6 “干热岩”关键词共现图谱
2.3 Timeline时间线视图
Timeline时间线视图以发表时间作为横坐标,聚类状态作为纵坐标,可用于阐述该领域发展脉络和前沿动态[29]。图7是以关键词为节点类型,利用LLR算法聚类,插入时间布局所得,相同聚类的文献被放置在同一水平线上。图中节点数为628个,连线数为687条,网络密度为0.003 5。节点大多分布在2007年至2019年间,据每种聚类所含文献数量排序,前3个聚类分别为“地热减排”“浅层地热能开发”“干热岩开发”,由节点及连线密度可知这三者在未来研究趋势仍然不会减弱,仍然是研究的热点领域。“地热发电”“地热水回灌”“温度场”“多孔介质的孔渗率”“地源热泵”“水热型地热资源”“可控源音频大地电磁法(controlled source audio frequency magneto telluric,CSAMT)”等聚类在2010年以后开始出现,也一直受到广泛关注,是地热研究的重要内容。
图7 “地热能”Timeline时间线视图
2.4 突现词分析
突现分析的基本原理是根据标题、关键词、摘要等词频增长率来判断热点词汇[30],因而突发的关键词(关键词经常被引用超过一个时间段)可以指示某一研究领域前沿[31]。
表1是在CiteSpace软件中通过选择“突发性(Burstness)”参数来实现地热研究领域突现文献信息的统计。结果表明:突现时间最长的关键词为“地热温标”,它突现的时间也最早,这表明地热最早是从地热温标的研究开始的,通过研究地热温标可以合理估算热储温度[32]。尽管其突现在2007年结束,但在很长一段时间内它都是地热领域的研究重点。突现强度较强的关键词为“地热开发”“浅层地热”“地源热泵”,这说明开发利用浅层地热能一直是地热研究领域的热点,2019 年西安举办的国际清洁取暖峰会上也证实我国中浅层地热能直接利用多年位居世界第一[33]。利用浅层地热能的主要方式是地源热泵[34],地源热泵和水源热泵均为地热换热器,相比水源热泵,地源热泵不需利用浅层地下水,地下水位下降、地面沉降、土壤盐碱化等问题可以得到缓解[35],可以高效地从地下获取热量。因此,广大研究者致力于对地源热泵的结构进行剖析、系统进行完善,以期加快改善我国能源供给结构,实现绿色低碳发展。“干热岩”“地热发电”这两个关键词突现最晚,这说明干热岩钻探开发在我国近几年得到了重大突破,为中国地热发电提供了技术支持[36-37],是今后研究的前沿领域。因此,就目前国内的地热研究而言,利用地源热泵技术,高效开发利用浅层地热能,改善中国能源供给结构,促进节能减排和绿色发展,一直是研究的热点,也是地热能最现实利用并服务于国家区域经济发展的需求;干热岩和地热发电则是今后中国地热研究的前沿与面临的挑战。
表1 “地热能”突现词信息表
3 结论与展望
基于知识信息可视化软件CiteSpace,对CNKI文献的研究者、研究机构、关键词聚类、时空分布及突现词信息进行了数据挖掘,绘制了国内文献中地热研究现状的科学知识图谱,探讨了地热研究的热点与趋势,展望了未来的发展方向。通过分析,得到以下认识。
1)研究力量构成方面:核心研究力量主要来自研究所,以天津地热勘查开发设计院和中国科学院地质与地球物理研究所为代表,众多高校、企业也积极参与,研学体系已有基本雏形,存在多学科间的合作。在作者层面,地热研究领域发文作者很多,其中被引频次较高的作者为郭清海、王贵玲、庄庆祥、胡圣标、吴能友等,体现了这些作者在地热研究领域具有较高的影响力。但是研究团体之间的联系较稀疏,合作不多。未来,各单位、团体和个体之间应注重交流沟通与广泛的合作,促进地热领域最新研究成果的分享,共同推进地热研究进程。
2)研究热点方面:整体而言,“开发利用”“干热岩”“地源热泵”3个关键词在频次、中心性和联系强度上均表现优异,指示当前地热研究的热点;就不同岩石类别而言,其侧重点有所差异,碎屑岩地区的地热开发主要关注热储层的岩石物性特点、碳酸盐岩地区较为重视地下热水对地热勘探开发的影响、干热岩的开发则聚焦通过水力压裂形成的增强型地热系统,三者中关于干热岩的研究最为丰富。因此,进一步深入对干热岩进行开发利用,可能是未来很长一段时间的研究热点。
3)研究前沿方面:时间线视图和突现词信息共同指示中国地热发展面临的挑战与机遇并存,一方面国家政策的出台推进了地热能开发,另一方面地热领域存在多学科交叉,研究者们需全面掌握相关知识。如何高效进行浅层地热能、干热岩的开发与利用、如何完善地源热泵结构、如何利用地热能发电做到节能减排、如何通过地热流体的化学组分还原古地理环境、如何最大限度地减少地下热水排放对环境造成的影响都将是地热工作的研究前沿。