基于科学知识图谱的中国体质研究关键词共现分析
2018-09-07文海燕崔树林
文海燕 崔树林 李 杰
(1.上海对外经贸大学 工商管理学院,上海 201620;2.上海对外经贸大学 体育部,上海 201620;3.上海海事大学海洋科学与工程学院,上海 201306)
“体质”是人体在先天遗传性和后天获得性基础上表现出来的功能和形态上的相对稳定的固有特性。包括体格、生理、体能、心理发展水平和适应能力等。其水平反映着人体的质量。体质有明显的个体差异性和个体发展的阶段性,并受遗传变异、生活环境、营养条件、生命规律和体育锻炼等因素的影响。经常科学地进行体育锻炼,是提高体质水平最积极有效的方法[1]。
Citation Space是一款着眼于分析科学中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款引文可视化分析软件[2]。由美国德雷克塞尔大学陈超美博士开发,该软件在绘制各个科学领域的科学知识图谱、分析不同特征和类型的引文网络以及识别和呈现科学发展新趋势和新动态等方面具有较强的技术和功能优势[3]。在国际科学研究中已应用于60多个领域,在国内也得到了广泛运用,在教育学领域近年发表和出版的学位论文、学术专著和学术期刊论文中常见该软件的应用。
本研究运用Citespace5.0软件绘制中国体质研究科学知识图谱,把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示了我国体质研究的前沿热点与演进路径,有助于国内学者准确把握体质研究发展的趋势,快速发现体质研究的新方向,从而推动国内体质研究的全面发展。
1 数据来源与研究方法
1.1 数据来源
在数据的收集与检索过程中准确性和有效性在信息可视化分析中至关重要。如何设置检索表达式,使得检索结果尽可能包含所有相关研究成果是需要首先考虑的问题。本文进行计量分析所使用的数据均来自由南京大学中国社会科学研究评价中心开发研制而成的“中文社会科学引文索引”(CSSCI)。进行分析的数据记录主要包括文献的作者、题目、摘要、源期刊和文献的引文。用于分析的工具是Citespace5.0信息可视化软件。检索参数设置为:篇名(词)=体质,最终检索到期刊论文615篇(表1)。并将文献的全部信息,包括文献题目、作者、关键词、摘要、参考文献等下载并保存为纯文本形式,以备数据处理和研究分析之用。
表1 本研究数据来源一览表
对1998-2016年间的文献进行检索,共获得615条文献数据(见图1和表1)。从文献的出版年份分布情况看,从1998年到2001年,发文量维持在一个不到30篇/年的相对较低水平,说明这一时期,人们对体质的研究相对较少;2001年以后进入一个相对多产的时期,文献产量不断增多;2004年研究迅速升温,到2007年达到发文量峰值66篇/年,为1998-2001年发文量的两倍(如图1所示),说明这一时期是中国体质研究的繁荣时期;2007年以后“体质”领域的发文量逐步减少,到2011年减少到37篇,说明这一时期,大家对这一主题的研究热情逐步减弱;之后2012年、2013年发文量再次飙升到接近60篇,说明这一时期,中国体质领域的研究有了新的突破,产生了新的研究增长点,之后从2014年开始回落,2014、2015、2016年基本保持在每年发表40篇左右(占体育类CSSCI期刊总发文量的3.44%),并有逐年上升趋势。这也展现了中国学者对体质领域研究的关注度一直保持在一个较高水平。
图1 中国“体质”领域文献的逐年分布图
1.2 研究方法
1.2.1 文献分析法
研究中查阅大量中国体质相关的文献及著作,包括硕博论文、期刊文献、专著、研究报告等,学科领域涉及到体育学、教育学、社会学、情报学等。
1.2.2 计量分析法
文献计量方法是用数学或统计学方法,对文献的外部特征数量进行描述,继而对科学技术的现状与发展趋势进行评价和预测的研究方法。本研究对文献的年份分布、机构分布、作者发文量和期刊分布等进行计量分析。
图2 本研究数据搜索、归纳、统计技术路线图
1.2.3 知识图谱法
运用Citespace 5.0分析软件进行关键词共现分析和文献共被引分析。
2 研究结果与分析
2.1 中国体质研究领域基本情况分析
对1998年至2016年中国体质研究领域的615条文献,从机构分布、主要学科、主要作者等方面对中国体质研究领域基本情况进行分析。
2.1.1 中国体质研究的机构分布
将606篇文献的全部信息导入Citespace 5.0进行统计分析,参数设置如下:time slicing=from 1998 to 2016,years per slice=1;node type=institution;最终将数据的统计结果制作为表2。
表2 中国体质研究主要机构列表
对发文机构进行统计后发现,615篇论文来源于305家研究机构,包括高校、中学、政府部门、企业等,在这些机构中,高校发文量最多,占总发文量的85%,国内体育学院和设有体育院系的师范大学是中国体质研究的主要力量。其次是政府部门,发文量占到总发文量的10%,其中体育科学研究所、体质监测中心、体育局和教育局是中国政府部门体质研究的主要力量。从发文的频次上分析,北京体育大学、江苏省体育科学研究所和上海体育学院是中国排名前三的体质研究机构。
从地域分析来看,京津冀、江浙沪、珠三角等国家发达省市是中国体质研究力量分布的主要区域。以省市为单位对发文量进行统计发现北京的发文量达到125篇排第一名,上海和江苏发文量为50篇排第二名,浙江发文量为43篇排第四,广东省发文量为32篇排第五名。
2.1.2 中国体质研究的主要学科
表3 中国体质研究主要学科列表
研究发现,体育学科是中国体质研究的绝对主力,发文量为499篇,占到总发文量的81.11%(见表3)。从体育学科学术期刊的发文量来看,发文量最多的是《北京体育大学学报》,共发表了144篇篇名包含“体质”的学术论文;其次是《体育科学》,发表了71篇;《体育学刊》发表了59篇,排第三;《武汉体育学院学报》发表了48篇,排第四;《体育与科学》发表了43篇,排第五。其余的多学科交叉研究主要来自于以下学科类别:社会学、教育学与民族学、新闻学与传播学、政治学、经济学、图书馆、情报与文献学、法学、考古学、历史学等研究领域。哲学、管理学、文化学、宗教学、语言学等学科也有文章公开发表。
2.1.3 中国体质研究的主要作者
表4 中国体质研究主要作者
研究表明:从发文量来看,1998年到2016年期间,在CSSCI期刊上以第一作者身份发表与中国体质研究相关论文最多的学者是徐浩和姜文凯,排名第二的是孙飙和江崇民;排名第三的是张天成和季浏。他们和张一民、周建伟、戴剑松、张艺宏、蔡睿、汤强等人是中国体质研究领域的高产作者。从作者所在的单位来看,高产作者主要来源于江苏省国民体质监测中心、国家体育总局体育科学研究所和各地的体育学院等比较容易获得体质测试数据的机构。
2.2 中国体质研究的研究前沿热点与演化分析
一个学科的研究前沿表现为涌现的施引文献群组。它从两个方面来体现研究前沿的特征:描述观点的正文和引用的参考文献。具体来说,研究前沿是由形成文献共被引矩阵中的文献及其施引文献中使用的突显词或突显词的聚类来体现[4]。如果某关键词或词组出现的频次越高,表明该领域科研人员对其关注的程度也越高,它所代表的研究内容就越有可能是该领域的研究热点之所在[5]。在Citespace5.0中,“Keyword”为关键词共现分析功能,分析对象为文档中的“DE”和“ID”字段,得到结果为关键词共现网络,此网络可以反映出某一领域当前研究热点及过去产生过哪些热点研究[6]。
2.2.1 中国体质研究的热点关键词分析
将615篇文献的全部信息导入Citespace 5.0进行统计分析,最终将数据的统计结果制作为可视化图谱。由于国内“体质”研究文献在CSSCI中最早出现于1998年,故时区分割(time slicing)选择1998-2016年,单个时间分区的(years per slice)设为2年,即形成时间跨度为2年的14个时间段。主题词来源(term source)选择为标题(title)、摘要(abstract)和关键词(descriptors与identifiers);阈值保持默认状态,即前50个高频或者高被引节点;节点类型(node types)选择关键词(key word)。
因为同一个关键词在不同的研究成果中可能有不同的表达方式,因此对关键词进行规范与统一,将研究主题中意义相同或重叠的关键词进行合并处理,计算出各个关键词出现的频次对最终数据结果的科学化处理有着重要意义,本研究中根据研究目的和内容合并了以下关键词节点的频次:一是将女大学生、藏族大学生、少数民族大学生、大学生体质等节点合并到大学生节点;二是将青少年体质合并到青少年节点;三是将学生体质健康标准合并到国家学生体质健康标准节点;四是将中国成年人、成年人体质合并到成年人节点;五是将中学生、小学生合并到中小学生节点;六是将体质测定合并到体质监测节点;七是将健康标准节点合并到体质健康标准节点。
基于上述分析,运行软件通过默认聚类分析,最后选择出高频关键词和由330个节点、602根连线组成的关键词研究热点图谱(见图3)。规范合并汇总,得到表5,表示部分高频及高中心性关键词表。在图谱中,每个节点代表体质研究的一个关键词,节点和标注词字体的大小与研究领域中关键词的频次成正比,而节点之间的连线表明两个关键词之间的关系,连线之间的粗细程度表明关键词之间关联性的亲疏程度,颜色则对应节点第一次共现的时间[7]。由此得出被引频次和中心性都比较高的节点共同构成了1998年至2016年中国体质研究领域的热点内容。
图3 中国体质研究领域关键词共现聚类视图
表5 中国体质研究领域高频及高中心性关键词列表(top 20)
通过对表5中的数据进行分析发现:中国体质研究领域高频及高中心性关键词可以分为关于研究对象的关键词和关于研究内容的关键词两类。
关于研究对象的热点关键词为“大学生”和“青少年”。“大学生”是出现频次(104次)和中介中心性(0.43)均排第1位的热点关键词。以大学生群体为研究对象的研究开始于1998年,杨秉龙在“对我校学生体质状况的调查分析”一文中对山西大学学生的体质状况进行分析并提出了相应的对策。[8]以“大学生”为关键词的研究成果在2000年到2012年期间出现的频次最多,总计达到94次,占总数的90%,其中2000-2006年成逐步上升的趋势,2006-2012年则频次逐年减少。从研究成果的内容来看,关于大学生的研究是以提高学生体质健康水平为中心而展开的,研究的热点主要集中在学生体质状况、体质健康标准、体质影响因素、体质健康促进的方法与途径四个方面。“青少年”是出现频次排名第4(为35次)、中介中心性排名第2(为0.31)的关键词,这一关键词首次出现在2002年发表的论文“1985年与2000年辽宁省学生体质健康状况比较研究”,研究发现2000年辽宁省青少年的身高、体重、胸围等形态呈增长趋势,机能、身体素质呈下降趋势,文中青少年指7~18岁的学生[9]。之后以青少年群体为研究对象的研究逐渐增加,2008到2012年间该关键词出现频次最高,共计达到21次,占到研究论文的60%。至此国内体质研究领域的研究对象逐步从以大学生为中心转向以青少年为中心。以青少年为关键词的研究成果研究的内容主要聚焦于青少年体质健康水平的促进,如付慧宇关于高中体育考试改革探析——增强青少年体质的对策研究[10],刘星亮关于运动干预对增强青少年体质与健康效果的研究[11],岳保柱关于青少年体质健康促进服务体系的若干思考[12]等。此外研究较热的人群还包括中小学生和成年人等;
关于研究内容的热点关键词中出现频次和中介中心性最高的是“体质健康”,出现频次为87次、中介中心性为0.3。“体质健康”是一个内涵比较广泛的词,出现频次排名18的“体质状况”和排名20的“健康状况”的意义都包含于体质健康状况故将这两个关键词放在一起统计分析,为了解研究中关于体质健康的具体内容,本研究通过统计1998到2016年期间发表的关键词中包含体质健康、体质状况、健康状况的所有论文发现,论文中最早出现“体质状况”关键词的论文出现于1998年,王晓春借助1995年辽宁省学生体质健康调研数据,对不同地区的中小学生体质状况进行研究。以“体质健康”、“健康状况”、“体质状况”为关键词的研究成果在2006年到2014年期间出现的频次较多,每两年共现频次都达到10次以上,从趋势来看,其共现频次1998-2008年成逐步上升的趋势,2008-2016年则频次逐年减少。它的研究主要包括以下几个方向:一是通过某一特定人群的体质测试数据与国家《学生体质健康标准(试行方案)》进行对比对这一特定人群的体质状况进行分析,如陈坚坚“杭州市成年人体质现状的调查研究”;二是对同一人群在不同时间段的体质健康状况进行比较研究,如刘志敏“1985年与2000年辽宁省学生体质健康状况比较研究”;三是对体育运动、生活方式、营养水平、经济状况、体重、食物、等因素对体质健康产生影响进行研究,如刘锦的“五项体育选项课程对促进大学女生体质健康变化的比较研究”;四是对不同人群的体质状况进行对比研究,如王小安的“湖北省汉族与少数民族大学生体质健康比较研究”;五是对体质健康标准本身的研究,如蔡忠建的“大学生体质健康指标的权系数及关联分析;”六是对国内外特殊群体的体质状况及体质健康政策等进行比较研究,如张宝强的“20世纪50年代以来美国促进学生体质健康的举措及其启示”;六是对体质健康基础理论的研究,如王健的“我国青少年体质健康测评的历史演进与生态重建——我们需要什么样的体质”。“体质健康标准”、“国家学生体质健康标准”是排名3、7的热点关键词,它的研究主要包括两个方向:一是针对体质健康标准评价指标的研究,如蔡忠建的大学生体质健康指标的权系数及关联分析;二是国内外体质健康标准的比较研究,如姜志明的“中日大学生体质与健康测试标准的比较研究”。“身体素质”、“身体机能”和“身体形态”是排名第7、14、16的热点关键词,它们都是衡量体质状况的具体指标。“体育锻炼”、“体育教育”和“体育教学”是排名第10、13、19位的热点关键词,它们是促进体质的方法、手段与途径。近年来关于体质健康促进的研究主要集中在运动和体育教育手段等方面。“体质监测”是排名第9的热点关键词,其研究的重点是体质测试的方法、测试的项目设置等。
综上所述,我国体质研究的前沿和热点主要包括体质健康状况、体质健康标准、体质健康状况指标、促进体质健康的方法与途径及体质测试的方法与项目选择。
2.2.2 中国体质研究前沿热点演化分析
为了更加有效地揭示中国体质研究热点的动态变化情况,本研究在Citespace 5.0分析软件中将网络节点设定为关键词(keyword),运行程序,绘制了1998到2016年中国体质研究热点变化的时区可视化图谱[13](见图4),时区可视图是由一系列表示时间区间的区域构成,分别按时间顺序从左向右排列,图4也显示了中国体质研究进程的主题演进路径。
由图4可知,从研究对象热点来看,中国体质研究1998年到2002年前以大学生、成年人为主;2002年开始,研究对象逐渐向青少年过渡;2010年开始出现针对国外青少年(如美国青少年、日本青少年)和针对国内90后青少年的专题研究。
图4 中国体质研究领域关键词共现图谱时间区图
从研究内容热点来看,2000年以前主要以大学生、成年人等不同人群的体质测试数据统计分析各类人群的体质状况为主,同时对促进体质状况有关的全民健身政策、体育锻炼、体育活动、体育教学、体育消费等因素也成为研究的热点。2000年以后,研究的内容逐步深入,一些衡量体质状况的指标,如身体素质、身体形态、身体机能、运动能力等针对性研究开始受到体质领域研究者的青睐;2003年开始体质健康标准开始被广泛关注,与体质健康标准相关的体质测量、体质指标、评价标准、测试项目等选题成为研究热点,同时青少年群体成为研究的主要对象。2006年开始,研究的范围开始拓展,一些关于国外体质研究的内容如体力活动等开始进入国内研究者的视野,研究成果中也开始出现针对美国青少年、日本青少年体质测试的研究内容;2011年以后,研究主题的分化加剧,研究者开始从各个视角寻求体质健康促进的办法,这一时期,出现了有的学者试图从医学的角度,运用运动干预、健康干预、体医结合、体力活动指导等理论来解决体质下滑的问题,也有的学者试图从管理的角度来解决问题,他们尝试从干预体育教学、端正体育态度、制定公共政策等途径寻求突破,还有一些学者针对体质测试中的某一专项进行了深入研究。
总之,随着时间的推移,中国体质研究的重心和热点不断变化,研究主题趋于多样化与综合化,与其它学科的交叉数据加快,与国际体质研究的融合也不断深入。