APP下载

中医药院校国自然项目数据采集分析系统构建

2021-10-19李回归蒋杰韦昌法

现代信息科技 2021年5期
关键词:中医药院校数据采集数据分析

李回归 蒋杰 韦昌法

摘  要:文章阐述了研究构建中医药院校国自然立项项目数据采集与分析系统的意義,设计并实现了项目数据采集模块、项目数据展示与检索模块、项目数据统计分析及可视化模块和后台管理模块,建立了中医药院校国自然立项项目信息数据库,并进行数据统计分析和挖掘,可以为各个中医药院校的科研管理决策提供数据支持,为广大中医药科研工作者的科研工作提供帮助。

关键词:中医药院校;国家自然科学基金项目;数据采集;数据分析

中图分类号:TP391  文献标识码:A 文章编号:2096-4706(2021)05-0157-06

Construction of Data Acquisition and Analysis System for National Natural Science Foundation Project in Chinese Medicine Colleges

LI Huigui,JIANG Jie,WEI Changfa

(School of Information Science and Engineering,Hunan University of Chinese Medicine,Changsha  410208,China)

Abstract:The significance of research and construction of the data acquisition and analysis system for the projects of Chinese medicine colleges approved by the national natural science foundation is elaborated. The project data acquisition module,project data display and retrieval module,project data analysis and visualization module,and background management module are designed and implemented,the information database of national natural science foundation projects in Chinese medicine colleges is established,and the data is statistically analyzed and mined,so as to provide data support for scientific research management decision-making of each Chinese medicine college,and provide assistance to the scientific research work of the vast number of Chinese medicine researchers.

Keywords:Chinese medicine college;national natural science foundation project;data acquisition;data analysis

0  引  言

国家自然科学基金是我国支持基础研究的主要渠道之一,旨在推动我国自然科学基础研究的发展,促进基础学科建设,发现、培养优秀科技人才[1,2]。中医药院校是我国中医药科学研究的主力军,全面分析研究中医药院校的国家自然科学基金项目(以下简称:国自然项目)立项情况,可以为各个中医药院校的科研管理工作提供决策支持,促进中医药事业的发展。因此,笔者研究构建了中医药院校国家自然科学基金立项项目(以下简称:国自然立项项目)数据采集与分析系统,建立中医药院校国自然立项项目信息数据库,对立项项目数据进行分析挖掘,以帮助中医药科研工作者快速了解行业科研热点和趋势、高效开展科研工作。

1  研究构建中医药院校国自然立项项目数据采集与分析系统的意义

为了推动我国科学技术进步、提高国家综合竞争力,党中央、国务院在1986年成立了国家自然科学基金委员会,设立了科学基金[1]。国家自然科学基金如今已经成为我国资助高水平基础研究和应用基础研究的主要渠道之一,它对人才培养、学科建设以及科研水平的提高都具有重要的促进作用[2]。一个地区或单位获得国家自然科学基金资助的数量和级别是衡量其科技创新能力的重要指标之一。医学类国自然项目立项数据已经成为衡量国内各大医学科研院所科研实力的重要指标,分析这些数据有助于科研工作者了解当前的医学科研热点、预测未来的医学科研发展趋势[3]。

目前,已有一些研究者对中医药院校国自然项目申请和立项情况进行分析研究。例如,张盈对南京中医药大学“十二五”期间国自然项目获资助情况进行了分析,探索该校基础研究发展的上升空间,为科研管理规划工作提供数据支持[4]。裴刚总结了2016年国家自然科学基金中医方剂学方向的项目申请与资助情况,对申请项目进行了评述分析[5]。郑绍勇对1986年至2016年间获得立项的中医舌诊相关国自然项目进行了统计分析,为中医舌诊研究提供了参考依据[6]。朱正刚分析了2016年至2018年中医学学科国自然项目获资助情况,探讨了该学科领域的国自然项目立项趋势,为相关研究者开展选题和项目申报提供了参考依据[7]。

但是,上述研究只是对某个单位(或方向)的某一年度(或某些年度)的国自然项目立项情况进行分析,数据不全面、欠缺代表性,而且只是进行了简单的统计分析。因此,本文研究构建中医药院校国自然立项项目数据采集与分析系统,建立中医药院校国自然立项项目信息数据库,全面统计各个中医药院校历年的国自然立项项目数据,并分析其走势,通过数据来说明各个院校的中医药科学研究发展情况,揭示各个院校的优势研究领域。对各个中医药院校国自然项目立项数据进行对比分析,揭示各个院校的科研水平差异,可以为各个院校的科研管理决策提供数据支持。对中医药院校国自然立项项目历年的项目名称等信息进行词频分析,发掘其中的高频词汇,揭示历年中医药科学研究的热点,并通过可视化技术将结果直观展示,可以为广大中医药科研工作者的科研工作提供支持。

2  中医药院校国自然立项项目数据采集与分析系统的设计

中医药院校国自然立项项目数据采集与分析系统利用网络数据采集技术对各个中医药院校历年的国自然立项项目数据进行采集,存入项目信息数据库,提供根据项目批准号、项目名称、项目类别、项目负责人、依托单位、批准年度和项目申请代码等条件对项目信息进行检索的功能,对各个中医药院校历年的立项项目数、获资助金额、获资助率和项目关键词等数据进行统计分析和挖掘,并通过可视化技术将分析结果直观地展示给用户。

中医药院校国自然立项项目数据采集与分析系统可分为四个主要模块:项目数据采集模块、项目数据展示与检索模块、项目数据统计分析及可视化模块和后台管理模块,系统功能模块图如图1所示。

项目数据采集模块负责利用网络数据采集技术从国家自然科学基金网络信息系统、国家自然科学基金共享服务网和LetPub国家自然科学基金项目查询系统等平台上采集各个中医药院校历年的国自然立项项目数据,包括项目批准号、项目名称、项目关键词、项目类别、项目负责人、依托单位、批准金额、批准年度和项目起止时间等信息,将采集到的数据根据自定义字典格式存储到数据库中,建立中医药院校国自然立项项目信息数据库。

项目数据展示与检索模块负责通过Django视图层中的HTML网页文件显示各个中医药院校的国自然立项项目数据,支持用户根据项目名称、项目批准号、项目申请代码、项目批准时间、项目类别、项目负责人和依托单位等条件对项目数据进行检索。当用户输入检索条件后,系统前端将数据提交给后端,根据输入的检索条件进行数据检索。系统随后将检索结果返回给前端页面,对结果进行分页展示,用户可以根据需要查看项目的详情。

项目数据统计分析及可视化模块负责对项目数据进行统计分析和可视化处理,并将分析结果直观地展示给用户。系统默认显示所有中医药院校历年的国自然立项项目数据统计分析结果,用户可以对院校信息和年份信息进行选定,系统前端将用户选定的信息传给系统后端。系统后端将根据用户所选定的不同信息对所有中医药院校某年份的项目数据、某所中医药院校历年的项目数据、某所中医药院校某年份的项目数据进行统计分析,接着将分析结果封装成JSON数据格式传送到系统前端,并通过Echarts图表向用户进行可视化展示。

后台管理模块提供了一些系统配置信息管理功能,例如申请代码管理和关键词管理功能,以便为系统的项目数据检索和统计分析等功能提供基础数据支持。此外,后台管理模块还提供了用户信息管理功能。

3  中医药院校国自然立项项目数据采集与分析系统的实现

笔者根据上述系统设计方案,采用Python编程语言开发实现了中医药院校国自然立项项目数据采集与分析系统,成功采集了各个中医药院校的国自然立项项目数据,建立了中医药院校国自然立项项目信息数据库。下面将对系统的项目数据采集模块、项目数据展示与检索模块、项目数据统计分析及可视化模块和后台管理模块的实现进行详细介绍。

3.1  项目数据采集模块的实现

项目数据采集是本系统最基础的功能,采集工作的基本流程是:访问提供国家自然科学基金项目信息查询功能的网站,获取要采集的项目信息所在的URL地址并查看其变化规律,查看网页数据结构、获得对网页进行解析时要获取的数据的路径,通过Request的get方法获得网页数据,然后通过BeautifulSoup从得到的数据中提取出文本数据并进行数据摘取,最后对数据进行字典封装并存入数据库中。

3.2  项目数据展示与检索模块的实现

系统完成中医药院校国自然立项项目数据采集后,即可通过项目数据展示与检索模块将项目信息展示给用户。用户还可以根据自己的需求设置项目信息检索条件进行项目检索,图2显示了用户检索“申请代码”为“H27(中医学)”的项目信息后系统返回的检索结果,用户可以点击项目标题超链接以进一步查看某个项目的详情。

3.3  项目数据统计分析及可视化模块的实现

系统分别从各个中医药院校历年的国自然项目立项情况、各个中医药院校某年份的国自然项目立项情况、某所中医药院校历年的国自然项目立项情况和某所中医药院校某年份的国自然项目立项情况这四个方面进行了统计分析。

3.3.1  各个中医药院校历年的国自然项目立项数据分析

图3显示了各个中医药院校历年的国自然项目立项数据统计结果,从图中可以看出上海中医药大学、北京中医药大学、广州中医药大学和南京中医药大学历年获得立项的国家自然项目数明显高于其他中医药院校,这一情况印证了这4所院校的科研实力在各个中医药院校中名列前茅。此外,从图3中还可以看出广西中医药大学和江西中医药大学历年获得立项的国自然项目数也较多、且高于与它们同层次的中医药院校,这与广西和江西可以申请地区科学基金项目有关。图4显示了各个中医药院校历年的国自然立项项目关键词词云图及数据视图,从图中可以看出各个中医药院校历年在中医药作用机制研究、通路调控机制研究、干预机制研究等方面获得立项的项目较多。

3.3.2  各个中医药院校某年份的国自然项目立项数据分析

图5显示了各个中医药院校2018年的国自然項目立项数据统计结果,从图中可以看出上海中医药大学当年的立项数为138项、居中医药院校之首,立项数超过70项的院校还有南京中医药大学、广州中医药大学和北京中医药大学。图6显示了各个中医药院校2018年的国自然立项项目关键词词云图及数据视图,从图中可以看出各个中医药院校当年在通路调控机制研究方面获得立项的项目较多。

3.3.3  某所中医药院校历年的国自然项目立项数据分析

图7显示了湖南中医药大学历年的国自然项目立项数据统计结果,从图中可以看出湖南中医药大学自2012年起获得的国自然立项项目数有大幅提升,这得益于该校加大了科研投入、完善了科研绩效奖励机制、大大提升了研究人员的科研积极性。图8显示了湖南中医药大学历年的国自然立项项目关键词词云图及数据视图,从图中可以看出湖南中医药大学在脑缺血、补阳还五汤等方面进行的研究较多。

3.3.4  某所中医药院校某年份的国自然项目立项数据分析

图9显示了湖南中医药大学2018年国自然项目立项数据统计结果,从图中可以看到该校当年获得面上项目21项和青年科学基金项目12项。图10显示了湖南中医药大学2018年国自然立项项目关键词词云图及数据视图,从图中可以看出湖南中医药大学当年在通路调控机制研究方面获得立项的项目较多,与当年各个中医药院校获得立项的项目特点一致。

3.4  后台管理模块的实现

系统的后台管理模块提供了申请代码管理、关键词管理和用户信息管理等功能。

申请代码是国自然立项项目的重要信息,在对项目信息进行检索时申请代码是一个重要的检索字段。为了便于用户进行检索,系统会将申请代码的所有可选值初始化在项目检索界面的申请代码下拉列表框中。申请代碼管理功能主要用于将国家自然科学基金委员会规定的申请代码导入到系统中并显示于项目信息检索界面,具体方案为:访问国家自然科学基金管理信息系统项目检索页面,将申请代码选择框的文本数据复制到文本文件中,接着对数据进行规范化处理,再编写代码读取申请代码数据并按指定格式存入数据库中,系统最终从数据库中获取申请代码数据并显示于系统前端。

关键词也是国自然立项项目的重要信息,在对项目数据进行统计分析及可视化时需要使用关键词数据。关键词数据的来源主要有两个,其一是前期通过数据采集技术获得的国自然立项项目数据中的关键词字段,其二是系统通过分词技术从国自然立项项目名称中抽取出来的关键词。系统的关键词管理功能负责对这些关键词数据进行维护管理。

用户信息管理功能主要实现对用户信息进行增加、删除、修改和查询操作,系统可以基于用户的学校等信息生成个性化的国自然立项项目数据列表并通过邮件推送给用户,使用户可以快速获取其感兴趣的国自然立项项目数据。

4  结  论

本文分析了研究构建中医药院校国自然立项项目数据采集与分析系统的意义,对该系统进行了设计与实现,建立了中医药院校国自然立项项目信息数据库,对系统的项目数据采集模块、项目数据展示与检索模块、项目数据统计分析及可视化模块和后台管理模块进行了详细介绍。通过对中医药院校国自然立项项目数据进行统计分析和挖掘,可以为各个中医药院校的科研管理工作提供决策依据,帮助中医药科研工作者快速了解行业科研热点和趋势、高效开展科研工作,促进中医药事业的发展。

参考文献:

[1] 国家自然科学基金委.机构概况 [EB/OL].(2016-11-07).http://www.nsfc.gov.cn/publish/portal0/jgsz/01/.

[2] 李静海.国家自然科学基金支持我国基础研究的回顾与展望 [J].中国科学院院刊,2018,33(4):390-395.

[3] 宋芳,张淋坤,沈军.某医院国家自然科学基金申报情况及对策分析 [J].现代医院管理,2018,16(1):60-62.

[4] 张盈.南京中医药大学“十二五”国家自然科学基金资助情况分析 [J].江苏科技信息,2016(35):72-74.

[5] 裴刚,何伟明,黄凤,等.2016年国家自然科学基金中医方剂学项目申请、受理与资助情况评述 [J].湖南中医药大学学报,2017,37(1):79-82.

[6] 郑绍勇,孙悦,丁成华.中医舌诊项目的国家自然科学基金资助情况分析 [J].中华中医药杂志,2018,33(7):3027-3030.

[7] 朱正刚,尹雨晴,潘晓彦,等.2016-2018年国家自然科学基金中医学学科项目资助概况及热点分析 [J].中国中医药信息杂志,2020,27(1):98-102.

作者简介:李回归(1997—),女,汉族,湖南益阳人,本科在读,研究方向:中医药信息管理;蒋杰(1997—),男,汉族,湖南娄底人,本科在读,研究方向:中医药信息管理;通讯作者:韦昌法(1982—),男,壮族,广西巴马人,副教授,博士研究生在读,研究方向:中医智能辅助诊疗。

猜你喜欢

中医药院校数据采集数据分析
以供给侧改革为引领,提升中医药院校人才培养质量
中医药院校师生关系影响因素的年级差异研究
西南边疆高等中医药院校硕士研究生就业状况分析及对策
基于广播模式的数据实时采集与处理系统
通用Web表单数据采集系统的设计与实现
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于开源系统的综合业务数据采集系统的开发研究
中医药院校信息管理与信息系统专业实践教学改革