中医古籍科研团队识别与分析*
2023-02-22齐静王强
齐 静 王 强
(辽宁中医药大学图书馆,辽宁 沈阳 110000)
中医药是中华文明的瑰宝,传承精华、守正创新是中医药事业发展的动力源泉。《中华人民共和国国民经济和社会发展第十四个五年规划和二〇三五年远景目标纲要》中明确指出要传承弘扬中华优秀传统文化。在国家层面政策支持下,中医药科学领域专家学者更是致力于中医经典古籍文献的研究。在大科学时代,科研团队往往引领学科发展态势。中医古籍文献的研究需要关注领军科研团队,国家层面政策的制定与调整更需要紧跟科研团队及其科研项目。
笔者利用作者合著关系构建合著网络,从中心性分析、派系分析角度发现中医古籍的科研团队以及核心人物;网络调研作者之间社会关系并构建社会关系网,从社会学观点比较分析合著网络和实际社会关系网络;分析中医古籍科研领域的合作模式。
1 相关研究现状
科研团队是以科学技术研究与开发为内容,由为数不多的技能互补、愿意为共同的科研目的、科研目标和工作方法而相互承担责任的科研人员组成的群体[1]。科研团队成员之间拥有相近的科研兴趣,能够在同一研究领域共享信息和研究成果,为共同的科研目标协同配合。科研团队的成员人数一般在5-20人之间[2]。从人员组成看,科研团队内常由具备丰富科研经验的学科带头人,以及具有跨学科背景的人员组成。科研目标不同,科研团队的规模和类型也有所差别[3]。科研团队是知识密集型群体,具有科研目标明确、团队合作规则隐性、团队知识共享等特点。
传统科研团队的识别主要通过问卷调查、专家访谈等方式[4]。随着科研环境的变化,专家认为发现隐性的科研团队并对其进行计量分析非常有价值[5]。社会网络分析法的快速发展,为识别科研团队提供了新思路。从数据获取来看,通过数据库获得的作者合著信息[6]、关键词与作者耦合信息[7-8]、引用与被引信息,以及网络中获取的链接信息都可以建立科研专家之间的网络关系,从而识别出科研团队。从研究内容来看,主要有两方面的内容,一是识别不同学科领域科研团队的研究,如人工智能[9]、管理科学[10]、情报学[6]、肿瘤学[8]、护理学[11]等领域;二是改进科研团队发现算法的研究,如构建论文与作者的向量空间[12];引入论文权重因子,建立计算量化论文质量的权重因子和链路权值的数学模型[13];利用合著次数、合著人数、作者排名、被引频次等要素构建一种综合性的合著网络加权模型[14]等。
科研领域中,作者之间的合著关系网络数据应该属于多值无向网络。每位作者都是网络的节点,连接各个节点的边就是作者之间的合著关系值。Newman[15]构建的合著关系矩阵仅考虑了合著次数;朱丽娟[16]将作者在文献中的排名、是否为通讯作者等因素考虑在内,利用作者对文档的贡献度矩阵计算出了作者之间的相似度矩阵;李纲[8]则综合了合著强度、作者贡献度和合著影响力构建出了作者合作关系矩阵。任妮[17]针对以上提出的基于加权要素的算法进行了比较研究,结果发现不同加权要素的选择对点度中心性和核心-边缘结构影响明显,对网络图形的结构没有影响。尽管学者对于作者合著关系网络的构建进行了各种尝试,却始终缺少将作者之间产生合著的社会因素考虑在内。
2 研究设计
2.1 技术路线
笔者采集了中国知网的文献数据,利用Python程序进行数据清洗,计算作者之间的合著关系矩阵,选取社会网络研究工具Ucinet6作为合著关系网络研究指标计算的主要工具,同时利用该软件集成的NetDraw实现分析数据可视化展示,流程如图1所示。
图1 中医古籍科研团队发现流程
2.2 数据获取
笔者采用中国知网、维普、万方数据库的数据分析,这3个数据库对国内各学科最新的科研成果报道及时,是研究中医古籍科研领域较理想的数据采集库。采用SU=(′中医古籍′+′医史学′+′古籍图像′+′传统医药′+′黄帝内经′+′神农本草经′+′本草纲目′+′内经图′+′东医宝鉴′+′中医药传统知识′+′古籍善本′+′医学经典′+′古医籍′)检索式进行专业检索,时间范围为数据库收录起始年至2021年12月31日,去除重复数据后共检得17745条文献(见图2)。
图2 相关论文历年发文量
2.3 数据清洗
识别科研团队首先需要对机构数据和作者信息进行消歧,从采集到的数据集中提取出准确的作者信息,因此需要剔除缺少作者和机构信息及其他非相关文献。对机构信息的清洗,采用迭代的方法统一相同机构名称。统一不同时期机构的名称,合并机构下属不同部门,并进行人工复查。作者姓名不存在全称与缩写的“异形同义”但存在重名的情况,需借助机构信息来消歧,从原始数据中抽取作者姓名和机构信息,利用机构信息识别重名作者。
3 实例分析
3.1 概况分析
3.1.1 科研机构分析
中医古籍研究领域内研究机构共有468家,分别为中医药类科研机构、高校、医院、中医药类协会等,表1为部分机构列表。中国中医研究院中医药信息研究所和中国中医科学院中国医史文献研究所在中医古籍研究领域优势明显;紧随其后的是中医药类高校,其中包含6所一流学科建设高校;此外中医类医院也涌现出大量中医古籍领域的科研人员。
表1 拥有作者数量排名前15家机构列表
3.1.2 合著关系网络分析
经统计,在中医古籍文献中共抽取作者2473位,其中有743位作者与其他作者无合著关系,此类作者不属于任何科研团队;1516位作者仅发表了一篇文献,他们往往不是第一作者或通讯作者,对科研成果贡献较小;即使是第一作者或通讯作者,也是该研究领域的新进作者。Glanzel[18]认为分数计数法更能发现网络中的簇群,故采用分数计数法计算相关性。如果一篇文章有n位作者,则任意两位作者之间的相关系数就为利用自行开发的Python程序计算得到作者的合著关系矩阵,构建作者属性信息,将其导入NetDraw绘制作者合著关系网络图。根据作者节点的属性信息设置不同符号和颜色加以区分,节点连线设置4种粗细效果展示强弱关系。图3展示了部分专家的合著关系网络。科研机构内部合著关系网复杂且规模庞大,高校、中医医院的研究团队相对分散,同一机构往往拥有多个“小团体”科研团队,关系网呈现为完备网络。合著关系多建立在机构内部,跨机构合著相对较少。
图3 部分合著关系网络
3.2 中心性分析
中心性分析能够发现居于网络中心、对资源具有控制力且不易被其他作者影响的科研团队领导人[19]。中心性分析可分为点度中心性分析、中间中心性分析、接近中心性分析。将作者从A1-A214进行编号,所属机构从O1-O56进行编号,具体分析如下。
3.2.1 点度中心性
点度中心性能体现网络节点与其他点发展直接交往关系的能力,可分为绝对中心度和相对中心度[20]。表2为部分作者点度中心性列表,同一局部网络中会出现多个中心性值高的点,即同一科研团队中存在多个作者与其他作者直接关系较多,这些作者在团队中的地位和影响力接近。同一机构节点之间点度中心性的值差距不大,但不同机构间的差距明显。前40位作者分属13个机构,分别位于北京、山东、江苏等10个省份,地域分布较均匀。
表2 部分作者点度中心性列表
3.2.2 中间中心性
弗里曼(Freeman)认为处于多人中间位置,为群体内部建立“桥梁”而起到中介作用的人,可以通过控制或者曲解信息的传递而影响群体。中间中心性测量的是行动者对资源控制的程度。经计算合著网络的标准化中间中心势的值比较高为1.08%,说明整个合著网络具有较明显的集中趋势。表3列举了部分作者的中间中心度的值,机构O53在中医古籍科研领域占有绝对的优势,机构内部作者对团队内部资源的控制能力差别较大,团队内部呈现层次明显的等级差别。其余中间中心度值逐渐下降,影响力相对较小。
表3 部分作者中间中心性列表
3.2.3 接近中心性
接近中心性关注点在传递信息方面的能力,居于网络中心的点具有较高接近中心度。表4为部分作者接近中心性列表,结合前述合著网络关系可知,中医古籍领域科研团队大多为分散的小团体,故大部分作者接近中心性相对较低,机构O53的科研团队规模较大,其核心学科带头人接近中心性较高。
表4 部分作者接近中心性列表
3.3 凝聚子群分析
凝聚子群分析能够找到网络中与学科领导人具有高度凝聚性的团队成员。凝聚子群是一个行动者之间具有相对较强、直接、紧密、经常的或者积极的关系的集合。其内部关系相对稳定、人数不多、具有共同的科研目标、信息共享等特点。根据合著网络特点,笔者利用n-派系进行凝聚子群分析。
Ucinet可以间接地计算出多值关系的网络派系。首先需设定作者之间关系阈值C,然后进行二值化处理,得到二值数据矩阵进行派系分析,即可得到不同C值下的n-派系结果。为寻找最佳C值,分别以合著关系值的中位数、平均值、标准差、上四分位、下四分位值为C值进行派系分析。结合前面中心性分析的结果,找到最佳的C层次派系分析结果。
临界值C的取值越高,划分出的派系就越少,子群的凝聚力就越强。由划分的派系来看,临界值分别取标准差、0.3、中位数、平均值时的派系划分结果大体相同,当临界值C取值0.45、0.67619时派系内凝聚力增强,但是派系数量急剧减少。综合中心性分析的结果,可以得到中医古籍科研领域的科研团队。
图4 部分n-派系分析结果列表
4 我国中医古籍科研团队分析
4.1 中医古籍科研团队现状
目前我国该领域科研团队整体分布较分散,中国中医科学院中医药信息研究所和中国中医科学院中国医史文献研究所实力雄厚,其合著关系网络庞大且复杂;高校、中医医院等机构合著关系网络大多成零星散状,多为小规模团队。所有古籍科研团队中规模最大为27人,规模在5~10人的科研团队数量约占总数的2/3,其余为2~4人的小团体。表5展示了部分机构的部分科研团队(不代表该机构的全部科研团队)。
表5 部分科研团队列表
4.2 实际社会关系网络分析
科研领域网络是由科研工作者及其间关系构成的网络集合。有学者利用社会网络分析法识别科研团队,将每个科研工作者视为“行动者”而非“能动者”。仅关注作者节点的一般属性,忽视其“主观能动性”是不科学的。每位科研人员有自身的“主观能动性质”,包括具体和抽象两种类型的性质,具体性质包括性别、年龄、学历、职业、经济收入等;抽象性质则指个人的社会价值取向、性格特点、内在科研动力及潜力等。表面上的合著关系不能反映其背后蕴含的多种“文化”要素。学术关系产生的深层次原因,可能与科研人员的社会地位、职务、专业技能等因素有关。故笔者采用实在论(realist)来探讨科研领域网络中实际存在于科研人员之间的关系。
笔者选取中国中医科学院中医药信息研究所的科研团队为例进行网络调研,寻找团队成员之间的实际社会关系,以比较分析社会实际关系网络和合著关系网络。重点调研的社会关系有师生关系、同师门关系、同事关系、上下级关系、发文署名喜好等。根据专家意见赋予不同的关系系数值,若存在两种以上的关系,关系值为每种关系系
数之和,据此构建出社会关系网络矩阵。将社会关系矩阵转化为Ucinet文件,导入NetDraw绘制出作者社会关系网络图,节点标示大小表示作者点度中心性大小。
图5 社会关系网络与合著关系网络比较
从中心性来看,两种网络的显示结果基本一致,利用社会网络分析法研究作者合著网络能够较准确地找到科研团队核心人物。崔蒙、李敬华等人点度中心性较高,居于关系网络中心,具有一定影响力。从网络关系来看,两种网络的关系连接大体相同,但略有差别。采集样本的特殊性,导致合著关系网络不能完全反映作者之间的实际社会关系。在各种社会因素的影响下,社会关系密切的作者也可能科研合作相对较少。
4.3 中医古籍科研团队合作模式分析
中医古籍科研合作网络是一种复杂的异构叠加网络,是科研人员的社交网络、知识网络交织叠加的多维关系网[21],具有明显的小世界网络特征[22](见图6)。科研人员之间的知识网络可以通过构建合著关系网络,寻找网络节点与边等要素的规律而揭示;从社会网络研究中的实在论出发[23],要揭示社交网络则需要构建科研人员之间的实际社会关系网络。知识网络主要由信息、学科背景、技术水平、学术能力、知识储备等要素组成;社交网络则主要由工作社交、师门社交、私人关系、科研社交等要素组成。知识网络与社交网络不是完全分裂的两部分,而是相辅相成的关系。在知识网络中能够获得最新信息、知识储备强大、掌握最新科研技术的人,在社交网络中也具有绝对的话语权;相反,在社交网络中活跃的人,也能够及时获取最新信息,通过社交运作将有利于自身科研发展的最新技术等要素向着利己的方向运动。
图6 中医古籍科研合作网络
中医古籍科研领域科研合作模式主要有层级型、多点共中心型、共用点交叉合作型3种。
(1)层级型。层级型主要体现在同师门之间或上下级关系中,成员之间的话语权呈现自上而下的垂直流动模式。领军人物在知识网络中占有更多的信息,具有强大的学科背景及知识储备,学术科研能力强,掌握先进的科研技术及设备,位于最顶层;中间层人员为科研团队的核心成员,是科研团队的主要力量,同时也扮演“中间人”的角色,控制着底层人员和领军人物之间的交流;底层人员在科研团队中影响力最低,负责团队基础工作。
(2)多点共中心型。中医古籍科研领域大多合作模式为多点共中心型,成员之间在科研团队中地位相当,每位成员都有自己的优势,但相比学科领军人物,他们在科研能力、知识储备、占有的技术设备等方面存在不足,因此需要寻找实力相当、优势互补的人合作,以增加科研产出。多点共中心型具有“去中心化”的特征,成员规模较小。
(3)共用点交叉合作型。两个科研单位之间,通过一个共用交点形成的跨机构交叉合作模式。在科研单位内部的合作模式一般为多点共中心型,两个科研机构中间有一个“中间人”,此人在两个机构科研合作中至关重要,掌握两个机构间的所有交流信息及话语权,在跨机构合作交流中积极活跃。