APP下载

大数据背景下外科学专业学位研究生临床课题研究思路与指导

2021-04-08王晓楠陶润仪王芝馀温小鹏王健生付军科张广健

医学教育研究与实践 2021年2期
关键词:导师研究生数据库

张 佳,王晓楠,陶润仪,王芝馀,温小鹏, 王健生,付军科,张广健

(1.西安交通大学第一附属医院胸外科,陕西 西安 710061 2.西安医学院护理学院,陕西 西安 710021)

大数据时代的到来催生了多个领域的发展,它能够将方方面面的信息进行数据化,使人们的生活变得快捷方便。面对具有容量大(volume)、运算速度快(velocity)、多样性(variety)以及真实性(veracity)等特征的大数据,研究生的教育迎来了巨大的挑战及机遇。近年来,多位学者[1-3]指出大数据平台的建设是完善研究生教育的重要途径之一,且在多个学科领域已在探索及应用[4],而医学研究生作为高层次、高素质、高水平的研究生,不仅要培养其高超的医学技能及道德品行,更要根据时代的变化使其掌握更多学习知识的途径及信息处理的能力。目前,国内外对于医学研究生应用大数据的研究多为经验性的总结及理论上的指导[5-8],实际性的推广应用相对缺乏。本项目组通过近几年的探索,将前期总结的经验应用于外科学专业学位的研究生,追踪并比较其研究生取得的成果,以对临床研究生课题研究思路进行准确的把握,对研究生教育应用大数据进行深入的洞察,并为今后的大数据应用提供数据支撑[9]。

1 对象及方法

本研究以西安交通大学第一附属医院为研究地点,采用分层抽样的方法在胸外科、乳腺外科、普外科、肿瘤外科、肝胆外科及血管外科各随机抽取5名外科学专业研究生,共30名。将30名研究生随机均分为两组,一组为干预组,干预组进行经验推广,另一组为对照组。

2 研究方法及结果

2.1 经验推广

2.1.1 鼓励导师提高自身大数据挖掘能力

导师在研究生的学业方面承担着非常重要的地位,研究生课题的选择及成果产出均与导师的指导有着密不可分的关系。因此,在对研究生进行临床课题研究思路与指导的同时,更要注重对导师提高自身挖掘大数据的鼓励。 导师应该掌握大数据科研方法,积极寻找大数据与自身所研究课题的结合点,关注国内外大数据研究的最新动向。具体方式表现为:①鼓励导师参加针对大数据方向的学术讲座,学习大数据方面的研究动向及前沿知识。②积极学习进行大数据处理的处理思路并掌握涉及大数据研究的统计学工具,例如Pathon软件、R包等。③使用大数据思维设计课题并能够将自身课题与大数据领域相结合。

在汲取大数据知识的同时,导师应该充分地对知识进行筛选及分类,从而帮助学生快速有效地获取对自己课题有帮助的大数据模型。例如,在庞杂的R包中,导师能够筛选出符合自身需要且是便捷而可用的R包,经学习后,能够为学生演示并进行讲解。此外,导师可通过网上公共平台进行大数据方向的信息吸纳,提高自身接受大数据知识的能力,从而更好地指导学生。

2.1.2 提高研究生利用医学数据库的能力

充分利用数据进行决策是大数据时代研究生教育的优先行动计划[10],也是我国大数据时代背景下进行研究生教育改革的必然路径。医学研究生常用的数据库包括经典的PUBMED数据库以及GEO,Oncomine,SEER,TCGA,Genecard以及Protein Atlas等数据库。其中,基因表达数据库(Gene Expression Omnibus, GEO)隶属于NCBI,是目前最全面、最大的公共基因表达数据库,包括有杂交膜(filter)、高密度寡核苷酸array(HAD)和SAGE等许多类型的基因表达数据。指导研究生利用未被充分利用基因芯片的数据进行分析,开展课题研究。Oncomine是TCGA、GEO、ArrayExpress等数据库经过一系列程序转化后而形成的肿瘤方面的生物学信息数据库。通过对研究生挖掘数据库能力的培养,开拓其临床思维模式。SEER(Surveillance,Epidemiology and End Results)数据库于1973年由美国国立癌症研究所(National Cancer Institute,NCI)所建立。它收集了大量关于肿瘤循证医学方面的数据,通过在线注册并获得其权限,临床医师及相关研究人员可根据需要进行生存率、死亡率、患病率以及建立肿瘤预测模型等相关研究。美国癌症研究所 (National Cancer Institute, NCI) 及人类基因组研究所(National Human Genome Research Institute, NHGRI)联合建立了TCGA数据库,该数据库涉及转录组学、蛋白质组学以及基因组学,表观基因组学等方面的数据,存储的数据量超过了2.5PB,为外科学专业的学者及研究生进行DNA甲基化、原始测序数据、CNV等肿瘤方面的研究提供了大量的数据支持。此外,我们还充分利用医院数据库及公司数据库为研究生提高选择平台。研究生可在设计外科学临床课题时,通过所在医院电子病历系统进行资料的检索,根据研究目的对数据进行筛选并进行相应的分析,最终得出研究结果。另外,有好多公司也建立了临床研究数据库,其中LinkDoc(零氪科技)不仅收集了我院肿瘤科室及多数外科科室的临床数据,也与全国多家医院的肿瘤科室进行广泛而深入的合作,研究生可利用这种平台进行入住我院患者的外科学临床研究,也可以通过授权进行多中心的胸外科临床研究。

2.1.3 提高研究生处理数据的能力

在庞大的数据库中快速筛选出有用的信号能够节省研究生大量的时间,提高研究生科学研究的自信心。因此,提高研究生利用计算机进行数据处理的能力对其课题的进展至关重要。培训小组在前期通过线上分享办公软件、分析数据软件等教学视频,使得研究生能够学习使用EXCEL,SPSS,Treeview等软件,同时,在每一次的培训开始前,对研究生使用软件的熟练程度进行评价,确保其能够熟练地使用该类软件。此外,督促研究生学会利用网上数据库提供的在线分析功能快速准确地分析数据,并将数据结果进行展现。

2.2 定期培训

项目组成员首先经过前期知识及技能培训并通过提取数据及数据分析等实践考核。其次,确定每次开展培训班的主题及培训员,培训班开展的频率维持在每月至少一次。培训班从“大数据时代如何利用临床数据”的角度出发,内容涵盖大数据时代临床研究策略、临床研究选题、研究方案设计、数据分析和论文发表等方面,主旨是将临床和科研进行更好的结合,提高临床工作者的临床研究水平。同时,建立组会制度,每周三进行汇报及答疑。此外,我院较早地成立了临床研究中心,临床研究中心会定期举办临床研究骨干初、中级培训班,鼓励研究生进行参加,并在组会上进行汇报。

2.3 研究结果

2019年9月-2020年9月将以上经验进行推广,并将经验成果应用于15名临床研究生,收集干预组与对照组的临床研究生论文发表、专利成果等科研相关成果取得情况。2020年因疫情影响,无法进行线下的培训及组会安排,期间组建微信群进行随时沟通,启用微信公众号进行科研拓展,并通过腾讯会议进行线上培训及组会交流,并对研究生的课题进展疑问进行解惑。对数据进行分析后,结果显示干预组相较于对照组,发表论文数量差异具有统计学意义(χ2=6.694,P=0.035),发表专利数量无统计学意义(χ2=0.536,P=0.4464),如表1所示。

表1 经验推广组与未进行经验推广组之间研究成果的比较

3 讨论

大数据时代使得信息的传递及共享更加便捷,且在医学领域中应用是具有可行性的。本次实验结果显示进行经验推广组的研究生相较于未进行推广的研究生,其研究生成果更为丰硕,说明应用大数据具有可行性,这与Vérène Dougoud-Chauvin[10]等人在TCC数据库中匹配社区癌症患者的临床病例,并对符合条件的癌症患者进行老年咨询的结果一致。肖连杰等人[11]通过对学位论文数据库—ProQuest Dissertations & Theses(PQDT)博硕士论文文摘库对国外情报学研究生学位论文进行数据处理。结果发现,健康信息与生物科学研究、交叉学科研究以及大数据技术与信息安全研究已经成为研究热点。因此,在医学领域中应用大数据具有一定的探索性及研究价值。

本次研究结果发现,应用医学大数据对于提高研究生的研究成果具有一定的意义。国内研究结果显示,研究生通过挖掘海量的数据库,能够提高其自学能力及科研效率,即使不用去实验室,也能写出高质量的文章,且在挖掘及分析数据的过程中,其科研逻辑思维也被培养。Christos Vaitsis[12]通过对医学教育的可视化分析结果显示,大数据为医学教育提供了新的工具及研究方向。李珍艳[13]等人基于大数据的博士学位攻读年限监测预警分析结果显示,博士学位论文水平随着学习年限的延长呈下降趋势,且博士生延期完成学业的影响因素包括导师指导方式、论文选题工作及科研成果发表要求等制度因素。因此,提高导师大数据科研能力,应用大数据平台为研究生提供更多的论文选题,对研究生培养质量的提高有一定的促进。

研究生的科研能力和创新能力在一定程度上能够反映高校教育及学术的水平,而研究成果是体现科研及创新能力最直接的指标。因此,可通过研究生的成果输出量来评估研究生教育的水平高低。赵靖[14]等人通过对影响研究生教育质量的潜在因素进行分析,并将潜在因素进行有序 logistic 回归模型分析。结果显示,在研究生层面,志向继续深造是最显著的影响因素,其个人学术产出是没有继续深造志向学生的25.8倍。在导师层面,是否有国家/省部级项目对研究生成果具有相当大的影响。因此,在探索应用大数据的时候,应鼓励研究生继续深造学习及挖掘相关数据,同时,导师应充分学习,为学生树立榜样、言传身教,并争取更多的纵向项目为学生的科研提供有力的经费支持。

大数据为我们带来新方向的同时,其所带来的风险性也应值得我们关注,尤其是患者的隐私更应是我们医疗卫生工作人员所需保护的。针对医疗大数据所带来的隐私及风险性,廖伊婕[15]等人的研究结果从技术及管理两个方面给出了用户隐私保护体系。包括健全保护隐私及数据的法律、法规,建立保护隐私防止数据泄露的评估机制,对数据的使用进行规范化,加强数据管理人员的自律性。同时,提高数据进行彻底销毁的技术,加强保护数据及隐私的技术。从而能够切实保护好患者及受试者等相关人员的隐私。

本次研究结果存在一定的不足,临床研究生所发表的核心期刊相对较少,可能与研究生要兼顾临床实习有关,也可能与研究生在校时期较短,培训时间有限,研究周期较短,所学习的大数据内容不够深刻且全面有关。且因受疫情所影响,线上进行培训及交流的效果与线下所形成的效果对比仍待后期研究。在今后的研究中,将会适当增加研究时间,例如选择硕博连读的研究生等。同时,也会针对2020年度新型冠状病毒疫情进行总结,为今后的线上培训总结经验。

《国家中长期教育改革和发展规划纲要(2010—2020年)》提出要发展每一个学生的优势潜能,而大数据平台的应用提高了研究生的社会适应性及学术创新性,使研究生的培养呈现多向性。因此,在研究生的培养过程中应用医学大数据,对研究生培养质量的提高具有重要意义。

猜你喜欢

导师研究生数据库
中南大学教授、博士生导师
V eraW an g
伍小东研究生作品选登
蔡智及其研究生作品选登
沈铭存研究生作品选
数据库
数据库
数据库
数据库
和谐秘诀