APP下载

医工结合背景下数据科学能力培养模式探索

2023-04-27魏航陈沁群王正飞洪佳明罗晓牧

电脑知识与技术 2023年8期

魏航 陈沁群 王正飞 洪佳明 罗晓牧

关键词:医工结合;数据科学能力;本科生进实验室;毕业设计论文

中图分类号:G642 文献标识码:A

文章编号:1009-3044(2023)08-0068-03

1 引言

新一轮科技革命和产业革命蓄势待发,学科交叉融合加速,创新驱动成为许多国家谋求竞争优势的核心战争。20世纪70年代,哈佛大学和麻省理工学院等一批世界一流大学通过制定交叉学科政策并建立交叉性研究所,揭开了科研机构着手重视推进医工结合发展的序幕。20 世纪80 年代,中国通过将综合性大学或理工科大学与独立设置的医科类院校合并,促成了非医科类院校和医科类院校的强强联合,如清华大学、北京大学和中山大学等纷纷建立了以医工结合为特征的交叉学科研究实体,为医工交叉研究提供了广阔的舞台[1]。当前,我国医疗卫生事业正处于发展和转型过程中,人们对社会医疗服务水平提出了更高的标准;同时,大数据、人工智能、计算机信息技术发展等新一轮科学技术将医学发展推动到了新的阶段[1-2]。为了尽快适应当前医疗健康卫生事业发展、实现健康中国的需求,传统的教学模式必须破茧重生,克服单一的教学模式,通过多渠道打开医工交叉教学和人才培养通道,整合优势资源,发掘科研潜力,使其在人才培养上做到与科研同步一体化培养,最终促进医工交叉的深度融合和共赢发展。

在互联网、物联网与移动通信的全方位连接背景下,医疗健康数据的类型和规模正以前所未有的速度快速增长,数据爆炸已让医疗健康行业真正进入大数据人工智能时代。大数据的迅猛发展促使数据科学正成为一门学科。数据科学涵盖了数学、统计学、计算机科学、人工智能等多学科的知识,是“运用建模、分析、计算和学习杂糅的方法研究从数据到信息、从信息到知识、从知识到决策的转换, 并实现对现实世界的认知与操控”[3]。可见,掌握数据科学的相关知识和方法将成为医工融合专业学生的一项核心竞争能力和必备能力。

目前大学本科教育中,理论课学习是本科人才培养的必要环节,实验课操作是验证理论知识的有效途径。本科生能够得到实践锻炼的机会主要是实验课、见习、毕业设计与实习环节,但部分学生没有养成主动、积极和独立思考的学习习惯,有些甚至有着较强的依赖与应付心理,把实验课、见习和实习当成任务,甚至毕业论文也是简单完成。这些将严重限制了学生数据科学能力与素质的培养,也导致学生毕业后缺乏独立思考与解决问题的基本能力与素质。与此同时,也有部分低年级学生,他们精力充沛、思维活跃,但对专业较迷茫,特别在我们中医药院校里面的医学信息工程和生物医学工程等医工融合专业学生。善加关注和引导,可以明显增强低年级学生的专业意识和学习兴趣。培养本科生进入实验室进行理论知识实践和创新能力锻炼是近年来高校人才培养的关键举措之一[4],本科毕业论文实践始终是高校人才培养的重要环节[5-6]。因此,为进一步深化实验教学改革,将教学与科研有机结合起来,创造良好的育人环境,有效地利用和挖掘实验室资源条件,充分发挥实验室在人才素质教育和学生创新能力培养中的作用,倡导本科生尤其低年级学生积极参与到创新科研工作中并坚持到大四的毕业论文实践,以培养学生良好的实践能力与科学创新能力是亟待进行的改革举措。

本着“教以致用、学以致用、研以致用与大胆创新”的教学科研相长理念,广州中医药大学医学信息工程学院医学大数据与人工智能本科生创新实验室将进实验室与本科毕业论文实践有机结合,结合实验室的科研创新定位,对学生的数据科学与医疗健康融合的科研实践进行较长期连贯指导,以下就如何促进医工融合专业本科生的数据科学科研实践能力的培养进行阐述,为探索本科生数据科学能力培养方法提供借鉴。

2“本科生进实验室”的早期基础积累

2.1 学生发展方向定位

兴趣,是最好的老师。实验室在大一招新生的时候,会尊重学生的意向分配到“系统开发组”和“数据算法组”两个大组。其中,“数据算法组”,专注数据科学解决医学临床问题,重视学术素养提升。接下来,本文针对以“数据科学”为核心能力的“数据算法组”学生培养为重点介绍。

每位学生都有自己的性格特点、擅长的或感兴趣的点。在学生大二阶段,根据学生在日常周会汇报和学习报告等师生交流中所体现的特点,结合我们中医药大学院校的医工融合专业背景,“数据算法组”再细分“医学数据分析”和“医学智能算法设计”两个方向。“医学数据分析”和临床密切关联,注重通过分析临床数据为疾病的特点规律和治疗方法评价选择提供参考信息,这对学生的研究设计和统计分析能力要求较高,学生毕业后可在临床医学专业或卫生管理、流行病学等领域专业继续深造或在医疗机构、企业或公司内部医疗健康相关部门就业;“医学智能算法设计”,注重通过临床数据和需求设计算法和建模,为临床辅助诊断,提高效率,这需要较强代码能力和数学逻辑思维,学生毕业后可在计算机科学与技术专业、生物信息专业或生物医学工程等專业继续深造,或直接在企业任“算法工程师”或“生物信息工程师”。

2.2 基本功积累

工欲善其事,必先利其器。“数据科学”能力与素养的培养,离不开基本功积累。结合医学大数据与人工智能的趋势、需求和医工学院学生的课程培养方案,实验室把数据科学的基础知识划分为五个模块:基础、数据可视化、统计分析与数据挖掘、机器学习、优化算法。这五个模块涵盖的知识点之间的关系可见图1。基础模块,需要医工专业学生从大一开始不断学习巩固;数据可视化模块,是入门级,可借助Ex⁃cel或Python等软件实现,该模块可帮助大一医工专业学生或医学专业学生直观了解数据科学、数据分析,激发其兴趣;统计分析和数据挖掘,是医学数据分析的核心内容,想往“医学数据分析”方向发展的同学,建议在高阶多元统计和数据挖掘深入学习;机器学习,是人工智能算法的核心内容,想往“医学智能算法设计”方向发展的同学,建议在深度学习和学习机制上继续学习;优化算法,是相对独立知识点,但优化问题常常出现在算法设计和临床建模问题中,建议可作为“医学智能算法设计”的补充知识。

边做边学,边学边做。数据科学知识,不但需要学习原理,还需要动手操作实践,不断复盘和滚动积累。原理:学底层数学原理与算法流程、使用场景和约束条件;实践:可从公共数据集入手,动手编程跑实验、跑模型,后期可以比赛、项目为场景做实践练手。数据科学知识的学习目标,可以分两步走,首先是学会“用”,即选择合适的方法,通过编程或软件实现,最后结果分析和评价;接着就是“创新”,这有应用创新和方法创新,只要前面基础打得好,在大三大四就水到渠成了,特别是大四的毕业设计。

为了帮助学生有效找到自己的学习节奏和促进师生交流,实验室日常以“周会”和“每月学习报告”形式,寒暑假不间断地进行。周会,线上线下结合,学生轮流汇报与分享数据科学知识、文献阅读、项目、课题、论文等任务进度,同时,低年级学生进行会议记录,有助于他们迅速融入学习中;每月学习报告,以邮件形式,学生对自己在当月数据科学方法打卡和文献阅读情况进行复盘,同时将自己的学习或生活疑惑与老师沟通。

2.3 以赛、以医工合作项目促学

实验室鼓励每位同学在校期间至少参与一次国家级、省级比赛,与同龄人“同场竞技”。要重视全国大学生数学建模竞赛、全国数据挖掘挑战赛、美国数学建模比赛、中国大学生程序设计竞赛、蓝桥杯全国软件和信息技术专业人才大赛等数据科学比赛。这些比赛能很好激发学生的斗志,并让其清晰知道自己在同辈中的水平;同时,大力促进了学生数学建模、数据分析、算法设计、编程能力、写作能力和团队合作能力的培养。此外,还有一些综合性比赛,如全国挑战杯和全国计算机设计大赛,这些比赛需要实验室团队有一定成果积累,考验的是“展现”和“团队”能力,有助于凝聚学生团队和激励士气。要保持初心:比赛并不是目的,而是助于自身成长和展现自我的平台和舞台。

实际项目经验是大学生必不可少的实践活动履历,这也越来越被用人单位或研究生导师所重视的[7]。为了创造医工学生的项目实践平台,实验室保持与一些医疗机构、公司合作。通过与学生在周会、学习报告等交流和比赛表现,了解、掌握每位学生的学习状态和发展方向。据此,根据不同项目需求,让合适的学生团队负责。实际项目,是课外练习、公共数据集或指定问题和数据的比赛,不能替代的。医工合作项目,力求双赢,既能满足合作单位的需求,又能让学生锻炼独立思考和解决问题的能力。

2.4 以学生项目促创新

近年来,国家、省政府越来越重视培养大学生创新创业能力,开展了全国大学生创新创业项目、中国“互联网”+大学生创新创业大赛和赛莱拉杯创新创业大赛等一系列学生项目并给予大力的资金支持。这些已经作为“高等学校本科教学质量与教学改革工程”的重要组成部分,其实质就是将第二课堂进行的科研训练以及各类科技创新等活动全面纳入人才培养体系,努力营造崇尚科学、勇于创新的良好氛围,其目的是加强大学生科技创新能力培养,促进科技成果的推广和应用,提升大学生的综合素质[8]。实验室鼓励并组织指导学生积极申报这类学生项目,结合实验室研究基础和资源,进行头脑风暴,寻求创新的方向和创业的落脚点。这大大调动本科生大胆创新的潜力和魄力,也提供了把想法落地的试错平台。

2.5 以学术交流提升素养

自己“学”得好、“做”得好,也具备创新性,但若不懂得表达和交流,那仅仅是停留在自己的圈子内,走不出去也无法提升自我。学术交流,主要包括学术论文和学术报告。这对于本科生来说,的确具有一定难度,特别是英文论文和报告。但学术交流,只要跨出这一步,就能让自身素养具有“质”的提升。无论今后是否从事科研工作,这些对于工作或学习都是受益匪浅的。实验室重视和鼓励学生结合自己的科研创新实践进行学术论文撰写,并参与国际学术会议汇报。经过多年的实践,实验室在培养本科生在医工融合数据科学领域的学术交流方面也累积了越来越多的成果和经验。

3“毕业设计论文”——独立的标志

本科生毕业设计论文,是大学四年的知识结晶。在选题上,建议和毕业后的工作岗位或读研专业方向相吻合,相辅相成,也能成为简历上一项亮眼的项目经验。实验室根据每位学生的能力、毕业后工作方向或研究方向,结合实验室项目、课题的资源和需求,给予学生毕设选题的大方向。

经过早期本科生进实验室打下扎实的基础,学生已经能自主查阅最新的中英文文献、网上找资料、算法设计、编程和调试模型,养成了保持主动与导师沟通的习惯,并具备按照规范撰写毕业论文和制作讲稿并对自己的工作进行汇报、答辩的能力。经过大半年“毕业设计论文”的最后洗礼,学生真正“独立”了,从实验室“毕业”了。

4 培养成效

“医学大数据与人工智能”MBDAI实验室,经过多年师生的共同努力,历届的传承创新,学生成果丰硕。(1) 4位学生出国留学,其中两位分别攻读京都大学医学博士和慕尼黑工业大学计算机科学博士,18位和13位学生分别获得推免和通过统考继续在北京大学、浙江大学、中国科学院、中山大学等高校读研读博深造;(2) 本科生以第一或通讯作者发表20篇学术论文,其中3篇SCI论文、8篇国际学术会议EI检索论文并进行全英汇报(其中1篇获得BEST PAPER和5篇高水平会议IEEEBIBM) 和7篇中文核心论文;(3) 软件著作权2项和申请发明专利5项;(4) 广东省挑战杯项目一等奖和二等奖各1项;(5) 国家级大学生创新创业项目5项(3项优秀结题)、省级和校级分别4项和1项;(6) 全国数学建模比赛广東省一等奖1项、二等奖和三等奖分别6项和1项;(7) 校级优秀毕业论文11篇;(8)“泰迪杯”全国数据挖掘挑战赛国家一等奖3项和国家三等奖4项;(9) 蓝桥杯全国软件和信息技术专业人才大赛国家三等奖1项、广东省一等奖1项、二等奖和三等奖分别5项和6项;中国大学生程序设计竞赛银奖和铜奖各一项。

5 结论

本文结合医学大数据与人工智能本科生创新实验室的建设,引入“本科生进实验室”与“毕业论文实践”有机结合的培养模式,探索并实践如何充分利用大学四年时间培养医工融合专业学生的数据科学能力。在此过程,我们也遇到一些培养本科生的共通问题:(1) 本科生的课程较多,影响知识体系的系统学习和项目的连贯性;(2) 本科生对自己的方向定位较迷茫和专注力容易被外界带偏;(3) 毕业设计论文的进度,常常会被实习工作所延误。这些都需要师生共同解决:多交流沟通、多鼓励,帮助学生根据自己的情况找到适合自己的方向和节奏;此外,只要学生已尽自己所能,那老师就应该放宽心态,静待花开。此外,若是学校或学院能从政策保障、资金支持和工作量考核等多方面鼓励和调动教师的积极性和主动性,特别是对实验室建设的支持,这将大大促进教学相长、培育人才的良性循环。