数智技术赋能的“挑战杯”竞赛获奖高校空间分布及主题演变识别
2023-02-06梁慧云郑杏冉刘明锦
徐 浩,张 泳,梁慧云,郑杏冉,刘明锦
(南京工程学院经济与管理学院,江苏 南京,211167)
“挑战杯”全国大学生课外学术科技作品竞赛(以下简称“挑战杯”竞赛)由共青团中央、中国科协、教育部、全国学联和地方政府共同主办,自1989年首届竞赛举办以来,每两年举办一次,截至2023年5月,该竞赛已举办17届。随着参赛高校数量、参赛人数的显著增长以及赛事规模不断扩大,该竞赛已成为一项具有导向性、示范性以及群众性的全国竞赛活动,被誉为当代大学生科技创新的“奥林匹克”盛会[1]。广大高校以“挑战杯”竞赛为龙头,把创新教育纳入教育规划,使“挑战杯”竞赛成为大学生参与科技创新活动的重要平台。
一所高校或一个地区获得“挑战杯”竞赛奖项的数量和所获奖项等级在一定程度上可反映出其科技创新教育水平、实践水平及其全国竞争力,第一等次奖项是“挑战杯”竞赛的最高等级,更是衡量高校、地区科技创新教育工作成效的重要指标之一。本研究着眼于“挑战杯”竞赛获奖作品的第一等次项目及与之关联的获奖高校、获奖地区、高校类别等关联信息,借助定量统计、主题识别等数智技术揭示30年来“挑战杯”竞赛第一等次获奖项目的空间特征及主题演变,描绘竞赛发展的动态图谱,把握其演进特征和发展趋势,供政府、高校等主体制定创新创业政策,为促进我国科技创新教育全面发展提供参考。
一、研究现状
当前,“挑战杯”竞赛的相关研究主要分为三类:一是“挑战杯”竞赛的效应分析。研究者采用实证、思辨等方式,评估“挑战杯”项目对大学生创新能力以及高校创新创业教育的作用。如杨胜刚[2]对“挑战杯”竞赛的意义作了分析,认为“挑战杯”竞赛对大学生参与学术科技活动起到了积极作用,有利于培养大学生的创造性;张睿等[3]借助问卷调查法对比发现“挑战杯”竞赛获奖者创新素养等十五个因子的得分上均高于未获奖者,以此说明“挑战杯”竞赛能促进创新素养的提升,同时,他将“挑战杯”竞赛与高校科研育人、拔尖创新人才培养工作相结合,提出依托“挑战杯”竞赛提升高校科研育人工作实效的建议。郑剑虹[4]借助历史测量法对部分“挑战杯”竞赛获奖者进行研究后认为他们属于潜在的科学创造人才。二是“挑战杯”竞赛获奖作品关联信息的特征分析。一方面,研究者对获奖高校进行了高校层次、地区分布分析。如聂亦慧等[5]对挑战杯获奖情况进行地区分析,发现竞赛获奖区域和高校分布不平衡,存在省际获奖项目数量差距显著,奖项集中于高水平大学等情况;另一方面,研究者聚焦获奖作品内容,分析挑战杯获奖作品的研究热点、发展趋势。如马宏等[6]借助词频分析及地理空间信息方法对8 096件挑战杯获奖作品开展了分析,认为追求技术创新和关注社会变革是大赛的主要特征。三是“挑战杯”竞赛的组织机制研究。学者通过对“挑战杯”竞赛的政策文本[7]、历程回顾[8]、组织管理模式[9]等进行分析,提出竞赛在实践中存在的问题及面临的挑战,并提出完善建议。
总体来说,围绕“挑战杯”竞赛研究主题的相关探索目前尚处于初始阶段,对“挑战杯”竞赛发展特征的系统梳理涉及较少,尤其是缺乏对最高等次奖项的关注与挖掘。本研究一方面对获奖单位进行区域的比较分析,探索我国科技创新教育发展的空间特征;另一方面借助文本挖掘分析等数智技术对获奖作品的主题开展挖掘及词频分析,探究大赛的重点关注与发展趋势,从院校分布、区域分布、主题演进等多维度描绘“挑战杯”竞赛发展的动态图谱。
二、数据来源与分析方法
(一)数据来源
本研究融合“挑战杯”竞赛官网[1]、高校官方网站、2019年团中央青年发展部和北京航空航天大学联合出版的《“挑战杯”全国大学生课外学术科技作品竞赛三十年足迹》《挑战筑梦 科创报国》等内部资料、前人研究数据[6]等结构化及非结构化数据,多维度采集、人工二次核定历届“挑战杯”竞赛获奖项目及其参赛作品明细、获奖作者等关联信息,最终形成“挑战杯”竞赛基础数据集,数据来源及采集过程如图1所示。“挑战杯”竞赛第1届至第6届未评选特等奖,第7届后评选产生特等奖,为更好地揭示奖项的时间特征,本研究将第1~6届的一等奖以及第7~17届的特等奖作为第一等次奖项进行分析研究,共计430项。
图1 研究的数据来源及其采集过程
(二)分析方法
研究将历届“挑战杯”竞赛第一等次奖项共计430项作品作为基础数据来源,与获奖高校的地理位置信息加以融合后,发现获得第一等次奖项的高校共有143所,覆盖4个直辖市、1个特区和21个省份。本研究以“985工程”高校、“211工程”高校、普通高校等学校类型作为高校类型分析的关键维度之一,以分析挑战杯第一等次获奖高校的空间分布特征;以国家统计局对我国八大经济区的划分为区域统计口径,探索不同经济区在大赛获奖中的差异;通过人工标注及词频分析的方式对获奖作品进行主题切分、关键词提取并辅以定量特征加以刻画。为更好地分析大赛项目的发展趋势,本研究将“挑战杯”竞赛30年历程划分为三个阶段:第1~5届、第6~10届、第11~17届,分别统计获奖单位在各阶段的获奖比例及作品关键词频次及其占比,以进行纵向比较分析。
三、获奖项目特征分析
(一)总体趋势
历届“挑战杯”竞赛第一等次奖项数量结果如图2所示,总体呈上升趋势。
图2 “挑战杯”第一等次奖项数量变化趋势
第一等次奖项数量由首届的6项发展至第17届的50项,增加了7倍之多,表明“挑战杯”竞赛规模不断扩大,优秀作品不断涌现,广受关注,影响力和号召力不断增强,也反映出我国对科技创新教育的重视程度不断增强,各类高校对学生科技创新教育的投入逐渐增加。第1~5届“挑战杯”竞赛第一等次奖项数量增加迅速,在第10届之后,“挑战杯”竞赛第一等次的获奖数量始终保持在20项以上,增长速度变缓,表明“挑战杯”竞赛从最初的迅速发展阶段逐步过渡到平稳成熟阶段。
(二)高校特征
1.高校获奖频次特征:“985工程”“211工程”高校是获奖主力军
在“挑战杯”历届竞赛中,来自143所高校的430件作品获得第一等次,其中,“985工程”高校占57.14%,“211工程”高校占16.16%,普通高校占26.70%。“985工程”高校占“挑战杯”竞赛第一等次获奖数量的二分之一以上,是竞赛获奖的主力军。获得第一等次奖项前十的高校为:清华大学、上海交通大学、北京航空航天大学、北京大学、复旦大学、东南大学、南京航空航天大学、浙江大学、南京理工大学、苏州大学,其中,8所学校是“985工程”高校,2所为“211工程”高校,无普通高校进入前十,“985工程”高校、“211工程”高校在“挑战杯”竞赛中占据绝对优势。
2.高校获奖趋势特征:由高水平大学向普通高校辐射
“985工程”高校、“211工程”高校以及普通高校在三个阶段第一等次获奖比例及其数值变化如图3所示。
图3 各类别高校第一等次获奖情况变化趋势
在“挑战杯”竞赛的初级阶段(第1~5届),“985工程”高校以第一等次获奖数量72.2%的比例高居首位,其次为“211工程”高校,占20.83%,普通高校仅占6.94%;至第二阶段(第6~10届),普通高校获奖比例有所提升,已超过“211工程”高校;在第三阶段(第11~17届),普通高校的获奖比例继续攀升,达到32.80%,在第一等次获奖数量方面彰显竞争力。总体来看,“985工程”高校目前依然是“挑战杯”竞赛重要奖项的主要获得者,但随着普通高校涌入“挑战杯”赛道,其获奖比例也在提升,表现出获奖对象由“985工程”高校、“211工程”高校向普通高校辐射的趋势,这不仅表明“挑战杯”竞赛机制的不断完善,也表明包含高职、大专院校等在内的普通高校对大学生科技创新教育的重视,大学生科技创新项目的人才培养效应正在逐步由“高峰”过渡至“高原”。
(三)区域特征
1.区域获奖数比较分析:区域间差异显著
获得第一等次奖项的143所学校来自4个直辖市、1个特区和21个省份。目前,我国有34个省级行政区域,有8个省级行政区的高校获奖数尚未获取。本文以我国八大经济区域为统计口径,分析“挑战杯”第一等次奖项区域获奖数量比例分布,结果见图4。统计结果表明,“挑战杯”第一等次奖项存在着巨大的区域差异。东部沿海地区获奖数量超过了总数的三分之一,而获奖数最少的西北地区仅仅占获奖总数的0.72%,两者相差比例达37.7%。同样,沿海地区获奖数占总获奖数的73.27%,而内陆地区总获奖仅占26.73%,两者相差比例达46.54%。地区间巨大的差异还体现在同一区域内的各省份间,如同处于北部沿海地区的四个省市之间,差异比例达到70%以上。此外,同一省份内,获奖情况区域分布也存在较大差异,如在获奖大省江苏省内,苏南地区获奖数占该省获奖总数的85%以上。
图4 不同区域获得第一等次奖项比例情况
2.区域获奖趋势特征:由东部、北部沿海地区向西南地区、南部沿海地区扩散
为进一步了解各经济区域在“挑战杯”竞赛中的实际竞争力及其动态变化,本研究计算出各区域三个阶段“挑战杯”竞赛第一等次获奖比例及其数值变化,如图5所示。在“挑战杯”竞赛第1~5届中,获第一等次奖项排名前三的分别为北部沿海地区、东部沿海地区、长江中游地区;在第6~10届竞赛中,东部沿海地区超越北部沿海地区跃居第一,与此同时,西南地区由上一阶段的排名第五跃至第三;在第11~17届竞赛中,东部沿海地区继续领跑,排名第二的依然是北部沿海地区,但其与第一名的差距越来越大,长江中游地区与南部沿海经济区并列第三名。从三个阶段“挑战杯”竞赛获奖数量的变化趋势来看,获奖区域由东部、北部沿海地区逐渐向西南地区、南部沿海地区扩散。
图5 不同区域获奖情况变化趋势
(四)研究主题特征
获奖作品的主题特征分析主要借助文本分析方法加以开展,本研究以历届挑战杯作品名称为数据源,经过中文分词、停用词过滤、同义词归并、上下位类关键词合并等自然语言处理后,删除“研究”“模式”等无实际意义的词,形成历届“挑战杯”第一等次作品的高频主题词,位于前10的高频主题词及其所占项目总数的比例如表1所示。
表1 “挑战杯”竞赛高频主题词
1.“挑战杯”竞赛第一等次作品高频主题词分析
主题词的频次变化能够反映出第一等次作品的重点关注,结果表明“三农”类主题词在“挑战杯”竞赛第一等次奖项中的总频次最高,达到46次:其中,“农村”主题为17次,“农民”主题为14次,“农业”主题为15次。“三农”主题占比最高,说明“三农”问题是历届“挑战杯”竞赛第一等次作品的关键议题,一定程度上表明大学生对于“三农”问题的重视。我们进一步研究发现:此类获奖作品多为大学生通过实地调研农业发展、农村建设、农民教育等情况,探索“三农”领域的实际问题,为全面建成小康社会贡献才智,依托的方法多借助调查问卷等社会学分析方法,以调研报告作为主要呈现方式。
其次,“系统”“技术”“智能”“纳米”“机器人”等关键词也是“挑战杯”竞赛第一等次奖项历年来的关注重点。随着科技的进步,大学生作品与时俱进、不断创新。另外,“学生”这一关键词也是较为重要的高频词,作为“挑战杯”竞赛开展的重要主体,大学生显示出对自我身份的关注,相关研究内容包含了学生心理健康、就业、创业、休闲生活等诸多方面。除此之外,新型材料、医药、生态环保等纷纷与新兴技术融合,成为“挑战杯”竞赛的又一焦点。总体来看,“三农”主题是挑战杯竞赛的热点,就行业领域来看,“挑战杯”竞赛主要聚焦民生、智能科技、生命科学、能源化学等几个领域。
2.“挑战杯”竞赛第一等次作品主题演进特征分析
为了解“挑战杯”竞赛热点主题的演进方向和变化规律,本文将17届“挑战杯”竞赛分为三个阶段,分别提取出每个阶段频次位于前10的主题词,并计算此主题词的项目数占所在阶段项目总数的比例,绘制趋势图(见图6)。
(1)“挑战杯”竞赛第1~5届的高频关键词前三位是“三农”“系统”“技术”,占四分之一,显示出“三农”等民生问题以及科技问题的相关研究在“挑战杯”竞赛初始阶段关注度较高;同时,“激光”“企业”“软件”“生物”“工艺”“机器人”“法律”等词也位列高频词前十位,涉及智能科技、生物、法律等多个领域,反映出“挑战杯”竞赛开展初期研究主题较为分散。
(2)在“挑战杯”竞赛第6~10届中,“系统”“三农”仍然得到“挑战杯”竞赛获奖作品的重点关注,位居高频词前两位。其中,“系统”的占比由8.33%上升至10.68%,超过“三农”议题,发展势头迅猛。研究发现,含有“系统”类的作品在学科分类上多隶属于自然科学类,如机器人系统、计算机成像系统、智能控制系统等,“系统”一词的出现表明自然科学类作品占据了“挑战杯”竞赛第一等次获奖赛事的主题。与此同时,关键词“纳米”跻身高频词前三位,可能的原因是该阶段纳米技术逐渐成熟,大学生将纳米技术运用到实际研究中,成为该阶段大赛作品的一大特色。与第一阶段相比,高频关键词前十位新增了“学生”“材料”“基因”“数字”等主题,这说明大学生开始关注自身发展,开展朋辈研究,在技术引领方面出现了新型材料、基因等新的研究方向。总体来看,在“挑战杯”竞赛发展的第二阶段,智能类、科技类主题开始展现出发展潜力,更容易得到大赛的肯定和青睐。
(3)在“挑战杯”竞赛第11~17届中,高频主题词的前两位依然是“三农”“系统”,且“三农”的占比高达11.37%,超出排名第二的“系统”约6%,表明其在大赛中具备持续、稳定的高关注度。“医药”也成为该阶段重点关注的主题词,相关作品运用新技术探索医学领域的实际应用。“生态”一词首次进入高频词前十位,“绿水青山就是金山银山”的理念落实到竞赛中,引起各方关注。与第二阶段相比,大学生对智能科技类选题的研究关注热度不减,将“新型”“智能”等主题纳入研究中,丰富了创新技术的内容,该类主题依然是大赛第一等次奖项的主要内容。
首先,从纵向看,在“挑战杯”竞赛第一等次奖项的高频主题词中,“三农”“系统”“技术”等词在三个阶段均有出现,是大赛反复讨论、具有持续的、稳定的高关注度,特别是“三农”“系统”这两个主题在大赛中持续占据第一等次奖项作品的前两名;其次,第一阶段大赛的第一等次奖项主题呈现多样化特征,第二阶段与第三阶段的主题呈现平稳过渡的趋势,以智能科技为主题的作品更受大赛青睐;最后,在智能科技作品“称霸”大赛第一等次奖项的局面下,不可忽视的是“挑战杯”竞赛中人文社科的学术作品弱势地位日趋明显,此类主题在第一等次奖项中的占比较少,竞争愈加激烈。
图6 “挑战杯”竞赛高频主题词演变趋势图
四、结论与讨论
本研究借助网络信息采集及官方出版的内部文件,融合多维异构数据,采集了30余年来17届“挑战杯”竞赛430项第一等次获奖作品名称、获奖作品高校等关联数据,借助数智技术赋能第一等次获奖作品的空间分布及重点关注领域的细粒度分析,研究结论与讨论如下:
其一,“挑战杯”竞赛影响力不断扩大。当前“挑战杯”竞赛参赛高校数量比首届增长超过17倍,参赛学生增长了6 000多倍。第一等次奖项获奖数量由首届的6项增至第17届的50项,增长了7倍之多;获奖高校由“985工程”“211工程”高校向普通高校、独立学院、高职院校等辐射;获奖区域由东部、北部沿海地区向西南、南部沿海地区逐渐发散;研究内容紧扣时代热点,由单一、独立领域转向多融合跨领域研究。“挑战杯”竞赛日益成为开展大学生科技创新教育的重要载体,成为培养科技创新人才的重要平台。
“挑战杯”竞赛的发展不仅符合国家战略,满足社会发展需求,同时也持续推动着高校教育体系改革。首先,在宗旨定位上,“挑战杯”竞赛以“崇尚科学、追求真知、勤奋学习、锐意创新、迎接挑战”为宗旨,符合国家发展战略,契合“双创”教育的战略规划。“挑战杯”竞赛作为培养、提升大学生创新意识和能力的重要阵地,在促进青年创新人才成长,推动大学生成为创新创业的生力军中发挥出关键作用。其次,在经济发展中,“挑战杯”竞赛满足社会发展需求、推动经济社会发展。“挑战杯”竞赛项目凝结了师生的创新智慧,对于解决市场难题、满足市场需求起着重要作用。社会各界以此为契机,举办各类衍生活动,搭建企业与高校互动、互助平台,例如部分地区通过设立项目转化基金促进、推动市场转化,举办交流论坛、交易会等,促进产学研结合,促使“挑战杯”竞赛成为激发市场的重要因素。再次,在促进高等教育改革方面,“挑战杯”竞赛能深化高校素质教育,推动教育体系改革。“挑战杯”竞赛不断适应高校育人要求,把人才创新意识的培养作为竞赛的首要目标,鼓励高校完善创新人才培养模式和创新型人才激励机制,推动高校把创新教育纳入教育规划,竞赛融入教育,教育提升竞赛,推动人才培养模式的转变,推动第一课堂与第二课堂的融合,实现“双促进双提升”。
其二,“挑战杯”竞赛获奖项目在高校、地区层面发展较为不均衡,但辐射面呈扩大趋势。在高校分布上,“985工程”高校、“211工程”高校是“挑战杯”竞赛第一等次获奖的主力军,获奖数量约是一般院校的3倍,地方一般院校在“挑战杯”竞赛中劣势较大。但随着竞赛机制体制的不断完善,普通高校的参与数量及获奖比例均有所增加,获奖高校向普通高校辐射。在区域分布上,经济发展水平高的东部沿海地区及北部沿海地区是竞赛的获奖高地,沿海地区与内陆地区的差距也较为明显,同一经济区的不同省份间也存在较大差距。获奖高校多集中在北京、上海和南京等地,西部地区部分省份从未有高校获得过第一等次,而获得奖项的高校多位于省会城市,这与地区所属高校的数量和质量相关,随着普通高校的参与度与获奖率提升,区域间的获奖情况也呈现扩散趋势。
在“挑战杯”竞赛中,经济发达地区的名牌高校具有绝对优势,偏远地区的普通高校获奖难度较大,充分显示出经济实力、高校实力影响创新训练项目的发展,高等教育发展水平影响科技创新教育水平,科技创新教育水平影响获奖能力,说明经济发展水平是制约科技创新教育投入的关键。偏远地区普通高校对科创教育“有心无力”,在高级别竞赛的高等级奖项上很难占有一席之地。随着“挑战杯”竞赛体制机制的不断完善,获奖辐射面将逐步扩大。一方面,竞赛形成了完善的校级、省级、国家三级赛制,自下而上推选具有竞争力的项目,增强了竞赛的群众性;另一方面,竞赛项目分类评选、分立奖项,对于符合竞赛宗旨、具有良好导向的开设专项奖,设立“累进创新专项奖”,这为普通高校获奖提供了机会;同时,竞赛开设专门赛道,推动高职院校参与“挑战杯”竞赛,进一步扩大了竞赛的覆盖面和辐射性。
其三,“三农”与“智能科技”是历届“挑战杯”竞赛的关注重点,持续且稳定。“三农”主题在历届“挑战杯”竞赛中占据绝对的热点地位,该主题获得第一等次奖项的比重较大。“三农”问题关乎国计民生,是社会各界关注的重点,关于“三农”问题的创新讨论更容易受到大赛的欢迎和肯定。另外,“智能科技”是“挑战杯”竞赛主题发展的主要趋势,创新技术与其他领域的融合成为大赛的关注重点,这一发展趋势契合“挑战杯”竞赛中科技作品的主旨,也符合时代发展特征,这一导向充分激励高校重视大学生科技创新教育,推动教育体系革新。
“挑战杯”竞赛的项目主题具有较强的时代性,竞赛作品能够牢牢把握时代发展趋势,紧跟国家大政方针,服务国家战略,将社会关注的热点问题转化为竞赛内容。“三农”问题是党和国家一直以来极为关注的重点问题,自2004年到2023年,国家连续发布“一号文件”指导“三农”工作,提出社会主义新农村、数字乡村战略、农业现代化、乡村振兴等等有关“三农”工作的国家战略。“挑战杯”竞赛中“三农”问题广受关注,且不断与其他创新科技的主题加以融合,创新发展。除此之外,“智能科技”主题在“挑战杯”竞赛中显示出强劲活力,新技术、新材料成为参赛者重点关注的对象,这对于激发市场创新起着重要作用。但人文社科类作品如何抓住时代热点、激发新观点和新思维、跻身大赛第一等次奖项是需要考虑的重要问题。
科技创新是人类社会发展的重要引擎,在当今社会建设中起着中坚作用。党的二十大明确提出“坚持创新在我国现代化建设全局中的核心地位,健全新型举国体制,强化国家战略科技力量,提升国家创新体系整体效能。”大学生是科技创新和拥有较大科学研究潜力的重要群体,高校是培养优秀人才的摇篮,科技创新教育正是当今大学教育的重要内容。科技创新竞赛作为科技创新教育的主要形式,日益受到全世界各国的关注和重视。本研究基于历届“挑战杯”竞赛第一等次获奖数据,将科技创新教育水平这一概念量化,对获奖作品进行横向地区分布、纵向时间序列比较分析,描绘“挑战杯”竞赛的获奖高校、地区发展以及主题演进的变化图谱,在衡量各高校、区域科技创新教育发展水平的同时,把握大赛发展规律,为国家监测科技创新发展程度与方向,为高校创新创业教育提供数据参考。