电子信息专业硕士研究生机器学习课程交叉应用案例库建设研究
2024-12-31王小梨冯影吴润杰
摘" 要:在电子信息专业学位“机器学习”授课中,建立交叉应用教学案例库有利于促进分科知识融通发展为交叉学科知识体系。在探讨该应用案例库的建设思路和内容过程中,结合机器学习课程径向基网络、支持向量机等知识点构建部分案例,最终构建一个“电子信息-肝癌智能诊断”医工交叉应用案例库。构建交叉应用案例库有助于引导学生从实际案例出发,更具体掌握对于机器学习的应用操作。对于推动综合学习、跨学科合作、创新和问题解决具有重要的意义,不仅对学生有益,还对各个领域的实际应用和社会发展产生重要影响。
关键词:交叉应用案例库;机器学习;支持向量机;MindSpore框架;模糊分类
中图分类号:TP311" 文献标识码:A" 文章编号:2096-4706(2024)12-0193-06
Research on the Construction of Cross-application Case Library for Machine Learning in Master's Program of Electronic Information
WANG Xiaoli, FENG Ying, WU Runjie
(School of Electronics and Information, Guangdong Polytechnic Normal University, Guangzhou" 510665, China)
Abstract: In the“Machine Learning”teaching of the Master's program in electronic information major, the establishment of a cross-application teaching case library is conducive to promoting the development of cross-disciplinary knowledge system by facilitating the integration of specialized knowledge. In exploring the construction ideas and content process of this application case library, specific cases are built by incorporating knowledge points from the Machine Learning course such as Radial Basis Function networks and Support Vector Machines. Ultimately, a cross-application case library is established, focusing on “Electronic Information-Liver Cancer Intelligent Diagnosis” within the medical engineering domain. The construction of a cross-application case library helps guide students to grasp the practical application of machine learning from real-world cases. It holds significant importance in promoting comprehensive learning, interdisciplinary collaboration, innovation, and problem-solving. This is beneficial not only for students but also has a crucial impact on practical applications and societal development across various fields.
Keywords: cross-application case library; Machine Learning; Support Vector Machine; MindSpore framework; fuzzy classification
0" 引" 言
为结合国家发展战略目标,实现科技兴国、人才强国、创新驱动人才发展战略。根据国务院印发的《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》通知[1],早日落实新一代人工智能发展规划战略目标[2],教育部学校规划建设发展中心主任提出“加快构建高质量应用型人才培养新格局”的号召[3]。专业学位应用型人才对于国家的发展扮演着重要的角色,能够推动科技创新与产业升级,填补人才短板,满足服务社会的需要,推动产业和经济的发展。然而交叉应用案例库的建设对于培养专业学位应用型人才方面具有关键作用[4]。建设交叉应用案例库能够促进跨学科知识融合,提供更多的经验分享,有助于创新思维的培养以及职业素质的提升,使学生具备实际操作能力、综合素质和创新能力,为国家发展和产业升级提供有力支持。
1" 机器学习课程建设近况
机器学习领域目前教育局反映了一种重要的趋势,即理论课程相对较多,而实际交叉应用案例课程相对不足。虽然机器学习的理论课程对于建立坚实的基础知识至关重要,但实际应用案例学习和跨学科融合同样至关重要。
1.1" 机器学习课程建设的不足
机器学习课程在电子与信息专业研究生课程安排上占有重要地位,但根据调查研究[5]发现目前现有的课程设计仍存在以下方面不足:
1)理论与实践的不平衡。目前的机器学习教育往往侧重于理论和算法的教学,学生被教授如何设计、理解和实现各种机器学习算法。然而这种课程学习过于理论化,未能足够关注实际应用和跨学科合作的技能。
2)应对现实世界的挑战。机器学习的应用涉及多个领域,包括医疗保健、金融、农业、能源,等等。学生需要学会如何将他们在理论课程中学到的知识应用于解决实际问题,这需要跨学科的知识融合和实际操作技能。
3)跨学科融合的重要性。机器学习往往需要与其他领域的专业知识相结合,以解决复杂问题。例如,医疗领域的机器学习应用需要医学专业知识的融合。当前的课程往往忽略了这种跨学科合作的培训。
4)培养综合技能。学生需要掌握数据清理、特征工程、模型评估、解释模型输出等实际应用技能,而这些技能在理论课程中可能没有得到充分的培养。
5)解决现实问题的机会。实际交叉操作融合课程可以提供学生更多解决真实问题的机会,例如合作项目、实习和实际案例分析。这有助于学生更好地理解机器学习在实际应用中的价值。
1.2" 构建交叉应用案例库重要性
案例库的构建具有极大重要性和许多优势,对专业学位研究生的教育和学习环境产生积极影响[6]。以下是关于构建交叉应用教学案例库的重要性和优势点:
1)促进实际应用。教学案例库强调实际应用,为学生提供了实际问题和场景的案例,帮助学生将理论知识应用到实际情境中。这有助于培养学生的实际应用能力。
2)提高问题解决能力。案例库的建设通常以问题解决为导向,通过分析和解决真实案例,学生能够培养问题解决能力、判断力和决策能力。这对于学生在职业工作和日常生活中都具有重要价值。
3)跨学科教育。教学案例库可以涵盖多个学科领域,促进跨学科教育。学生可以了解到不同领域的知识如何相互关联,促进综合思维。
4)灵活性和个性化学习。学生可以根据自己的兴趣和需求选择不同类型的案例,实现个性化学习。这有助于满足不同学生的学习需求。
5)丰富学习资源。教学案例库为学生和老师提供了丰富的学习资源,包括文本、多媒体、问题和解答。学生可以通过多种方式获取知识,提高学习效率,同时帮助学生自我评估和获得反馈,教师也可以使用案例库来评估学生的学习与理解能力。一旦构建教学案例库可以供学生与教师长期使用,并不断地增加新的教学案例有助于提供可持续的学习资源。
总的来说,建设机器学习教学案例库对于促进实际应用、培养综合能力和促进跨学科教育具有重要意义,提供了多种优势,有助于提高学生的学习体验和教育质量。
2" 案例库建设方案
结合机器学习领域研究前沿和团队科研成果,与行业专家共同设计教学案例,将理论知识与实际工程实践有机融合。这深度结合不仅加深学生对机器学习经典算法的理解,还激发学习兴趣[7]。案例设计充分考虑研究热点,保持与行业前沿的紧密联系,确保案例具有实际应用性。通过与专家合作,案例使学生能够在解决真实工程项目中应用所学知识。这一教学方法旨在培养学生创新和实践能力,通过参与案例分析和解决实际问题,提高对理论知识的运用能力,锻炼解决复杂问题的能力。这有助于提高专业学位研究生的培养质量[8],为他们未来实际工作提供坚实基础。通过这紧密结合理论和实践的教学设计,我们旨在激发学生学术兴趣,提高创新和实际应用水平,以更好地满足机器学习领域专业学位研究生的培养需求[9]。
2.1" 案例库建设目标
教案库建设应当关注学生的学习成果和发展,着重于对于学生知识体系、技能和素质目标的培养,提供丰富的教学资源和更优的教学质量。有助于学生自主学习能力的培养,确保学生掌握课程基本理论、概念和方法,提升学生的组织能力和协作应变能力,培养学生的职业道德能力、伦理意识和社会责任感[10]。
对于教师教案库的建设应当更加关注于教师的专业发展、教学质量提升以及教学研究与创新。建设教案库为教师提供了丰富的教学资源,通过借鉴优秀教案提升教师的教学方法提升教学成果,帮助教师更好的组织教学内容、设计教学活动、选择教学方法,激发教师研究兴趣促使教师进行教学实践的反思与探索。
建立教案库要做到产教融合即结合信创,紧密关联与促进产业与教育的有机结合,以满足产业发展和人才培养的需求,提高行业企业参与办学程度,优化多元办学体制,推动需求导向的人才培养模式。通过教案库建设促进企业学校的深度合作,共同参与课程设计、教学资源开发实现校企协同育人,同时应当支持不同类型的教育机构包括职业学校、高等学校等以满足不同层次、不同需求的学生,课程建设主要以跟随研究生培养计划。
国产化的教案库应当实现在国内教育领域推动独立自主发展,满足国内教育需求,促进教育创新和改革,提高教育平等和可及性,培养创新人才,弘扬本土传统文化,并推动科技与教育的融合,这有助于实现国内教育体系的可持续发展和提高国际竞争力。
2.2" 案例库内容
教学案例面向电子信息专业学位硕士研究生,以国家人工智能和广州市“工业数字化、网络化、智能化”的产业需求为导向[11],融合机器学习、模式识别等的经典内容,以传统机器学习和产教融合经典案例为主线,分别介绍感知器、线性回归模型、最小均方算法、核方法和径向基网络、支持向量机、基于MindSpore的神经网络、深度学习等知识点模[7,12]。以科研训练驱动,建立多个实用案例,增强学生对机器学习理论的掌握和学习兴趣,提高工程实践能力[11]。教学案例库建设方案如图1所示。
2.2.1" 案例库1:支持向量机手写数字识别
支持向量机(Support Vector Machine, SVM)是一种监督学习算法[13],旨在找到数据中最优的超平面,以将不同类别的样本分开。它通过最大化支持向量间的间隔来确保泛化性能,并能处理线性和非线性问题。SVM通过将数据映射到高维特征空间,并在该空间中找到最佳分离超平面,以在低维空间中实现非线性分隔。它在分类和回归问题上都表现出色,因其优秀的泛化能力和有效的特征选择。将其应用与手写字体识别主要包括了以下几个方面:
1)数据准备。准备一个包含手写数字图像数据的样本集,这些图像需要有对应的标签,表示它们所代表的数字(0到9)。确保这些图像具有相同的色彩和大小。
2)特征提取。将手写数字图像转换成分类器可以使用的特征向量格式。通常,这涉及将图像像素转换成特征向量,可能包括像素值或其他特征。对于SVM,特征向量的设计需要考虑线性可分性,或者可以使用特征工程方法来改善特征的可分性。
3)数据预处理。对特征向量进行标准化或归一化,以确保它们在相同的尺度上。
4)训练SVM模型。使用训练数据集来训练一个SVM分类器。SVM的目标是找到一个最优的超平面,以将不同类别的数据分开。
5)验证和调优。使用验证数据集来评估SVM模型的性能,并进行必要的参数调优,以提高分类器的准确性。可以调整SVM的参数,如核函数和惩罚参数。
6)测试和部署。使用测试数据集来评估最终训练好的SVM模型的性能。一旦满意,可以将模型部署到实际应用中,用于手写数字识别任务。具体实现过程如图2所示。
2.2.2" 案例库2:基于MindSpore的鸢尾花分类识别
MindSpore是由华为推出的开源深度学习框架,旨在提供高性能、易用且可扩展的工具,支持构建各种类型的神经网络。使用MindSpore可以简要概述为以下几个步骤:
1)安装MindSpore。在使用MindSpore之前,需要安装框架并配置相应的环境,确保满足系统和硬件的要求。
2)导入MindSpore库。在Python脚本中导入MindSpore库,以便使用其中的功能和类。
3)定义神经网络模型。利用nn模块,通过继承nn.Cell类来创建自己的神经网络模型。可以按需添加各种层和激活函数。
4)定义损失函数和优化器。MindSpore提供了多种损失函数和优化器,根据任务选择合适的组合,例如交叉熵损失和Adam优化器。
5)准备数据和训练。使用MindSpore的Dataset模块准备训练数据,然后使用定义的损失函数和优化器进行神经网络的训练。
6)模型评估和推理。在训练完成后,通过测试数据集对模型进行评估,并在实际应用中进行推理,验证模型的性能。
7)保存和加载模型。MindSpore支持模型的保存和加载,方便在需要时重新使用已经训练好的模型,或在其他场景中进行模型迁移。
使用莺尾花数据集作为原始数据进行分类识别。莺尾花数据集是由生物学家Ronald引入的经典机器学习数据集之一,包含150个样本,涵盖了3个不同种类的莺尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。这个数据集被广泛应用于模式识别和机器学习算法的测试与验证,成为学习分类算法的理想起点。下面是使用MindSpore进行莺尾花识别的一个简要实验,试验过程如图3所示。
2.2.3" 案例库3:基于模糊模型的肝癌分层量化
以培养交叉应用型人才的需求为导向,创建Takagi-Sugeno-Kang(TSK)模糊系统的肝癌分层量化教学案例库,课程实验数据来源于中山大学附属第一医院,结合机器学习中TSK模糊模型[14],构建智能化的辅助手段,缓解医生的压力,该方法的流程框图如图4所示。其中A表示模糊语义集,R表示规则。首先使用华为MindSpore框架和自然语言处理技术患者电子诊断报告中的自然语言信息进行预处理,接着采用主成分分析方法提取诊断报告中的关键特征信息,如肝癌大小、个数等,其提取效果如图5(a)所示,接着进行特征语义划分,确定肝癌特征语义的界定和在模糊语义集下的表达方式。采用模糊C回归聚类方法求解每条规则隶属度,采用改进的岭回归方法实现后件参数辨识,采用模糊C聚类方法初始化后件参数得到最优化结果,实现前件参数隶属函数的参数辨识和模型的输出。将中国CNLC标准[15]中的肝癌类别进行数字标签化处理,划分训练集和测试集,并验证智能分层模型的分期性能,分期误差结果如图5(b)所示。
2.3" 教学实践效果
在本校电子信息专业学位硕士的培养过程中,根据教学目标明确学生通过案例库学习的知识与技能,选择与具体任务相关的教学案例库主题,涵盖实际问题、行业案例、科学实验等多个方面,根据详细的案例包括情境、问题陈述、相关知识背景、可能解决的方案信息等,尽量做到更加全面的多学科整合[16]。
追求案例适配学生能力,这样的划分旨在通过深化学习过程,提高学生的理论应用能力和创新思维。首先,在课前预习阶段,学生会提前接触到相关案例,以激发他们对即将学习内容的兴趣。这为学生建立学科联系提供了机会,使他们能够在课堂上更积极地参与讨论。其次,在课堂讨论阶段,学生将根据事先分配的组别,深入研究和讨论案例。这一阶段采用了翻转课堂的教学模式,通过学生之间的合作,加深对案例的理解。老师在此过程中负责引导和监督,及时解答学生可能出现的疑难问题,确保学生在合作中取得更深层次的理解。同时,对于集中出现的疑难问题,老师将进行集中解答,确保整个学习过程的连贯性和深度。对于一些未能在课堂上得到解决的问题,我们将设立案例库中的讨论区,鼓励学生在这里共同探讨,形成集思广益的学习氛围。最后,在课后提升阶段,学生将通过代码实现、报告撰写等形式完成案例项目。这不仅对学生进行了知识的综合应用,还促使他们培养了分析思维、发散思维和创造性思维,从而提高了他们理解、分析和解决问题的能力[6,16]。
通过这样的教学设计,我们的目标是培养学生在面对实际问题时具备自主思考、合作解决问题的能力,强调知识的实际应用,使学生在课程学习中不仅掌握理论知识,更能够将知识转化为实际的解决方案。最终,课程考核将综合考察学生的知识应用能力和创新能力,为他们的综合素质提供有力支持。
根据学生对案例库的使用与效果情况,评估学生的学习成果和能力发展。由于机器学习的相关课程发展迅速,更新速度快,做到定期更新案例库确保案例库的实用性和时效性,能够反映机器学习领域的最新发展,优化案例库的设计和功能,提高教学成果。
通过在电子信息专业硕士学位研究生中开展该案例教学,达到了以下效果:
1)巧妙地将理论知识与实际工程实践融为一体,显著提升课程的教学质量。通过教学案例项目的巧妙设计,学生得以将抽象的理论知识有机地运用于实际工程项目解决方案中,深度理解课程内容,激发学习兴趣,从而提高整体课程的教学效果。
2)积极推进专业学位研究生课程改革与实践。案例项目的引入促使团队教师将企业工程项目和科研成果与机器学习相关的理论知识紧密结合。这不仅在实现了实际与理论的完美结合的同时,也推动了教学方法和手段的创新,推进了专业学位研究生课程的深化改革和实际应用[17]。
3)全方位提升专业学位研究生的工程实践能力。深度合作电子行业企业,以共建案例库的形式,将真实项目和流程纳入课程。这一深度融合有力地提高了学生在工程实践方面的水平,使他们更好地适应实际职场要求,为未来职业生涯打下坚实的实践基础。
3" 结" 论
本文对于电子与信息专业研究生教学案例库建设进行相关研究,针对目前存在的理论教学主导、应用性不足的现象做出改进与提升,成功构建了机器学习课程交叉应用教学案例库,为学生提供了深入实践的学习资源。通过实践强调应用与问题解决的重要性,培养学生的能力,为机器学习领域的教育贡献了有价值的经验和资源,为未来不断优化机器学习教育提供了有益的参考。未来将在不同的学习领域和应用场景下拓展教学案例库,深化个性学习和实践导向设计,以满足不断变化的教育需求。
参考文献:
[1] 科技部等六部门关于印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》的通知 [J].科学中国人,2022(17):64-66.
[2] 国务院关于印发新一代人工智能发展规划的通知 [J].中华人民共和国国务院公报,2017(22):7-21.
[3] 张涵.加快构建高质量应用型人才培养新格局 [J].中国国情国力,2023(1):79.
[4] 雷长海,李天,胡适. 案例教学法在新兴交叉学科课程教学中的探索与实践--以合成生物学课程为 [J].创新教育研究,2023(11):2079-2087.
[5] 赵卫东,袁雪茹.基于项目实践的机器学习课程改革 [J].计算机教育,2019(9):151-154.
[6] 胡良梅,张宝,高隽,等.以能力为导向的基于模块化案例分析的发现式教学模式探索 [J].教育教学论坛,2017(10):122-123.
[7] AMEET A M M. Foundations of Machine Learning [M].The MIT Press,2012.
[8] 武卫莉,李响,佟有才,等.高分子专业学位研究生课程教学案例建设 [J].高分子通报,2019(12):66-70.
[9] 国务院学位委员会,教育部.专业学位研究生教育发展方案(2020-2025) [R/OL].[2023-11-12].http://www.moe.gov.cn/srcsite/A22/moe_826/202009/t20200930_492590.html.
[10] 孙建渊,涂坤凯.专业学位研究生案例库全过程建设研究 [J].教育探索,2016(12):76-79.
[11] 赵珊,贺军义,于金霞.电子信息专业学位研究生机器学习教学案例库建设研究 [J].现代信息科技,2022,6(22):176-179.
[12] BISHOP C M,NASRABADI N M. Pattern Recognition and Machine Learning [M].New York:Springer,2006.
[13] 陈虹州.基于SVM的手写数字识别 [J].电子制作,2019(18):49-51+53.
[14] CUI Y Q,WU D R,HUANG J. Optimize TSK Fuzzy Systems for Classification Problems: Mini-batch Gradient Descent with Uniform Regularization and Batch Normalization [J].IEEE Transactions on Fuzzy Systems,2020,28(12):3065-3075.
[15] 中华人民共和国国家卫生健康委员会医政医管局.原发性肝癌诊疗指南:2022年版 [J].中华肝脏病杂志,2022(4):367-388.
[16] 黄鹤,赵祥模,黄莺,等.多学科交叉融合构建新工科创新实践教学体系 [J].实验科学与技术,2022,20(2):43-46.
[17] 黄鹤,赵祥模,黄莺,等.多学科交叉融合构建新工科创新实践教学体系 [J].实验科学与技术,2022,20(2):43-46.
作者简介:王小梨(1992—),女,汉族,广东湛江人,讲师,博士研究生,研究方向:智能信息处理、机器学习、模糊逻辑;冯影(2002—),女,汉族,湖北黄冈人,硕士研究生在读,研究方向:深度学习、目标跟踪检测、模糊逻辑;吴润杰(1999—),男,汉族,广东潮州人,硕士研究生在读,研究方向:人工智能、智能信息处理、模糊逻辑。