“互联网+教育”领域本体可视化构建与结构分析
2022-06-15鲍婷婷陈丽郑勤华王怀波
鲍婷婷 陈丽 郑勤华 王怀波
[摘 要] “互联网+教育”是一个不断发展的创新领域,是教育高质量发展的必然选择。本体涵盖了某个领域语义网络的关键概念,可以客观反映特定领域的发展重点。研究以构建“互联网+教育”领域本体为主线,以剖析“互联网+教育”领域结构为重点,实现了“互联网+教育”领域本体可视化与结构系统化。研究发现,“互联网+教育”领域具有“两级宏观—两级微观”的体系结构,宏观层面分为基础支撑、发展任务、动力引擎、保障体系四个维度,微观层面包括26个一级结构和53个二级结构。并进一步从夯实基础支撑、落实发展任务、强化动力引擎、完善保障体系等方面提出了推进“互联网+教育”发展的具体建议,以期为促进“互联网+教育”领域健康发展奠定理论基础。
[关键词] 互联网+教育; 领域本体; 本体构建; 本体可视化; 教育信息化
[中图分类号] G434 [文献标志码] A
[作者简介] 鲍婷婷(1995—),女,河南洛阳人。硕士研究生,主要从事互联网+教育、人工智能教育应用研究。E-mail:201821010150@mail.bnu.edu.cn。陈丽为通讯作者,E-mail:lchen@bnu.edu.cn。
一、引 言
随着以互联网为代表的新兴技术与教育的深度融合,“互联网+教育”已成为一个备受关注、快速发展的创新领域,为推动教育变革、解决教育主要矛盾等提供了新的思路与手段。近年来,政府部门陆续出台了“互联网+教育”相关政策文件,大量“互联网+教育”理论与实践也不断涌现,在社会范围内形成了一股“互联网+教育”热潮。与此同时,“互联网+教育”的蓬勃发展带来了海量信息资源的迅速产生与积累,不仅加剧了信息爆炸与价值利用间的矛盾,也使得“互联网+教育”领域边界与结构愈发模糊不清,为深入认识“互联网+教育”内涵与特征带来了现实挑战。因此,对“互联网+教育”领域中信息的高效组织显得尤为重要。
领域本体为解决这一问题提供了新思路。本体通过概念及概念间关系的有效组织和表现,客观上揭示了某一领域的内部结构,反映出特定领域的重点内容。在教育领域,不少学者借助本体完成了对教育目标与教学内容的组织与重构。例如:崔新春等设计了“C++程序设计”双语课程本体[1],魏顺平构建了教育技术学领域本体[2],为准确把握学科重难点、优化知识结构、推动教学改革等奠定了理论基础。因此,本文基于本体构建视角梳理“互联网+教育”领域的核心要素与体系结构,深入挖掘“互联网+教育”发展方向,以期帮助政策制定者合理规划与引领“互联网+教育”,帮助一线实践者正确認识与践行“互联网+教育”,促进“互联网+教育”的持续健康发展。
二、“互联网+教育”的内涵
在国家“互联网+”行动计划背景下,“互联网+教育”应时而生,成为教育改革创新的热点话题。2018年2月,教育部发布《2018年教育信息化和网络安全工作要点》,提出要发展“互联网+教育”,实现教育信息化的转段升级[3];2018年4月,教育部发布《教育信息化2.0行动计划》,提出到2022年建成“互联网+教育”大平台[4];2019年3月,李克强总理在政府工作报告中强调发展“互联网+教育”,促进优质资源共享[5];2020年,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》首次肯定了在线教育的重要地位。由此可见,政府部门侧重于将“互联网+教育”作为推动教育变革的有力手段,尤其强调数字教育资源的重要作用。
而在理论研究中,当前较为主流的“互联网+教育”定义大致可分为三种:一是新形态,“互联网+教育”指应用新一代信息技术为学习者个体提供优质、灵活、个性化教育的新型服务模式、组织模式和教学模式[6],形成以互联网理论与技术为支撑的教育新形态[7];二是新生态,“互联网+教育”具有开放、大规模、关注人、注重生态等基本特征[8],为教育全过程、全方位带来颠覆性变革,最终形成一个开放创新的教育新生态[9];三是教育变革的历史进程,“互联网+教育”是教育信息化的一个发展阶段,强调以学习者为中心,借助各类社会资源满足学习者多样化与个性化学习需求,具有战略性变革意义[10-11]。
综上所述,本文认为,“互联网+教育”通过新兴技术与教育的深度融合,推动新型教学模式、服务模式、组织模式、管理模式等深层次的体制机制变革,最终目标是重塑一个集基础研究、创新实践、政策规划于一体的开放、创新、动态的教育生态系统。
三、“互联网+教育”领域本体构建
“互联网+教育”领域本体的可视化构建过程共包含领域语料收集、领域概念识别、本体结构划分、本体关系识别、领域本体可视化五大环节,为明晰其领域边界与内部结构奠定了重要基础。
(一)领域语料收集
依据“互联网+教育”的定义,本研究以“互联网+教育”领域为研究对象,以技术赋能教育实现深层次体制机制改革为标准,分别从理论研究、创新案例、政策文本三方面收集数据构建“互联网+教育”语料集。在理论层面,以CNKI为数据库,以“互联网+教育”为关键词进行全文检索,限制词频大于等于5次(检索日期为2019年12月31日),筛选得到3014篇期刊文献;在实践层面,以2018年教育创新博览会的项目申请书、2019年国际人工智能与教育大会发布的智能教育案例集、“互联网+教育”创新沙龙的实践案例等为主要数据来源,筛选得到148个创新案例;在政策层面,以“中华人民共和国中央人民政府”“中国教育信息化网”“中华人民共和国教育部”三个网站发布的政策文本为准,以“互联网+教育”“互联网+”“教育信息化”“教育现代化”为关键词进行检索(检索日期为2019年12月26日),筛选得到201份政策文本。B2F0871F-9F1C-4AD2-8ED0-ACADAFE6F5B0
(二)领域概念识别
获取恰当的领域概念是构建领域本体的一项关键任务。胡华认为,不同领域、不同主题存在不同的构词规律,并建立了UGC信息领域的构词规则[12]。周浪等发现,科技领域中99.7%的术语含有名词、动词、量词[13]。基于此,推断“互联网+教育”领域概念的构词规则也具有一定的独特性,并以语料集中期刊文献的关键词和政策文本的专用词为依据,建立了“互联网+教育”领域自定义词表。通过分词统计后发现,单词术语占15.5%,长度为2的术语占61.6%,长度为3的术语占18.7%,且双音节词在现代汉语中具有主导性地位[14],因此,研究重点关注“互联网+教育”领域中单词和双词概念的获取。
首先,采用TF-IDF统计算法抽取单词概念,TF-IDF是抽取关键词的基本算法之一,其主要作用是评估一个关键词在语料库某一文档中的重要程度,可计算得到互联网(0.11)、教学(0.10)等抽取概念的重要性排序。其次,探究自定义词表的词性组合规律,形成“互联网+教育”领域的概念词性规则,如第一个词与第二个词均为名词(n),进而通过语法规则(n+n)获取双词概念[如“数字教育资源”的词性标注结果为(‘数字,‘n),(‘教育资源,‘n)]。两次概念抽取存在大量“噪音”词,建立人工剔除规则过滤后最终得到1001个概念。
(三)本体结构划分
抽取得到的领域概念集合是无序的、离散的,难以清晰地表征本体内部结构。因此,进一步通过聚类处理将领域概念划分为具有相似特征的子集,以从宏观视角挖掘“互联网+教育”体系结构。研究采用经典的聚类算法——K-Means,其具有操作简单、计算速度快、可解释度较强等优点。K-Means算法的原理是把所有对象划分为K个子集,研究发现当K值等于9时,各个子集概念之间的差异性最明显,且每个子集内的概念相似度最高,故最终将领域概念划分为9个主题(见表1)。
(四)本体关系识别
领域概念间的关系主要用以表征概念之间的各类关联,从而建立起领域本体内部的组织结构。概念间的关系主要包括层次关系和非层次关系。其中,层次关系即上下位关系(Kind-of),而非层次关系表示层次结构以外的关系。研究依据“互联网+教育”领域语料文本的特点共定义了五种非层次关系:同义关系(Same-of)、属性关系(Attribute-of)、整体与部分关系(Part-of)、并列关系(Equal-of)、实例关系(Instance-of)。
层次关系获取结合了相似度与细化度策略。首先,通过相似度计算获得具有相关关系的概念对;其次,通过细化度计算判断概念的深浅层次。通常情况下,上位概念包含的信息较少,细化程度较低,而下位概念包含的信息更多,细化程度也更高。经过细化度计算得到了1868个概念对,进一步设置合适的阈值进行过滤,最终得到了1121个上下位关系。
与获取层次关系相比,非分类关系更加复杂和隐蔽,现有获取非分类关系的技术尚不成熟,因此,采用人工標注的方法获取非分类关系,具体思路为:通过相似度计算获取相关概念对,过滤掉已通过细化度计算的分类关系概念对,进而将剩余符合条件的概念对依据实际关系命名。在人工标注非分类关系之前,先对两名研究者进行编码训练,并对其编码结果进行一致性检验,得到Kappa系数为0.905(p<0.001,N=441)。也就是说,人工标注结果的水平在可接受范围内,最终得到了202个非分类关系的概念对。
(五)领域本体可视化
本体模型本质上是由节点和弧构成的图。其中,节点表示概念,节点之间的弧表示概念之间的语义关系。研究选用当前主流的Neo4j图数据库实现“互联网+教育”领域本体的存储与可视化。在对本体进行形式化表达之前,需要明确“互联网+教育”领域的本体模型框架。结合聚类结果发现,九大主题在“互联网+教育”中发挥的作用各有侧重,故将其划分为“两基础、三任务、三动力、一保障”基本框架,与九大主题共同构成“互联网+教育”领域本体模型框架(如图1所示),包含三层类属结构:顶层类为“互联网+教育”,即本体名称;第一层类包括基础支撑、发展任务、动力引擎、保障体系;第二层类为九大聚类主题。
利用Neo4j图数据库的Cypher语言将所有概念和关系导入Neo4j图数据库中,成功建立了九个子类,共1001个“节点”和1395条“连边”(包含了各子类之间的双向连边),实现了“互联网+教育”领域本体的可视化,图2为本体第一层类“动力引擎”下“数字资源与服务”的部分示例结果。
四、“互联网+教育”领域结构分析
从宏观视角出发,“互联网+教育”领域本体包含两层结构(见表2),一级为“两基础、三任务、三动力、一保障”基本框架,二级为层次聚类得到的九大主题,共同揭示了“互联网+教育”领域的主要内容与相互关系。从微观视角出发,“互联网+教育”领域共包含1001个概念和1323个关系,可进一步划分为26个一级结构和53个二级结构,体现了“互联网+教育”领域的诸多要素。
(一)“互联网+教育”领域本体的基础支撑
在本体模型“软硬件设施与环境”模块中,共包含146个概念和280个关系,分为网络设施、教育平台和教育终端三个方面。其中,与网络设施相关的概念有73个,表现为网络类型和网络覆盖两个维度,主要体现在以“网络设施资源”为核心的网络覆盖工程、教育城域网、农村网络资源等;与教育平台相关的概念有33个,表现为各级各类平台和平台整合两个维度,主要体现在在线教育平台、网络教学平台、系统互联等;与教育终端相关的概念有40个,表现为硬件终端和软件终端两个维度,如手机终端属于硬件终端,是真实存在的物理设备,而网络学习空间属于软件终端,是学习者进行网络学习的入口。
在本体模型“数据应用与安全”模块中,共包含110个概念和153个关系,分为数据处理和数据安全两个方面。其中,与数据处理相关的概念有78个,覆盖了数据采集、存储、传输、应用、监管等全过程,主要体现为两个维度:其一,涉及数据处理的关键技术,如数据存储技术、数据分析技术、数据分析模型等;其二,涉及数据处理的相关工具与机制,如数据管理平台、数据反馈系统、数据保障机制等。与数据安全相关的概念有32个,主要体现为两个维度:其一,指狭义的数据安全,即数据传输过程的安全[15],如数据保护;其二,指广义的数据安全,即网络安全,如网络安全标准。B2F0871F-9F1C-4AD2-8ED0-ACADAFE6F5B0
(二)“互联网+教育”领域本体的发展任务
在本体模型“教与学方式创新”模块中,共包含103个概念和173个关系,分为新型教育教学方式和学科教育教学方式两个方面。新型教育教学方式侧重于方式创新,而学科教育教学方式侧重于学科应用,两者并非完全割裂的关系。其中,与新型教育教学方式相关的概念有81个,主要体现为两个维度:其一,包括强调创新教学方式的相关概念,如重构教学模式、变革教学方式、新型教与学等;其二,包括现有的新型教与学方式,如游戏化教学、双师教学、混合式教学等。与学科教育教学方式相关的概念有22个,强调因学科自身特点不同而形成的教与学方式,主要体现在编程教学、物理课堂教学、体育教学模式等。
在本体模型“课程体系改革”模块中,共包含91个概念和98个关系,分为课程优化与整合、课程类型与内容、培养目标三个方面。其中,与“课程优化与整合”相关的概念有21个,主要体现为两个维度:其一,强调新课程改革,如新课程改革、新课程体系、新课程形态等;其二,强调课程的建设与优化,如课程开发、课程内容整合、网络课程设计等。与“课程类型与内容”相关的概念有46个,主要体现为两个维度:其一,强调课程类型的多元化,如网络精品课、网络选修课、直播课等;其二,强调课程内容的多样性,如编程教育、美育课程、跨学科课程等。与培养目标相关的概念有24个,主要体现为素养目标和能力目标两个维度,如信息素养属于素养目标,数字化技能属于能力目标。
在本体模型“组织管理与治理体系”模块中,共包含142个概念和147个关系,分为学校管理、教师管理、教育评价、教育治理四个方面。其中,与学校管理相关的概念有43个,主要体现为两个维度:其一,与学校办学机制有关,如办学理念、办学监管、校企合作等;其二,与学校管理机制创新有关,如师生走班、电子档案、学分认证等。与教师管理相关的概念有37个,主要体现为三个维度:其一,涉及教师队伍建设,如网络化师资、特殊教育师资队伍、乡村教师队伍等;其二,涉及教师参与网络教研,如跨校教研、协作备课、教师学习共同体等;其三,体现教师参与在线服务的新模式,如双师服务、在线支教等。与教育评价相关的概念有25个,主要体现为评价内容、评价方法、评价对象三个维度:从评价内容角度,如学业评价、素质测评等;从评价方法角度,如评价模式、多维评价、评价平台等;从评价对象角度,如政府评价、学校评价等。与教育治理相关的概念有37个,主要体现为两个维度:其一,强调治理方式,如多元治理;其二,强调治理能力,如综合治理机制。
(三)“互联网+教育”领域本体的动力引擎
在本体模型“新技术与应用场景”模块中,共包含129个概念和145个关系,分为技术和应用场景两个方面。其中,与技术相关的概念有47个,主要围绕在以互联网为核心的新兴技术,如VR技术、数据挖掘技术、人工智能技术等。与应用场景相关的概念有82个,主要体现为四个维度:其一,强调智能化服务,如智能备课、个性化推荐、自动批阅等;其二,强调远程化服务,如远程协作、远程交互、远程监控等;其三,强调沉浸式体验,如AR体验、VR场景、仿真模拟实验等;其四,强调实时性功能,如实时交互、实时反馈、实时教学等。
在本体模型“数字资源与服务”模块中,共包含92个概念和104个关系,分为数字资源类型和数字资源服务两个方面。与数字资源类型相关的概念有54个,主要体现为适用对象、资源主题、资源特点、资源形式四个维度:从适用对象角度,如中学教育资源、职业教育资源、特殊教育资源等;从资源主题角度,如美育教学资源、音乐教育资源、双创教育资源等;从资源特点角度,如碎片化资源、整合性资源、校内资源等;从资源形式角度,如视频教学资源、电子媒体教材、网络课件等。与数字资源服务相关的概念有38个,主要体现为两个维度:其一,指为提高学习者使用资源的效果而提供的配套学习支持服务,如资源推送,这种服务理应是实时、个性和精准的[16];其二,指为提高资源质量与利用效率而提供的管理服务,如资源认证。
在本体模型“在线教育产业”模块中,共包含101个概念和113个关系,分为教育产业链、在线教育发展、在线教育治理三个方面。其中,与教育产业链相关的概念有46个,主要体现为三个维度:其一,强调宏观产业链发展,如在线教育企业、教育软件企业、信息技术企业等;其二,强调在线教育市场布局,如工具开发、产品开发、知识服务等;其三,强调在线教育应用,如晓羊教育、智慧学伴、雨课堂等。与在线教育发展相关的概念有42个,主要体现为两个维度:其一,强调在线教育的发展特点,如在线教育形式、在线教育用户、在线教育业务等;其二,强调在线教育的发展模式,如产学研合作、校企协同等。与在线教育治理相关的概念有13个,主要体现为两个维度:其一,强调治理对象,如收费乱象、应用程序备案、在线教育准入等;其二,强调治理手段,如备案审查、事后监管、行業联合等。
(四)“互联网+教育”领域本体的保障体系
在本体模型“体制机制保障”模块中,共包含87个概念和110个关系,分为政策保障、制度保障、资金保障、人员保障、项目保障五个方面。其中,与政策保障相关的概念有27个,如政策环境;与制度保障相关的概念有19个,如制度体系;与资金保障相关的概念有12个,如教育信息化经费;与人员保障相关的概念有13个,如信息化队伍;与项目保障相关的概念有16个,如信息化示范校。
五、推进“互联网+教育”发展的建议
推动建设具有中国特色的“互联网+教育”新生态,需要深入认识“互联网+教育”领域“两级宏观—两级微观”的体系结构,打造“基础支撑—发展任务—动力引擎—保障体系”的完整闭环。因此,以“互联网+教育”本体为依据,立足当前我国“互联网+教育”发展面临的现实挑战与迫切需要,提出以下发展建议:
(一)夯实基础支撑:进一步完善网络教育环境B2F0871F-9F1C-4AD2-8ED0-ACADAFE6F5B0
完善网络环境是夯实高质量教育支撑体系的首要前提。进一步完善网络教育环境,要坚持以推动教育创新发展为核心,围绕网络设施、平台、终端三方面共同推进。要加快教育专用网络的全面覆盖,推进网络基础设施的转型升级;要推动形成一体化的平台体系,强化平台模式的教学常态化应用;要促进数字校园的全面覆盖,加快线上线下教育的有机融合;要正视教育终端在推动教育创新发展过程中的重要作用,建立完善的运行机制,保障软硬件终端符合质量标准、安全有效等要求,让师生真正掌握使用教育终端的主动权。
(二)落实发展任务:进一步深化教学改革与数字治理
深化教学改革与数字教育治理是创新教育融合应用体系、构建现代教育治理体系的重点内容。进一步深化教学改革,要鼓励学校、教师、学生等多方主体拥抱并善用新型教与学方式,以适应混合式教学必将成为后疫情时代教育教学主流趋势的现实要求;要推进教学组织方式由标准化走向灵活个性,如逐步推广走班制、选课制等;要加强学生综合性评价与发展性评价,探索创新评价方式与工具;要鼓励学习者多渠道参与在线学习,建立完善的在线学分认定与管理机制;要促进全民终身学习,建立健全数字学习档案与学分银行制度;要加强教师参与网络教研、在线支教、在线答疑等活动,将其作为教师教学能力评价与绩效考核的重要参考。进一步推进数字教育治理,要完善各类技术、管理、服务、质量等标准规范体系,加强各级标准之间的有机衔接;要充分挖掘数据这一新型生产要素在教育领域的价值,加强教育数据的开放、整合与监管;要创新教育大数据应用,提升教育科学决策、精准管理、高效服务等水平;要探索基于大数据的信用监管与风险预警,完善多方主体参与的协同监管机制。
(三)强化动力引擎:进一步创新服务业态
创新服务业态是优化教育服务供给体系的关键举措。进一步创新服务业态,要统筹数字教育资源的建设与开发,充分挖掘社会优质资源,也要强化资源整合汇聚与共建共享机制,实现数字教育资源的有效供给;要利用技术开发新型数字教育资源,满足特殊教育、职业教育、乡村教育等多样化需求,也要增强资源的教学交互、情境体验、认知辅助等功能,满足个性化学习需要;要规范数字教育资源的审核与监管,也要健全数字教育资源产权保护机制;要加速形成完整、优质、良性循环的产业链,为推动教育改革与创新发展添砖加瓦,也要健全教育科技企业与在线教育机构的监管机制,促进互联网教育服务业健康有序发展。
(四)完善保障体系:进一步坚持多措并举
多措并举是强化“互联网+教育”创新发展保障体系的有力抓手。进一步坚持多措并举,要坚持以政府为主导,建立完善的各级部门间协作联动机制;要打造专业化的领导队伍、基层管理队伍、高质量教师队伍等,培养一批具备“互联网+教育”相关知识与技能的专业人才;要优化教育经费支出结构,加大对“互联网+教育”领域的投入力度,进一步完善多元投入机制,引导社会力量参与“互联网+教育”发展;要加快研究“互联网+教育”推动教育变革的基础理论、实施路径、效果评估等,积极开发关键技术、探索应用新模式、积累经验成果等;要营造安全可靠的网络环境,提高网络安全监测预警和应急管理能力,提升隐私保护、伦理规范、网络安全等水平。
六、结 语
“互联网+教育”是新时代推动教育高质量发展的必然选择。本文通过构建“互联网+教育”本体,揭示了“互联网+教育”领域“两级宏观—两级微观”的体系结构,使“互联网+教育”领域逐步从抽象走向具体,为准确把握“互联网+教育”领域发展重点奠定了理论基础。随着“互联网+教育”的快速发展,未来需持续维护与迭代“互联网+教育”领域本体,探索“互联网+教育”领域本体的多样化应用场景,如构建“互联网+教育”领域知识库、智能问答系统、知识图谱等,从而推动“互联网+教育”领域蓬勃发展。
[参考文献]
[1] 崔新春,乔鸿.“C++程序设计”领域本体构建研究[J].现代教育技术,2010(4):33-37.
[2] 魏顺平.基于术语部件的领域本体自动构建方法研究:以教育技术学领域本体构建为例[J].电化教育研究,2013(5):62-67.
[3] 教育部.教育部关于印发《2018年教育信息化和网络安全工作要点》的通知[DB/OL].(2018-02-12)[2021-06-25].http://www.moe.gov.cn/srcsite/A16/s3342/201803/t20180313_329823.html.
[4] 教育部.教育部关于印发《教育信息化2.0行动计划》的通知[EB/OL].(2018-04-18)[2021-06-25].http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[5] 新华社.政府工作报告——2019年3月5日在第十三届全国人民代表大会第二次会议上[EB/OL].(2019-03-16)[2021-06-25]. http://www.gov.cn/gongbao/content/2019/content_5377101.htm?ivk_sa=1024320u.
[6] 陈丽.“互联网+教育”的创新本质与变革趋势[J].远程教育杂志,2016(4):3-8.
[7] 刘革平,余亮,龚朝花,吴海燕.教育信息化2.0视域下的“互联网+教育”要素与功能研究[J].电化教育研究,2018(9):37-42,74.
[8] 吴南中.“互联网+教育”内涵解析與推进机制研究[J].成人教育,2016(1):6-11.
[9] 南旭光,张培.“互联网+”教育:现实争论与实践逻辑[J].电化教育研究,2016(9):55-60,75.
[10] 梁士荣.开放教育特质论[J].开放教育研究,1999(1):8-11.
[11] 秦虹,张武升.“互联网+教育”的本质特点与发展趋向[J].教育研究,2016(6):8-10.
[12] 胡华. 基于中文UGC信息源的半自动应用本体构建研究[D].武汉:武汉大学,2014.
[13] 周浪,张亮,冯冲,黄河燕.基于词频分布变化统计的术语抽取方法[J].计算机科学,2009,36(5):177-180.
[14] 胡裕树.现代汉语[M].上海:上海教育出版社,1995.
[15] 王国才,施荣华.计算机通信网络安全[M].北京:中国铁道出版社,2016.
[16] 余亮,陈时见,赵彤.大数据背景下数字教育资源服务的内涵、特征和模式[J].电化教育研究,2017,38(4):66-71.B2F0871F-9F1C-4AD2-8ED0-ACADAFE6F5B0