语义网在教育资源领域的应用研究
2019-09-09李京杰
李京杰
摘 要 语义网是未来万维网的一种趋势,对教育资源建设有着重要意义。为了更好地把握语义网在教育资源建设领域的应用方向,采用文献分析法,从发文量、研究内容、发表来源等方面,探究语义网在教育资源建设领域的研究现状,总结当前存在的主要问题和趋势,提出其在教育资源建设领域应用的建议。
关键词 语义网;教育资源;网络教育;教育信息化
中图分类号:G642 文献标识码:B
文章编号:1671-489X(2019)04-0005-04
Abstract Semantic Web is a trend of the future World Wide Web, which is of great significance to the construction of educational resources. In order to better grasp the application direction of Seman-tic Web in the field of education resources construction, the paper uses literature analysis method to explore the research status of Se-mantic Web in the field of education resources construction from the aspects of volume of issuance, content of research, and source of publication. This paper summarizes the main problems and trends, and puts forward some suggestions on the application of Semantic Web in the field of educational resources construction.
Key words semantic web; educational resources; network educa-tion; education informatization
1 研究背景
现今教育信息化建设已取得显著成就,而文字、图片、视频等异构性的学习资源,因其自身的模糊特性和数据格式的多样性,仅适应于人们的阅读需求,而无法被计算机检索系统精确理解。由于这些信息间缺乏内在联系,因此给学习者甄选有效资源带来很多困难。人机交互障碍是造成网络学习低完成率和高辍学率的一个主要问题。
如今一些学者提出Web 3.0概念,其最重要也是最被看好的一点就是语义网[1]。智能是语义网最基本的内涵,它能够根据语义进行判断,可以实现人机之间的沟通,这其实已涉及人工智能范畴[1]。与传统网络相比,语义网技术能通过搜索引擎进行语义推理,使分散于全球的独立数据库融合,解决各种资源的兼容和推广问题。在大数据时代,学习者正在追求一种更加智能的方式以获取有效的学习信息。语义网也为实现深度学习创造了良好的网络环境,人性化检索、个性化学习、跨语言共享、深度学习等理念已经成为未来网络教育的目标。
我国教育资源建设各自为政,存在严重的资源浪费和共享不均的情况。本研究旨在窥探语义网在教育资源建设中的积极意义,为更好地促进我国教育资源环境建设提供策略参考。
2 对语义网的理解
语义万维网(Semantic Web,简称语义网)由万维网创始人Tim Berners-Lee提出,是当前Web的延伸和扩展,是一种能理解人类语意的智能网络。语义网研究的主要目的就是扩展当前的WWW,使网络中尽可能多的信息都具有语义,在Web世界中流动的不再是单纯的数据流,而是机器可以理解的语义信息,从而更便于人和计算机之间的交互与合作[2]。
目前,Web网页信息的呈现方式多种多样,这些信息传递在给人们带来丰富的视听信息的同时,也给人们使用搜索引擎获取信息带来困难。从量大而杂的信息中甄选有效内容,大部分是人工进行的,因为计算机只能理解机器语言,如数据库、程序符号和传感器输入等语言;而无法理解信息的语义,如对“母亲”“娘”“Mother”,计算机会当作若干个独立概念理解,这样就加大了有效信息共享和获取的难度。语义网的研究目的是改变现有互联网共享资源的模式,实现信息在语义层次的交流共享或推荐。语义理念的出现将深化Web的服务范畴,使网络变得更加人性化和智能化,使人更加高效地获取信息。
3 研究样本来源及研究方法
研究样本来源 本文的研究文献资源来源为CNKI中国知网的中文全文期刊数据库和优秀硕博士论文数据库。由于Tim Berners-Lee 2001年才正式提出“语义网”的概念,因此,本文将时间设定为2001—2018年,以“语义网”和“教育资源”为条件进行搜索,在剔除与主题无关和会议报道等文献后,截至2018年8月,一共筛选出227篇文章为研究样本进行文献分析。
研究方法 笔者首先利用中国知网的文献分析工具对文献信息文档进行关键词抽取分析,然后采用内容分析法对文献研究主题进行归类。研究过程中主要用到SPSS统计软件、WordSplit分词软件以及词云图制作软件等工具对文献进行数据统计以及可视化分析。
4 语义网在教育资源建設领域的文献分析
论文总量分析 笔者对从知网筛选出的227篇文献资料进行SPSS统计分析。考虑到2018年时间不到一年,以及知网收录的迟滞性,因此不参与本文的讨论。如图1所示,从文献数量上看,自2002—2009年呈现一个非常明显的递增趋势;2010—2017年每年的文献数量有一定波动,但是不低于14篇/年,相较2008年以前每年的文献量,整体上仍然处于上升趋势;其中2016年为语义网在教育资源建设领域文献发布最多的一年,突破26篇。
由图1可以看出,2002—2017年整体呈现波动递增状态。分析其原因,一是与国家教育信息化发展战略密不可分。随着教育信息化的推进,人们要求提供更加智能的网络服务。目前“开放”正在成为一种价值,无论内容的开放、数据的开放、资源的开放,其本质上都是顺畅获取数据和信息[3]。网络教育资源正向着更加“开放”和“智慧化”趋势发展,要实现人—机语言的无障碍沟通,只有达到语义层次的搜索与共享,因此,语义网在教育信息化中的价值,在这个发展过程中引起教育界的关注。
二是语义技术逐步成熟。早期由于语义网概念刚刚提出,仅有少数理论介绍;近年来随着语义网技术不断成熟,语义网逐渐应用于各个主要领域,如图情档、互联网建设服务、计算机科学、军队建设等[4]。在生活中不难发现,现今几乎所有大型的电子商务系统,如Amazon、淘宝、当当网等,都不同程度地使用了各种形式的语义推荐技术。国外语义网在教育应用方面每年的研究成果数量自2000年以来一直在不断增加[5],我国的文献总量也在波动中整体呈上升趋势,这说明语义网在教育领域得到越来越多的重视。随着网络向智能化方向发展,语义网的应用空间将变得更加广泛。
研究内容分析 对研究内容的分析有助于了解语义网在教育资源建设领域的研究现状、研究热点、发展趋势及存在问题。笔者对227篇甄选文献进行内容分析,应用分词软件对文献进行分词处理,并进行热词研究。通过对文献内容的详细分析,将文献分为图2所示几个主要研究方向。
在数据统计过程中发现,部分论文存在研究内容交叉现象,本研究根据论文实际的研究重點,将其归入主要方向所属的一类。如图2所示,该领域研究内容集中在三个方向,分别是“教育资源本体构建”“检索技术领域”“促进教育资源共享”,这三项研究内容总和达到所有研究领域的60%以上;此外,“理论介绍与归纳”“促进个性化学习”“学习环境构建”等领域文献反映出人们对语义网在教育领域其他方向的应用实践探索。
发表来源分析 分析发表来源有助于了解哪类期刊或单位在关注该领域的研究。笔者将文献来源一共分为五类:教育类杂志;计算机科学类杂志;图书情报类杂志;学报类杂志;硕博士学位论文。对文献的发表来源进行统计,结果如图3所示,除了优秀硕博士论文,教育类杂志的相关文献所占比重排在所有杂志之首,这说明语义网在教育领域应拥有较高的研究价值和空间。
5 语义网在教育资源建设应用中的问题及趋势
语义检索技术研究成果有待投入教育领域实践应用 通过文献分析总结得出,我国语义网在教育领域的实践研究主要内容是:基于语义检索的教育资源共享方案以及共享模式研究;基于语义的教育资源个性化推荐策略研究;基于本体的教育资源建设理论研究。在现有研究中,方案、模式、策略等理论性探索研究居多,而实践应用性研究较少,研究成果实用性不强。语义网人性化的检索技术在教育资源的共享和个性化服务方面比万维网有着绝对的优势,语义检索技术切实地投入教育领域实践应用,促进教育资源共享,是未来在教育资源领域的一个新研究方向。
解决教育资源本体库的具体建设问题 教育领域本体作为教育知识领域的一种专门本体,应该能够清晰地表示教育领域主要的概念术语、属性以及相互关系,对教育领域活动所具有的属性规律进行形式化的描述[6]。目前在医学、电子工程、电子政务等多个领域进行了本体构建方法的研究和实践,为语义检索提供了本体资源基础,但在教育本体方面的实践研究较少,只在一些具体的学科构建了相应的本体[6]。由于目前没有公认的设计与评价标准及质量保证体系,因而对本体的评价方法和本体的设计方法一样存在多元化现象[7]。
教育资源本体的构建需要统一的标准。已有研究文献中,很多研究者一直在倡导和呼吁确定统一的标准,也有一些研究者对确定标准或提高本体科学性做出了实践性尝试,虽然小范围保证了数据的统一,但仍然不能宏观上解决问题。本体能够以明确的形式描述信息资源的概念以及资源之间的语义关系,构建教育领域本体则意味着建立计算机能够理解的教育资源语义标签库,这为解决各种教育资源的兼容和推广问题提供了有利条件。教育资源本体库的构建是未来语义技术广泛投入应用的基础。但是如何建立教育领域本体统一标准,本体由谁来构建,怎么建构,如何实现更新扩展等,都是目前研究没有解决的问题,在将来的研究中还将是该领域需要继续探索解决的问题。
教育资源个性化服务的实现问题 目前主要的个性化推荐技术有四类:基于协同过滤技术的推荐、基于内容的推荐算法、基于规则的推荐算法、基于聚类的推荐技术。这几类技术在应用中存在各自的缺点。目前语义网广泛应用于电子商务领域的个性化推荐系统并已经取得良好的经济效益,这对教育学界有着很大的启示。人们大胆设想将语义技术运用于教学领域,并且初步尝试了各种研究,语义网在教育个性化的应用未来将有广泛的空间。基于语义技术的个性化推荐服务的出现,为教育资源个性化推荐的实现提供了更智能的选择,但在目前的网络环境下,准确地标识用户兴趣并进行合理归类,是语义推荐技术实现的难点所在。语义服务实现有赖于教育本体的建立以及一个完善的支持语义技术实施的网络平台系统的建设完善。
6 语义网在教育资源建设应用中的建议
创建语义学习生态环境 Web从1.0到3.0不断更新发展的过程,展示了用户对未来网络发展的一种人性化和智能化需求趋势,人们不再满足信息获取是否海量,而是追求信息获得的精准性和人性化。语义技术是Web 3.0时代显著的亮点,也是其优势所在。然而语义网的实现需要良好的网络平台支持。目前我国主要存在的问题是支持语义技术的教育资源网站非常稀少。要成为学习者广泛使用的网络平台,就必须要以提高基于语义网技术的教育资源网站的数量和使用范围为前提,智能语义程序必须广泛地应用于计算机、移动学习工具等终端设备上,形成一批与语义网相互依赖的“智能个体”,以它们组合而形成一个以学习为目的的智能语义生态环境,才能为语义网在教育实践中广泛应用提供实现的网络环境。
构建完善的教育本体资源库 本体建设主体的确定是本体构建的首要问题,因为广泛地征集本体库元语是提供全面的本体库数据资源之基础。所以建立本体的主体不应该是个别专家学者研究的专利,而应由学习者、施教者、业界专家共同参与建构。此外,要实现非结构化资源的共享,笔者认为教育本体库还需要有强大的宽容度和动态更新的能力。通过全面的本体构建主体参与建设,以及本体库自身的兼容性和扩充性,从而实现用户的“查全率”。此外,一个完善的语义检索平台不仅体现在“查全率”,还体现在“查准率”上。业界尝试各种方法建立本体的文献已很多,而对本体准确性评价的研究却很少。面对复杂的数据环境中出现的大量归类错误或重复的现象,对本体的科学确认和评价是在后续工作中必不可少的一项环节。在今后的研究中,研究者更多地关注本体准确性的评价研究,实现对构建本体的排查和维护工作,才能保证数据定义的准确性,建构科学的本体库。
对已建成的异构教育资源进行“归类打包” 我国成熟的教育信息化标准较国外来说相对较晚,教育信息化技术标准体系(CELTS)到2012年才颁布系列标准,到目前为止,该标准仍在不断的完善中。统一规范的标准在本体构建中发挥着主导作用。在权威的标准建立前,我国教育资源建设已大力开展;然而标准确立之后,教育资源建设各自为政,初具规模的教育资源仍然不够规范,教育资源建设主体的多元化很难达到统一,此时也很难让各个停留在“自治共享”层次上的教育资源重新规范一次。因此,目前在此情况下,对已建成的异构教育资源采用规范的语义标签将其“归类打包”,则能够避免多元的教育资源重复建设造成的资源浪费,从而使其融入新的语义生态资源环境中,提高资源利用率。
7 结语
本研究通过文献调查,分析了语义网在教育资源建设领域的应用现状和发展趋势,希望通过本研究的分析能够对语义网在教育资源领域的应用研究起到抛砖引玉的作用。语义网与传统网络相比,更加符合未来学习环境对开放化和个性化的追求趋势,语义识别技术让不同时期、不同国家、不同语言的教育资源都可以进入一個超前融合的阶段,其在教育资源建设中的价值召唤着更多的研究者去关注与开发。
参考文献
[1]余燕芳,葛正鹏.终身学习平台建设的理念与架构:从Web2.0到Web3.0[J].电化教育研究,2014(8):57-63.
[2]Robin D, Morris.Web3.0: Implications for Online Learning[J].TechTrends,2011(1):43.
[3]NMC地平线项目.2013地平线报告高等教育版(上)[J].广州广播电视大学学报,2013(2):1-6.
[4]刘明国.语义网应用研究的文献计量学分析[J].图书馆界,2012(3):86-88.
[5]刘清堂,黄景修,吴林静,等.基于语义网的教育应用研究现状分析[J].现代远距离教育,2015(1):60-65.
[6]马捷,刘小乐,黄岚,等.教育领域本体构建研究[J].情报理论与实践,2012(7):104-108.
[7]田俊华.基于本体知识库的教学资源自动采集技术研究[D].南京:南京师范大学,2011.