人工智能时代图书馆自适应学习中心的框架构建研究
2020-12-28杨平生
杨平生
(西安建筑科技大学图书馆 西安 710055)
自适应学习研究起源于美国匹兹堡大学Brusilovsky于1992年提出的一个支持学习与辅导的智能辅导系统(Intelligent Tutoring Systems)ITEM/IP[1]。美国高校教育信息化协会与新媒体联盟在《地平线报告(高等教育版)》中连续几年将自适应学习列为未来影响高等教育发展的关键技术之一。
所谓自适应学习是一种通过交互掌握学习者的当前状态,并能够在整个学习进程中不断调整其个性化的学习资源与路径推荐的教学、辅导系统,具有数据驱动、非线性、个性化的特点[2]。近几年随着计算速度的指数级增长和大数据处理技术的高速发展,使人工智能落地应用成为可能,图像识别、语音识别、情感分析、主题提取、文本分类等技术在各个领域都得到了普遍应用,再加上移动设备及教育信息化的发展,使自适应学习具有了更适宜的实现条件。
在教育领域中,2018年4月教育部发布了《教育信息化2.0行动计划》,其中的智慧教育创新发展行动提出以人工智能、大数据、物联网技术为基础,同时依托智能设备和网络技术,开展智慧教育创新,在新技术的推动下,进行教育模式和教育生态的变革与重构。行动计划要求加快基于信息技术与智能技术的高校智能学习体系建设[3]。
高校图书馆不仅是高校开展教育活动的重要场所,是高校的文献资源中心,还是传统的学习空间,在智能化学习体系建设中应当体现其核心价值,推动图书馆利用走向智能时代,从传统学习走向自适应学习,从传统学习空间走向智慧型学习中心,这是建设智慧图书馆的重要一环。
1 图书馆自适应学习的应用场景
图书馆自适应学习中心应当具有这样的应用场景:读者进出图书馆,通过人脸识别闸机采集在馆时间数据;读者在馆内的位置,通过室内定位技术采集所处区域的数据,并通过轨迹追踪记录其在馆内的位置变化数据;通过人脸抓拍摄像机和行为识别、情绪识别技术采集读者的具体行为与情绪数据,比如读者坐在自习座位上进行阅读、看手机、手部小动作、注意力集中程度、时间利用效率等;读者利用数据,通过数据库采集读者的搜索下载数据、线上学习数据、借阅数据、科研数据、上网流量数据等。通过这些数据,再结合读者的基础教育数据、课堂教学数据,形成描述个人学习特征的读者画像。通过深度学习技术训练出优化的学习模型,以读者画像类型匹配训练出的优化学习模型,以学习模型为核心建立应用系统,从而能够根据个人特征给出因人而异的、最优化的学习计划;在整个学习中由系统实行过程监督,并能根据学习效率及时给予正反馈;根据学习阶段和个人特征给予不同的个性化资源推荐;系统分阶段进行学习效果检测,及时调整学习策略;系统还可以根据个人身份、学习内容、在馆时间、在馆位置等数据组织实时交流互动和协作。通过这种方式,使学习变成一种导航式的过程,同时体现人机交互的特点。
2 自适应学习系统框架
2.1 学习支持系统
国内外对自适应学习支持系统的研究有:智能网络教学系统、自适应超媒体系统、自适应智能代理系统、适应性远程学习支持系统、语义网适应性学习系统、双向适应机制等;系统中模块组件主要包括领域模型、用户模型、自适应模型、接口模块等[4]。文章提出的学习支持系统以学习行为评价模型为中心,包括学习者画像和资源推荐等模块,结构见图1:
图1 自适应学习系统结构图
2.1.1 数据采集
自适应学习建立在对学习者的学习全过程产生的历史数据进行数据获取和数据挖掘的基础上,因此要求图书馆对学习环境、应用装备、学习者信息等情境信息能够全面感知[5]。需采集的数据可分为基础教育数据、线上学习数据、图书馆使用数据、图书馆行为数据。其中基础教育数据包括学习者的姓名、性别、年龄、学号、院系、成绩、研究项目、研究成果等;线上学习数据包括在线时间、登录习惯、资源访问数量、链接停留时间、热图点击率、习题正确率、考核结果等;图书馆使用数据包括借还数据、门户访问数据、数字资源搜索与下载数据等;图书馆行为数据包括门禁进出数据、轨迹追踪数据、学习效率数据、学习情感数据等。
在数据获取方式上,基础教育数据、线上学习数据、图书馆使用数据都可以从相应的数据库或日志中获取,学习者在图书馆的行为数据需要通过设备采集。学习者的在馆时间、入馆习惯数据可以通过门禁系统采集;在馆内空间的活动轨迹可以通过人脸抓拍监控摄像机等设备进行追踪;在馆内公用计算机的网页浏览数据可以通过眼动仪采集;在馆内的书写数据可以通过点阵数码笔采集;在馆内自习区的学习情感数据可以通过人脸抓拍监控摄像机采集。
图书馆采集、使用学习者个人数据应当注意遵守国家相关法律法规,必须具有合法性、正当性和必要性。所有个人数据不对外提供、不超范围采集、不公开披露敏感信息。图书馆应当与能接触到个人信息数据的合作单位签署保密协定,限制接触人数,建立追责制度,确保数据安全。
2.1.2 数据处理
对于获取到的数据,需要进行加工处理。通常对具有量化结果的数据,例如基础教育数据、图书馆使用数据,一般使用二维表存储,可以直接调用。而对复杂的非结构化数据,需要对原始数据进行预处理[6]。
学习者在图书馆的行为、情感等视频数据以光流直方图提取运动对应的特征向量,对于相对静止的行为,例如坐在座位上进行阅读、书写等行为,通过卷积神经网络识别;对于运动性强的行为,例如行走、动作,以水平和垂直光流灰度图输入卷积神经网络,以双流识别框架进行行为识别。
学习者在图书馆学习的情感数据也可以采用三阶张量的高阶奇异值分解HOSVD方法,识别出高兴、专注、困惑、惊讶、疲劳、自信等不同类型[7]。
研究成果等需要语义分析的文本数据先以Word2vec等工具进行词向量化,采用词频(TF)、词频率-逆文档频率(TF-IDF)等方法提取特征,借助潜在语义分析技术进行主题或关键词挖掘分析。
在建构的学习行为统计框架中将处理后的数据结构化记录。可以采用“高阶分散式学习”(ADL ,Advanced Distributed Learning)组织标准的技术规范xAPI(Experience API)传输数据到LRS(Learning Record Store),它能够详细地跟踪和记录整个学习过程的数据流,由此建立学习者的历程档案并成为内容推荐的基础。
2.1.3 学习者画像
为了针对学习者规划出个性化的学习路径并推荐学习资源,首先需要对学习者的特征进行识别、聚类,包括学习者的基本信息、学习目标、学习风格、知识结构、认知水平、学习历史、学习绩效、心理特征等个性化特征。多数特征可以从已有数据中获取,而其中比较复杂的学习风格需要单独建立模型获取。现在常用的学习风格模型包括:Kolb模型、Honey and Mumford模型、Dunn模型及Felder-Silverman模型等[8]。在此我们采用Felder-Silverman 学习风格模型,可以根据采集的数据或处理后的数据建构一个学习行为模式,它从信息加工、信息感知、信息输入和信息理解四个维度把学习风格分为四组:活跃型/沉思型、感觉型/直觉型、视觉型/语言型、序列型/综合型。可以利用Silverman学习风格量表(ILS)提取在线学习的登录、访问、测试数据进行显性初始化判断;还可以利用贝叶斯网络方法(BNs)计算条件概率而隐性判断出学习风格特征[9]。
将学习者特征用K-means算法,生成不同学习者画像的聚类。算法中采用“肘部法则”选取K值,为了提高聚类效果,应预先对差距较大的属性值进行标准化处理[10]。
2.1.4 学习行为评价
学习行为就是学习者以某种学习方法、采用某一领域的学习资源获取知识的行为,或者说是以一定的学习路径与资源进行知识内化的行为,而这种行为效率有着个体的独特性,为了简化规则和方法,我们以不同的学习者聚类进行行为建模与评价。在同一聚类内,对所有学习者的学习路径数据进行统计,比如某一科目学习投入的总时长、时间分布、知识点的先后顺序、知识点的组合方式、知识巩固的节点、资源偏好等;然后以同一类型学习者的考核成绩为标签,训练学习模型;将学习者的学习行为特征参数值输入学习模型,可以依据学习模型的理想型(标准化评价结果库)对学习者的学习行为输出评价结果,对学习者的学习路径给予优化建议并对学习行为进行过程监督。
学习行为评价技术现有贝叶斯网络、BP 神经网络、模糊神经网络、聚类分析等方法,都具有行为采集、模式识别、评价反馈、个性化推荐几个步骤[11]。在此采用BP神经网络算法,BP神经网络是一种按照误差逆向传播(Error Back-ProPagation)算法训练的多层前馈神经网络,包括输入层、隐含层和输出层,基于梯度下降策略,通过不断修正网络权值和阈值,使误差函数沿负梯度方向下降,从而使得训练集上的累积误差不断减小。基本BP算法包括两个过程,即信号的前向传播和误差的反向传播,它也是目前应用最成功、最广泛的神经网络。实现步骤如下:
①先以学习行为数据作为样本,其中包括评价指标和评价标准,这些都是定量数据,做归一化处理。以样本数据建立数据集,分为训练数据集和测试数据集[12]。②采用Pytorch或者Tensorflow框架,搭建神经网络层。隐含层神经元数目可以由以下公式确定其中, h、n、m为隐藏层、输入层、输出层神经元数目, a 为[ 1, 10 ]之间的常数。网络中所有连接权值和阈值在(0 ,1)范围内随机初始化。③设置激活函数,对每个输入样本逐层计算输出值,根据期望输出值与实际输出值的误差,计算误差函数对输出层、隐含层每个神经元的梯度项,更新权值和阈值,不断迭代直至达到停止条件[13]。④将测试集数据输入模型,进行测试、优化。⑤将学习者学习行为数据输入,当评价标准最优时,哪一个或几个评价指标改变量最小,即为最佳学习行为优化项,以此对学习者的学习路径提出改善建议。
2.1.5 资源推荐
按照学习者画像聚类的类型向学习者推荐个性化资源。在“信息过载”的时代寻求精确,这也符合图书馆一贯追求的“为人找书,为书找人”的宗旨。目前主流的推荐技术包括基于内容的推荐系统和协同过滤推荐系统,以及两者结合的混合推荐系统[14]。协同过滤算法是基于用户间行为相似度的推荐算法,不依赖语义描述,是重要的个性化推荐系统算法。协同过滤算法的方法包括基于邻域的方法、隐语义模型算法、基于图的随机游走算法等,其中应用最广泛的是基于邻域的方法,包括基于用户和基于物品两种协同过滤算法[15]。
我们在此采用基于用户的协同过滤算法,步骤是先确定当前学习者的聚类类型,然后在同一类型中选择成绩优秀者,匹配检索这些优秀者会话日志中有关学习资源的行为数据,生成推荐列表,将他们所使用的学习资源推荐给当前学习者。选择同一聚类学习者来匹配推荐资源的模式,避免了数据稀疏的现象以及大量用户相似度计算的代价,也能有效提高推荐准确度和满意度。
冷启动的处理:①用户冷启动:新用户缺少行为数据,造成学习者画像不准确,可以在学习者第一次启动推荐系统时,给以提示,通过反馈提供推荐;②资源冷启动:新的学习资源,没有历史使用数据,基于内容标签推荐,或者通过计算资源内容相似度进行推荐;③系统冷启动:新的推荐系统缺乏学习者和资源使用的历史数据,可以利用专家标注和机器学习相结合的方式,添加标签进行启动。
2.1.6 内容建设
资源建设是图书馆的优势,图书馆自适应学习的基础建立在资源占有上,因此应重点关注,除传统图书、期刊、数据库资源外,还应开发的资源内容包括领域知识图谱、习题试题库、虚拟现实场景模型等。
领域知识图谱搭建:知识图谱是结构化的语义知识库,是用来描述客观世界中的各种实体和概念,以及它们之间的相互关系[16]。在自适应学习中应以某一领域知识内容搭建领域知识图谱,在确定知识领域和学习需求后,进行数据收集,然后对于非结构化数据以自然语言处理技术提取出结构化信息,通常包括实体命名识别、关系抽取、实体统一、指代消解等,并根据领域特点确定知识图谱的实体类型、实体关系类型、属性类型,以三元组的形式来表示知识图谱,最后将结构化数据根据不同的设计原则导入资源描述框架(RDF)或者图数据库(Neo4j、OrientDB、JanusGraph等)存储。
习题试题库:通过Scrapy框架采集在线题库结构性数据,提取题干、题型、答案和解析等数据,存入数据库进行文本处理。也可以结合自编试题,建立一个包含题库编辑、自动组卷、试题分析、在线考试等模块的题库系统。
虚拟现实场景建模:基于虚拟现实技术创建相关领域模型,用于虚拟技能训练、虚拟实验室、虚拟教学等教育场景。例如Unity Technologies 开发的Unity3D 引擎,包括虚拟三维物体模型、虚拟场景模型、物理计算等功能,可以建立虚拟实验室、虚拟实验装置、虚拟仪器仪表、虚拟场景,也可以结合3dsMAX 完成复杂模型的创建[17];利用VIVE虚拟现实设备开发场域模型,学生佩戴VR头显进入虚拟环境,进行沉浸式、交互性学习[18]。
2.1.7 效果评估
学习效果评估方法包括基于变异系数法、基于数据包络分析法、基于熵值法、基于主成分分析法、基于层次分析法和基于贝叶斯分析法等,通过建立学习者效果评估模型,从学习能力、学习满意度、学习参与度和学习兴趣几个方面进行评估[19]。也可以根据学习者的考核成绩、系统日志、自我评价、问卷调查等因素形成评价量表,进行量化统计。其中应当包括考核结果量表、学习策略量表、时间管理量表、注意力量表、效果认可度量表、情感评价量表等,从多个维度进行量化分析,并反馈给系统进行优化。
对整个系统功能的评测可以采用三种方式:①学习者问卷调查:更直接,回复更翔实。②离线数据分析:通过日志系统调取学习者使用前后的成绩变化,进行分析。③在线AB测试:将学习者随机分成几组,采用不同的推荐算法,统计不同指标进行分析。
2.2 第三方自适应学习系统应用
图书馆自建的学习系统是根据已有的软硬件条件而建构的,同时使用对象较多,包括专家、管理者、教师、学生等,从形式到内容的需求都较为复杂,不可能面面俱到,因此必须在管理上保持开放性,容许国内外第三方自适应学习系统的应用或者接入。
当前国外较为成熟的自适应学习系统有:美国自适应教育最大规模商业化平台“Knewton”,是基于规则和机器学习而开发,主要包括推荐系统、数据系统和内容建设,能够通过数据收集、推断及推荐来提供个性化教学。在线语言学习平台“Duolingo”,也是采用基于机器学习的自适应模式,会根据用户的回答,个性化推送不同难度的选题,它还开发有可引导谈话主题的聊天机器人。面向教师的自动化评分系统“Gradescope”,可以辅助教师进行试题批改,主要应用于理工科。英语语法修改系统“Grammarly”,可以实现实时语法检查、修正句子结构、修改句式、拼写检查、词汇增强等功能[20]。情绪识别与面部编码数字应用技术公司Affectiva推出的SDK:“Affdex”,能够识别并输出情绪指标、面部表情指标、网络表情符号、外观指标,目前已在课堂学习状态监测中得到应用。
国内应用的自适应学习系统有:“论答”系统,包括论答PRISM人工智能算法推荐引擎、大数据分析系统、多学科知识图谱、智能测评系统、学习路径个性化规划和学习任务智能匹配等[21]。海风教育的“好望角”AI系统,包括情绪分析、注意力分析、课堂教育建议等。好未来与FaceThink的“TAL AI Lab”,将视觉分析、语音、机器学习等技术应用于辅助教学、激发兴趣、智能交互在线教育,包括魔镜系统、智能评测系统等项目[22]。国内知名的题库、作业平台有:“作业帮”的学习辅导服务主要是以“拍照搜题”的形式提供答案和知识点讲解,也以人工智能技术形成用户画像及用户群体画像,针对性地推送练习[23]。猿辅导公司的“猿题库”“小猿搜题”是通过自适应技术为学习者提供个性化题库,也是最大的真人在线个性化辅导平台。在线英语学习方面有“批改网”,自动扫描学生的英语作文参数,通过对比参数与标准语料库的差距,给出分数、评语及按句点评。
2.3 空间建设与位置管理
2.3.1 空间建设
作为一个学习中心,仅有传统学习空间是不够的,必须将空间建成一个智慧化的学习环境。Rob Koper 认为,智慧学习环境就是在物理的空间环境中嵌入丰富的数字化内容以及情境感知和自适应设备[24]。
图书馆自适应学习中心智慧空间建设的第一个要素是物理空间,这个空间除传统空间设计中应当考虑的穿插、层次、节奏等空间美感外,还应当充分考虑空间功能的自由化和可变性、多样性、延伸性,功能自由化即是可以设置不同体验感受的学习区,比如健身减压学习区、咖啡学习区、超静音学习区、脱机(手机集中存放)学习区等;功能可变性是指采用可移动的家具、可伸缩的空间构件;功能多样性指具有各类讨论区、小组讨论教室、放映室、研修室、培训教室、开放交流区、多功能厅、社交区等,既有支持独立学习的氛围,也有支持群体学习的空间[25];功能延伸性是指智慧学习的延续性延伸了图书馆的空间属性,可以将图书馆空间延伸到教学楼、宿舍和食堂等不同区域,充分利用碎片时间,达到自适应学习的泛在化效果。
自适应学习中心智慧空间建设的第二个要素是资源空间,这是图书馆学习中心建设的核心优势。包括纸质资源和数字资源,纸质资源体积大信息含量小、信息传递效率低,在未来的发展上,应当重视数字资源建设。另外应当重视的是人的知识服务,在自适应学习中,在程序化的导航式学习过程中,应当辅以真人服务,比如阅读导师、学科指导教授[26],以便形成知识引导的人性回归。
自适应学习中心智慧空间建设的第三个要素是支持设备,包括无线网络全覆盖、人脸抓拍摄像机全布控、自动门禁系统等,还包括资源呈现类的白板、涂鸦墙、投影仪、触摸式展示屏、充足的电源插座以及情境感知类的传感器、交互类的智能终端等,也可能还有能够提供移动服务的“大疆RoboMaster S1+NLP模块”,帮助造就更充分的无人值守空间。
2.3.2 位置管理
图书馆智慧空间位置管理分为群体位置管理和个体位置管理。基于人脸识别门禁系统和人脸抓拍摄像机结合计算机视觉技术可以获得学习者行走路线、聚集区域、行为特征等,为图书馆功能空间规划、资源配置决策提供客观有效的依据[27];通过关键帧检测、密度检测进行空间影响因素分析,及时引导、预防可能发生的不安全事件。
基于红外线、灯光、超声波、蓝牙、UWB(超宽带)、Zigbee(紫蜂协议)、RFID、Wi-Fi等室内定位方法和技术[28],结合学习路径推荐模块,将图书馆座位预约系统提升为座位推荐系统,即根据规则分析出每个位置适合匹配的学习者,从而提供个性化的位置推荐服务。
3 结语
人工智能时代学校教育将面临教学结构、办学体制和组织形态的重大变革[29]。高校图书馆能否在这个时代完成角色转换,关键还是看其发展能否满足读者需求,能否跟上学习模式的进化,因此对图书馆来说自适应学习是一个具有前瞻性的大命题,值得深入研究。但是自适应学习系统又涉及硬件、软件、空间、学习者等各个层面,十分复杂,美国高校教育信息化协会(EDUCAUSE)的《2019地平线报告(高等教育版)》提到近几年自适应学习没有发挥出它应有的潜力,实施和扩展都受到时间、投资、资源的挑战[30],说明自适应学习还有很长的路要走,需要学界学者不断深入研究探讨。