基于改进SM-2算法的深度强化智能学习助手浅析
2021-09-02贾庆祥王宇
贾庆祥 王宇
河北科技大学信息科学与工程学院 河北 石家庄 050018
1 选题立项
近几年随着科学技术的飞跃发展,智能手机的普及使手机App呈现指数级增长,国内外基于SM-2算法的英语学习APP的开发或研究鲜少涉及,虽然国外一些学者对这类研究颇有成果,但利用理论分析,研究其内涵、特点、结构及使用机制后,不难发现国外对同类APP的开发或研究对我们很难产生理论和实践意义。因此该类基于SM-2算法的英语学习APP仍具有较大的开发和研究空间,市场上并无类似产品,市场潜力巨大[1]。
通过翻阅书籍和网络查询等途径,查找有关助记方式方法的信息数据,分析相关文献资料,了解现今最具权威的记忆方法,预测项目开发后对用户的帮助情况,为之后的项目开展奠定充实的理论基础。指导老师多年从事软件开发以及算法分析方面的研究性工作,有较深入的研究经历,能够给予该项目理论以及技术方面的指导,能够给该项目小组成员提供研究方法和研究工具以及市场前景方面的帮助。
2 项目特色
支持公共卡包和自建卡包的学习与复习:
公共卡包:公共卡包提供了不同年级需学习的知识,知识资源将持续增加。学生可以添加公共卡包至待学习卡包中,并设置学习计划。
自建卡包:学生可以自建卡包,进行自主学习。新建卡包时,需设置卡包名称、每日学习卡包数量;在卡包中自主添加卡片,有文字模板和图片模板两种形式。如使用文字模板,需填写问题及答案。例如添加一个英语单词,问题填写[好的],答案填写[good]。在学习时,先显示问题[好的],点击页面显示答案[good]。如使用图片模板,需输入卡片名称、问题图片和答案图片[2]。
智能记忆:该软件根据艾宾浩斯记忆曲线和系统算法,把学习过的知识按一定的规律科学分布到遗忘曲线的时间点上(复习计划表),在知识正要达到遗忘曲线临界点时提供及时的复习,以达到智能记忆的效果。用户根据自己对该卡片上单词的记忆程度选择“记住”、“模糊”、“忘记”状态,算法会推算出该卡片下一次出现的时间。这里所提到的卡片包括新卡片和老卡片。
新卡片:新卡片第一次出现,无论点击“记住”“模糊”还是“忘记”,都会在第二天再出现,让用户进行复习。第二天出现后,按老卡片的规则进行推送。
老卡片:出现过一次以上的卡片为老卡片,用户在点击了“记住”“模糊”“忘记”其中任一按钮后,系统会根据算法计算下一次卡片出现的时间,例如某张卡片连续点击三次“记住”之后,系统会默认用户已经牢牢掌握了这张卡片,将不会再出现。而点击了“模糊”按钮后,该卡片下一次出现的间隔时间会比同等情况下点击“记住”的间隔时间短[3]。
3 实施过程
3.1 进度安排
整个项目研发周期为1年,对于项目进度做了如下安排。项目前期进行调研,分析用户需求与同类产品优势,研究SM-2算法。中期分组合作,进行软件开发工作。后期对软件进行内部测试,修改出现的问题,不断完善后正式发布。根据实际运行情况进行数据分析和资料整理,将研究成果进行汇总、整理,完成撰写结题报告。
3.2 项目进展
初期主要是查阅文献,查找有关助记方式方法的信息数据等,收集的具体数据,收集分析相关文献资料,基本确定开发时使用的SM-2算法。
中期软件开发开发分为前端开发、数据库建模、后端开发和真实数据录入四部分。分工合作,软件初步开发完成。
后期对软件进行内部测试,继续完善、改进。最终将研究结果汇总、整理。
3.3 SM-2算法
3.3.1 将知识分解为最小的项目,与所有项目相关联的电子因子等于2.5。
3.3.2 使用以下间隔重复项:
I(1):= 1
I(2):= 6,n> 2:I(n):= I(n-1)× EF
其中:I(n)-重复第n次重复之后的间隔(以天为单位),EF-给定项目的E因子,如果间隔是小数,则将其四舍五入到最接近的整数[4]。
3.3.3 每次重复后,以0-5级量表评估重复响应的质量:
5-完美响应。
4-犹豫后正确的响应。
3-严重困难时召回的正确响应。
2-错误的响应;正确的人似乎容易被回忆的地方。
1-错误的回答;正确的记忆。
0-完全停电。
3.3.4 每次重复之后,根据以下公式修改最近重复的项目的E因子:
EF’:= EF +(0.1–(5–q)×(0.08+(5–q)× 0.02))
其中:EF-新电子因子的值,EF-电子因子的旧值,q-(0-5)等级量表的响应质量。
如果EF小于1.3,则令EF为1.3。
3.3.5 如果质量响应低于3,则从头开始重复该项目,而无须更改电子因子(即使用间隔I(1),I(2)等,就好像该项目是新存储的一样)。在给定日期的每个重复会话之后,再次重复质量评估中得分低于4的所有项目。继续重复直到所有这些项目得分都至少为4。
3.3.6 经过大量的心理学试验后,德国著名心理学家艾宾浩斯(Hermann Ebbinghaus,1850-1909)对人类记忆遗忘规律的研究总结:短时记忆在20分钟后的保持量就只剩下 58.2%,1天后剩下35.8%,之后遗忘的速度会逐渐减慢,6天后剩下25.4%,30天后剩下 21.1%,只有小部分的短时记忆能够转化为数日、数周、数年乃至一生的长时记忆。艾宾浩斯遗忘曲线如图1所示[5]。
图1 艾宾浩斯遗忘曲线
3.3.7 记忆保留函数。在艾宾浩斯遗忘曲线基础上进行修改,收集用户浏览不同单词的具体信息,先将信息细化处理,根据对不同最小级别划分的类,计算出用户对某类英语单词暂记其为A类的预览时间,将预览时间简记为φ,根据相关学术资料,在每个时间节点上都有与之相对应的记忆保持量,故可将艾宾浩斯曲线归结为。其中t为自变量,e为自然数底数,c为常数,t0=0.00255。结合实际中人们对A类单词的记忆会受限于其所在的客观环境,无法得出确切的放大倍数,记放大倍数为λ,得到关于记忆的保留函数,
3.3.8 单词快速推介算法流程。算法通过对用户的基本信息, 全体用户的单词列表,对于新单词而言,通过 C-means和Slope one来进行模型训练和单词推荐。至于已经学习过的单词,根据艾宾浩斯遗忘曲线的理论,将和新单词按照一定比例推荐给用户,将单词转化 成一定的词向量。通过词袋法去噪音,最后按照一定的逻辑进行造句,而造出的句子作为辅助学生记忆单词的工具[6]。其流程可归纳为图2。
图2 单词推介算法流程图
3.3.9 各种重复间隔模式对重复对知识保留的影响的实验(2020年1月31日-2021年1月2日)
图3 实验结果
3 结束语
研发小组五人进行分工合作,分别针对用户分析、市场调查、算法研究、产品开发、软件测试等方面开展研究、完善。开发出一款基于SM-2的智能学习助手APP, 用户仅需每天花费少量时间,经过App科学有效的记忆指导便可聚沙成塔,增加单词记忆量,提升英语水平。