APP下载

信息资源建设视阈下高校课程定制与课程推荐初探

2017-04-07徐扬步一贺易之赵瑜

现代情报 2017年3期
关键词:信息资源建设客户满意度教育资源

徐扬+步一+贺易之+赵瑜

〔摘要〕本文从信息资源建设视阈下进行了高校课程资源的整合和建设,以期实现高校课程的定制和推荐。本文从信息资源建设的实用性、系统性和共享共建原则角度出发,建立了高校课程定制与推荐的模型,以期当学生输入一套课程序列时,自动为每个学生提供一套满意度最高的课程方案。该模型由数学模型和问卷补充两部分组成。本文以北京大学本科生课程为例,手工筛选出理工类、社会科学类和人文科学类共84对可能具有较高相似性的课程,利用其在北京大学教务部网站上提供的中文名称和中文课程简介,基于统计学原理进行分词,利用向量空间计算出课程相似度,并利用人工问卷的方式对课程相似度的评判调优。

〔关键词〕高校;课程定制;课程推荐;大规模个性化定制;信息资源建设;客户满意度;教育资源

DOI:10.3969/j.issn.1008-0821.2017.03.011

〔中图分类号〕G6492〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0057-05

〔Abstract〕This paper aimed to integrate and develop the course resource in universities from the perspective of information resource development.Based on the principles of practicability,systematicness,and sharing,the model focusing on course customization and integration could provide another set of courses with the highest degree of satisfaction with the input of a set of courses.The model consists of mathematics model part and questionnaire part.Taking the undergraduate courses from Peking University,this paper selected 84 pairs of courses from the fields of Natural Science and Engineering,Social Sciences,and Humanity and Arts.The model bases on statistics principles and employs Vector Space Model to calculate the similarity between the courses.Furthermore,the model used questionnaires to modify the results.

〔Key words〕university;course integration;course recommendation;mass customization;information resource development;customer satisfaction;education resource

随着时代的发展,社会对高校的人才培养提出了更高的要求。大学生在完成学业要求之外应当同时发展综合素质,然而时间等因素的限制使得这种平衡较为困难。如果能够找到一种方案,既满足学生对于某一课程知识的学习需求,又能使学生的时间成本降低,就可以为学生全面发展提供条件。

当今社会的重大特征是学科交叉、知识融合,技术集成,许多不同的学科院系都开设了类似的课程[1],比如在信息管理和计算机专业都会开设有关“信息安全”的课程[2]。因此,学科交叉也为大规模课程定制提供了可能性。“大规模个性化定制”思想是解决高等教育培养模式中标准化与个性化矛盾的一个重要方法。本文尝试为在标准化的培养体系之下,为学生提供个性化的课程定制服务。将制造系统中的大规模个性化定制引入到课程系统中,无疑是对大规模个性化定制研究领域的扩展,同时也是对高等教育系统创新的探索[1,3]。应用大规模个性化定制、价值工程等制造系统的方法,对学生个体而言,可以有更多的时间参与综合素质拓展的活动,有利于日后的发展。对高校来说,培养出来的学生全面发展,满足了社会的需求,进而提升高校自身的竞争力[4]。

高校课程资源是典型的信息资源。这类信息资源需要被选择、采集、组织和开发,这是信息资源建设的过程[5-6]。对高校课程资源进行建设具有重要意义,因为它不仅能够使得高校学生享受到更为丰富、更为优质的课程资源,又能从学校层面上整合不同资源、降低高校的成本[7]。

与其他信息资源类似,在高校课程资源建设中,需要满足实用性、系统性和共建共享原则[5]。从实用性角度看,高校课程定制和推荐需要立足学校现有课程资源实际出发,不仅要根据高校服务任务(整合高校资源,提供优质教育)的需要进行课程信息资源建设和定制推荐,还需要根据高校服务对象(高校学生)的需要進行课程信息资源建设和定制推荐。特别是前者,在“整合高校资源”的过程中既需要提供较为丰富的课程,又需要考虑提供课程所带来的成本。从系统性角度看,高校课程定制和推荐既需要使用数学模型进行定量科学性的计算,又需要使用社会科学的问卷调查等方式加以补充,以期课程定制和推荐的结果既具有科学性和严谨性,又具有一定的个性化和灵活性。从共建共享原则看,本模型将不同院系开设的相似课程加以整合,使得不同院系的学生能够共享相似课程。这样既提高了课程受众的多样性程度,符合本科阶段“通识教育”的要求[8],又在学校层面上降低了开课成本。

以信息资源建设的实用性和系统性原则为出发点和指导思想,本文以北京大学本科生课程为例提出了对于某个学生n门课选择的满意度模型。模型的第一部分根据北京大学教务部网站提供的信息,人工筛选出理学部、信息与工程学部、社会科学学部和人文学部的相似课程,并将课程信息采集下来;经过分词后,利用向量空间模型来计算课程信息间的相似度。模型的第二部分则采用人工设计问卷的方式对课程相似度加以进一步调研,对程序算法进行补充。问卷调查了相似课程对在内容、难度和考核三方面的相似度,并将两者综合得到了两门课程的相似度。综合模型的前两部分,本文建立了以信息资源建设原则为出发点的大规模个性化定制课程模型。例如对于一名本科生来说,假设他/她想选修的课程集合是{A,B,C,…}:本文将根据模型输出更优的课程集合{A′,B′,C′,…}(如有。其中A′,B′,C′,…是与A,B,C,…相对应的使满意度提高的课程集合),从而实现课程推荐(见图1)。这里,“更优的课程集合”是从高校的角度,既完成了高校的服务任务并满足高校服务对象,又使高校付出较低成本的课程集合。本文将在第二部分详述模型构建的方法(包括数学模型的构建和问卷调查的实施),并以了北京大学本科生课程为例,进行了简单的实证研究,并在第三部分给出了模型模拟的结果。最后,本文在第四部分给出了本文的结论。

1模型构建

对于每个使用者而言,本文的目标是输入一定的课程集合,输出令其满意度最高的课程集合。在这里,假设课程满意度与课程相似度成正比。如果课程A与课程B相似度是80%,那么学生选择课程B而不选择课程A的满意度为80%。对于输入的课程集合S,即初始用户想选的课程,令该集合中的所有的课程满意度为1:

为了简化模型,假设课程只会出现两两相似的情况。但是,仅仅使用相似度高低程度来决定课程间是否替换并不全面。若不考虑成本的情况下,显然所有课都上对于使用者(学生)而言是满意程度最高的一种选择情况。然而,对每门课而言,如果其内容与其他课程相似而学分却越多,那么上这门课程的成本就越高,满意度也就越低,因此我们使用课程学分来作为课程的替换成本:课程满意度与学分数成反比。于是对于一个学生n门课的选择来说,该生的满意度模型计算如下:

这里给出一个上述模型最简单的例子:用户想选3学分的课程A,同时有一门与A 80%相似的课程B。该用户对(A,B)课程共有3种选择方案(这里不考虑都不选择的情况):①(1,1),即同时选AB;②(0,1),即选B;③(1,0),选A。按上述模型计算,满意度最高的一种选择方案是(0,1),也即选B。可看出如果当一门课B和另一门课A高度相似且学分少于B时,该生会更加满意A,这符合日常学生选课的思维范式。不妨假设每学期只选修一门相关课程。而考虑到学分和满意度都为非负值,于是(1)式实际上可转化为对于每一对相似课程,推荐上Satisfaction(Xi)/Credits(Xi)更高的课程。

11数学模型中课程相似度计算方法

考虑到大类间课程相似度较高,而且选课较为便捷,根据北京大学教务部网站所提供的信息,可将北京大学所有院系划分为3类:①理工类;②社会科学类;③人文科学类。在3类学部中,分别人工找出了理工类40对,社会科学类33对,人文科学类11对相似课程对,其中有少部分跨学部(类)相似课程。对每对相似课程,我们依据其在教务部网站上提供的中文名称和中文课程简介,使用算法计算出课程相似度。

111信息采集

在课程信息采集中,使用北京大学教务部网站[2]所提供的信息。根据课程信息,人工筛选出理学部40对,社会科学学部33对,人文学部11对相似课程,并将其课程信息(课程名和课程简介)采集下来。为了数据处理的便捷性,不同的课程对间用“”隔开,课程对间不同课程使用“”隔开,课程名和课程简介使用“”,所有的换行符使用空格符替换。所有以上信息皆以utf-8的编码格式存在txt文档中。使用的词典为搜狗提供的常用词词典[9],其提供每个词gbk的编码以及搜狗实验室所统计的频次。

112分词

与英文相比,计算机在处理中文文本时必须进行分词。中文分词的常见算法是最大正向匹配算法。例如“××课很有意思”可以分词为“××/课/很/有/意思”,但是面对一些有歧义的句子时处理能力却一般,如“南京市长江大桥”就会被分成“南京/市长/江/大桥”而不是“南京市/长江/大桥”。

考虑到基于最大匹配算法的中文分词方案的缺陷,我们这里选用了基于统计学原理的分词,即对于一个中文字符串s,如果可以使用词语s1s2…sn表示该串的一种分词方式,那么,P(s1s2…sn)越大则表示该分词方案越是符合人们惯常用法,即将分词任务转化为求P(s1s2…sn)MAX,根据联合概率的展开,有下式:

12问卷课程相似度计算方法

为了更为充分地判定选定课程的相似度,采取人工设计问卷的方式对课程相似度加以进一步调研,作为对程序算法的一个补充。为了便于表达,将程序代码计算出来的相似度称为“机器计算相似度”,将用问卷计算出的相似度称为“人工计算相似度”。

问卷调查的对象是同时选修或旁听过两门相似课程的师生(包括但并不局限于北京大学师生)或曾经接触过两门课程的北京大学教员或助教。问卷使用了范围为00~10之间且刻度为01的量表(即量表设计00、01、02、…、10这些选项,其中00为完全不同,10为完全相同),并考察了该受访者所认为的两课程在内容、难度和考核三方面的相似度,三者以6∶3∶1的比例加权。

2结果与讨论

21课程相似度计算结果

按照本文第三部分的模型進行搭建,我们将收集到课程对进行相似度计算。表1列举了各个课程大类中相似度最高的10门课程:

22课程资源大规模个性化定制模拟结果

按上述算法模型和相似度计算结果,笔者这里模拟了3个选课过程,来更好地说明模型的应用。

环境科学与工程学院学生A

原始课程集合为:

课程号:12733010课程名称:环境化学院系:环境科学与工程学院学分:3满意度:0333

课程号:12734010课程名称:工程制图院系:环境科学与工程学院学分:3满意度:0333

推荐课程集合为:

课程号:1034630课程名称:环境化学院系:化学与分子工程学院学分:2满意度:0467

课程号:12734010课程名称:工程制图院系:环境科学与工程学院学分:3满意度:0333

根据学校的教育方案,该环境科学与工程学院学生应该选择环境科学与工程学院的“环境化学”与“工程制图”两门课程。根据本模型,为他推荐了由化学与分子工程学院开设的“环境化学”这门课程,提高了他“环境化学”课程的满意度。而工程制图有两门相似课程(工学院的“工程制图”和物理学院的“工程图学及其应用”),而这里在模型分别计算了满意度和成本比值后,发现依然是原课程较为适宜,因此依然推荐了原课程。光华管理学院学生B

原始课程集合为:

课程号:2830170课程名称:电子商务院系:光华管理学院学分:3满意度:0333

课程号:2532260课程名称:信息经济学院系:光华管理学院学分:3满意度:0333

课程号:2838160课程名称:数据分析与统计软件院系:光华管理学院学分:2满意度:05

推荐课程集合为:

课程号:3032230课程名称:电子商务院系:信息管理系学分:2满意度:0488

课程号:3030720课程名称:信息经济学院系:信息管理系学分:2满意度:0355

課程号:2838160课程名称:数据分析与统计软件院系:光华管理学院学分:2满意度:05

该光华管理学院的学生有3门存在相似课程对的课程。模型计算的结果推荐了和光华管理学院有着很多类似课程的信息管理系的课程,考虑到其高相似度和较低的学分,作为选修学分是一个不错的选择。艺术学院学生C

原始课程集合为:

课程号:4332710课程名称:西方美术史院系:艺术学院学分:2满意度:05

课程号:4331541课程名称:美学原理院系:艺术学院学分:2满意度:05

课程号:4331821课程名称:影视节目策划院系:艺术学院学分:2满意度:05

课程号:4331792课程名称:视听语言院系:艺术学院学分:2满意度:05

推荐课程集合为:

课程号:4332710课程名称:西方美术史院系:艺术学院学分:2满意度:05

课程号:4331541课程名称:美学原理院系:艺术学院学分:2满意度:05

课程号:4331821课程名称:影视节目策划院系:艺术学院学分:2满意度:05

课程号:4331792课程名称:视听语言(电影语言)院系:艺术学院学分:2满意度:05

因为艺术学院自身的课程学分本身较低、相似课程较少,与其他的院系相关课程较少,因此推荐课程并没有什么改变。

3结论

本文从信息资源建设的实用性、系统性和共享共建的角度出发,探索了高校课程资源定制与课程推荐的方法,建立了基于大规模个性化定制的模型,并以问卷的形式对模型予以补充。本文所提出的模型既具有科学性和严谨性,又具有一定的个性化和灵活性;既保证了为高校学生开设相对丰富多样的课程,又能在很大程度上降低高校开课的成本。

在本研究中,课程满意度计算模型从高校的视阈考虑,对于每个使用者而言,输入一定的课程集合,输出令其满意度最高的课程集合。基于课程满意度与课程相似度成正比和课程满意度与学分数成反比两个假设,对于一个学生n门课的选择来说,该生的满意度模型计算为:

0不选Xi课。对于给定输入课程集合,使用上述模型将问题转化为求上式最大值。在分词时,参考unigram提出了基于统计学的模型,将分词任务转化为求P(s1s2…sn)的最大值。在展开之后,使用动态规划的方法来求解该问题。分词后便可根据向量空间模型求出,两个文本的词频向量,并计算出其词频向量的数量积。对于每对相似课程,分别计算课程名和课程简介间相似度取平均值。为了弥补机器比较的缺陷,对曾经接触过两门相似课程的北京大学教员或助教进行了问卷调查。问卷使用量表,考察了该受访者所认为的两课程在内容、难度和考核三方面的相似度,三者以6∶3∶1的比例加权。

未来的研究可以从以下两个角度进行:

从数学模型的实现层面看:本研究使用的分词方式参考了unigram模型,但是其使用假设有待考量。对接下来进一步完善模型而言,考虑使用2-gram模型来进行更好的建模。分词使用的搜狗输入法常用词词典在专业术语上有所欠缺,词典与课程介绍的文本相似度不高。此外,本模型中没有停用词表,因此对于同义词、近义词等自然语言处理问题都没有考虑;在使用向量空间模型时,由于多个课程介绍的文本相似度不高,所以并没有计算词的逆向文本频率。同时,本研究对于课程的成本过于简单,只考虑了学分的问题,其效度有待商榷。这些问题将成为日后加以改进和解决的重要方向。

从信息资源建设的原则层面看:本研究主要考虑了信息资源建设的实用性、系统性和共享共建的原则,但并未考虑信息资源建设的特色性原则[5]。实际上,不同院系开设的相似课程仍然在授课内容、授课方式等方面存在自己院系和专业的特点,然而本研究在建模过程中没有考虑到这一点,未来的研究可尝试从此方面加以改进。

参考文献

[1]王磊.基于大规模定制原理的本科教育课程体系研究[D].宁波:宁波大学,2013.

[2]北京大学教务部.http:∥dean.pku.edu.cn[EB/OL].2016-02-03.

[3]PINE B J.大规模个性化定制——企业竞争的新前沿[M].操云甫,译.北京:中国人民大学出版社,1999:125-250.

[4]王其和,张岚.独立院校大规模个性化定制教育策略及措施[J].河南教育:高教版,2013,(9):8-9.

[5]刘兹恒.信息媒体及其采集(第2版)[M].北京:北京大学出版社,2008.

[6]梁华.图书馆信息资源建设的意义与策略[J].辽宁教育行政学院学报,2009,26(7):173-174.

[7]肖希明.信息资源建设:概念、内容与体系[J].中国图书馆学报,2006,32(5):5-8.

[8]王路,程翠林,赵海田.中国高校本科通识教育课程二十年实践的问题与对策[J].黑龙江教育学院学报,2015,34(1):48-49.

[9]搜狗词库.http:∥pinyin.sogou.com/dict/detail/index/28394[EB/OL].2015-10-21.

(本文责任编辑:郭沫含)

猜你喜欢

信息资源建设客户满意度教育资源
面向数字化教育资源的Flash到HTML5转换研究
自主学习视角下的开放教育资源文献综述(上)
“五老”是金钱买不到的优质教育资源