基于复杂网络的自动化专业知识体系分析
2016-04-14阎高伟张梦蓓程永强续欣莹
阎高伟, 张梦蓓, 程永强, 续欣莹, 谢 刚
(太原理工大学 信息工程学院, 山西 太原 030024)
基于复杂网络的自动化专业知识体系分析
阎高伟, 张梦蓓, 程永强, 续欣莹, 谢 刚
(太原理工大学 信息工程学院, 山西 太原 030024)
本文以自动化专业的课程、知识单元、知识点为节点,以其先学关系为连边构建自动化专业有向知识网络。利用复杂网络的理论和方法,对自动化专业知识网络的拓扑结构进行分析,挖掘其统计特性、社团结构等。将挖掘的特性与教学设计和学习引导相结合,有利于创新教学方法和提高学生学习能力,以期对自动化专业的本科教学产生积极影响。
知识网络;复杂网络;拓扑特性;教学改革
0 引言
随着知识经济时代的到来,人类社会进入了“知识大爆炸”的时代,人类的知识体系结构庞大而复杂,学习者在学习的过程中容易走弯路。这一问题在高校的专业知识学习中表现尤为明显。首先,大学生的学习以课程为单位,在对专业了解较少的情况下,一门课程接一门课程的学习,使学生头脑中不容易形成完整的结构化知识框架,不了解所开设的课程在所学专业知识体系中的地位与作用。其次,学生知识结构的单一性。学生可能单门课程成绩较好,但不明白各门课程之间的关系,只是机械地学习和记忆,很难用所学知识解决实际应用中的综合性问题。再者,学生对专业及自我认识不足,不清楚自己的知识结构在整个知识体系中所处的位置,在学习中不知自己与学习目标的差距以及如何朝着目标努力,在学习过程中缺乏引导。
尽管自动化专业现有的知识体系结构已相对完善和稳定,但在教学中也存在着教师难教、学生难学的问题。
针对这一系列问题,将复杂网络的理论和方法引入到自动化本科专业知识体系的分析中,对基于自动化本科知识网络的拓扑结构和统计特性进行分析,并结合自动化专业教学实际问题进行探讨,以期对上述问题的解决产生积极影响。
1 自动化专业知识网络建模
“知识网络”最早是由现代认知心理学家E.加涅于1985年提出,已经常出现于各类研究和应用中[1]。目前常见的专业知识网络构建大多以知识概念共现为基础,比如以物理用语为基本节点的物理知识网络,两个物理用语同时出现在一句话中就认为对应节点间有连边[2];以关键词为基本节点的信息服务知识网络,两个关键词在同一篇文献中出现则认为它们之间有连边[3]。
本研究选取自动化专业本科知识体系中的知识内容为节点,以知识点之间内在的先学关系为基础构建一个符合自动化专业知识内在规律的有向知识网络。
该知识网络建模选取表1中自动化本科专业常见的37门课程进行,其中包含287个知识单元、1422个知识点。建模时以知识点之间的先学关系为知识关联。现阶段共提炼出4988条知识关联,形成知识点为基础的知识点网络A1。在知识点网络A1的基础上,对节点进行归纳提升可以得到相应的知识单元,对知识单元的归纳提升可以得到相应的课程。因此可以形成分别以知识点为节点的知识点网络A1,以知识单元为节点的知识单元网络A2和以课程为节点的课程网络A3。知识点网络A1包含1422个节点,知识单元网络A2包含287个节点,课程网络A3包含37个节点。
表1 知识网络建模所用到的37门课程
三个层次的自动化专业知识网络中知识关联均可用邻接矩阵来表示。因邻接矩阵与其邻接网络之间是一一对应的,在此就不加以区分,下文中用矩阵A1,A2,A3或网络A1,A2,A3表述均可。网络A1可表示为A1=(V,E),其中V={v1,v2,…,vn}是网络中节点的集合,E={ei,j|i,j=1,2,…,n}为知识关联集合,ei,j为节点vi和vj之间的有向边。网络A2、A3也具有相同表示。
1.1 知识关联建模
在自动化专业知识点网络A1的知识关联建模过程中,知识关联是以节点的先学顺序为基础确定的。根据知识点之间存在的依赖关系,定义在学习知识点vj之前必须先学习的知识点vi为知识点vj的先行知识点,则知识点vj为知识点vi的后继知识点。在先行知识点和后继知识点间就建立一条知识关联。在关联建模的过程中,主要遵循以下4条原则:①知识点vj要用到知识点vi的理论;②知识点vj要用到知识点vi的器件;③知识点vj要用到知识点vi的方法;④知识点vj可与知识点vi进行类比。
知识网络A1建模过程中,只考虑方向不考虑权重,即知识关联的权重都为1。矩阵A1具体表示如式(1):
(1)
其中,ai,j=1表示知识点vi是知识点vj的先行知识点,否则ai,j=0。
1.2 知识网络提升
通过对节点与知识关联进行提升,得到以知识单元和课程为节点的自动化专业知识网络A2和A3,可以实现对以知识单元和课程为节点的知识网络的分析。网络A2和A3既考虑方向也考虑权重,权重表示的是两知识单元或两课程间在以知识点为节点的网络A1中包含的知识关联数量。邻接矩阵A2和A3中ai,j不再单纯取0、1,而是取其权重。
1.3 数据标准化
网络A2和A3的权重是基于网络A1的连接关系得到的。因此,权重的大小受到知识单元和课程中包含的知识点的数量的影响。为了消除这一影响,对矩阵A2和A3中的数据进行标准化。具体如下式:
(2)
G为标准化之后的网络。在以知识单元和课程为节点的知识网络中,其元素gi,j表示知识单元vi(或课程vi)与知识单元vj(或课程vj)的依赖强度。
图1是用Pajek软件画出的自动化专业知识网络的拓扑结构图。由于知识网络包含的知识点较多,把所有的知识点都显示在图中将无法看清网络的结构,为此图中只显示了部分知识点。图2展示了知识网络局部拓扑图。
图1 自动化专业知识网络示例图
图2自动化专业知识网络局部示例图(节点的大小与节点的度成正比)
2 自动化专业知识网络统计特性分析
2.1 节点度及度分布
对网络A1、A2和A3的度值进行统计可以看出,知识网络中,节点的度反映了其代表的知识点、知识单元和课程在整个学科中的地位及重要性,其中表2指出了度值较大的课程。对于度值大的知识点、知识单元和课程,应作为该专业中的重点进行学习,这将有利于加强学习者自身知识网络的稳定性。自动化专业知识网络是有向的,所以要分别考虑出度与入度的应用意义。入度表示的是要学习当前节点需要学习的先行节点的数目。出度表示的是当前节点是多少节点的先行节点。对网络A1和A2进行分析,统计结果表明:出度大的多为理论性和知识性的知识点或知识单元;入度大的多为综合性和应用性的知识点或知识单元。对网络A3进行分析,可以看出入度较大的课程是技能型专业课,如表3;出度较大的课程是公共基础课和专业基础课,如表4。
表2 度值较大的十门课程
表3 入度较大的5门课程
表4 出度较大的5门课程
度分布特性是分析网络结构特性的典型方法,现实中的复杂网络的度分布多符合幂律分布,具有无标度特性[4]。自动化专业知识网络A1的度统计结果表明,自动化专业知识网络接近于p(k)~αk-y,图3给出了其出度和入度的分布函数,对度分布函数进行拟合,得到入度分布函数中,γ=0.7448,α=0.352,出度分布函数中,γ=0.7026,α=0.303,接近于幂律分布。
在自动化专业知识网络A1中,节点的最大度值为62,而度值小于10的节点有1314个,占节点总数的90%以上。可见,知识网络中只有少数知识点具有较高的知识关联数,大部分知识点只有较少的知识关联数。说明自动化专业知识网络符合无标度网络少数节点拥有大量连接的特性。鉴于此特性,在教学中需要加强对具有较高知识关联的节点的学习,若此类节点缺失,将严重影响后续知识的学习。
2.2 聚集系数
与其他的知识网络的聚集系数相比较,发现聚集系数非常接近,如物理知识网络C=0.2~0.3[2];WIKI知识协作网C=0.107~0.222[5]。
2.3 介数
节点介数是网络中所有的节点对之间通过该节点的最短路径的条数。介数可用于衡量网络中节点作为中间节点的传递能力[6]。在知识网络中,一个节点的介数越大,说明经过该节点的知识路径越多,也就是说该节点在知识网络中“承前启后”的作用越明显。对于介数较大的节点,在教学过程中应作为重点进行学习,在学习新知识之前也应进行重点回顾,否则将不利于知识网络的连通性。
3 自动化专业知识网络在教学中的应用
3.1 社团结构在教学中的应用
复杂网络大多数具有一个共同的特征“社团性”,即整个网络由若干个“社团”组成。社团结构的发现有助于理解网络的功能[7]。为进一步挖掘自动化专业知识网络在教学中的应用意义,将社团划分引入其中,更好地帮助人们理解知识网络的拓扑结构并认识其功能。
对以知识单元为节点的知识网络进行社团挖掘,发现属于同一课程的知识单元具有明显的社团结构,如图4。但是有一些知识单元在社团划分之后会有不同的属性。例如M课程中的m知识单元被划分到了N课程。产生的原因可能有两种情况:①m知识单元确实与N课程中的n知识单元联系紧密,例如“计算机原理与应用”中的知识单元“半导体存储器”被划分到“数字电子技术基础”中,而该知识单元确实与“数字电子技术基础”中的知识内容有较强的关联;②m知识单元与N课程中的n知识单元有着很大的重叠度,例如“计算机网络与应用”中的知识单元“以太网技术”被划分到“现场总线控制技术”,而“现场总线控制技术”中还有知识单元“工业以太网”。
图4 知识单元社团划分结果
结合实际课程分析,发现划分结果对于教学设计有很大的辅助意义。将原因①结合教学实际,教师在授课过程中可将符合此类划分结果的知识单元在授课前进行回顾,有利于学生了解课程之间的关联,构建全面的知识框架,培养学生综合运用知识的能力。将原因②与教学实际结合,教师可以利用知识单元之间的重叠性,调整教学方法和课时安排。对于有重叠的知识单元中后讲的知识单元,教师可以让学生结合先讲的知识单元采取自主学习或探究学习的方法进行学习,培养学生的自主探究能力。或者对于后讲的知识单元进行合理的略讲,在做教学设计时缩短相应课时。
对以课程为节点的自动化专业知识网络进行社团划分,通过求模块度的最大值,获得最优的社团划分结果[7]。当社团个数为4时,模块度最大。由划分结果可以看出四个社团大致可描述为四类,分别为基础类、电气电子类、计算机技术类、自动控制类,分类结果如表5所示。分类结果基本上反映了自动化专业知识体系模块划分与组成。
表5 模块度最大时的课程分类结果
从表5中可以发现一些问题。例如“检测原理”被划分到基础类。从课程性质看,“检测原理”应该归属于专业课程,但由于“检测原理”课程内的误差分析等内容与数学类的课程关联度大,其中传感器部分的内容与“大学物理”的关联度大,因此网络分析计算的结果将该课程划分到基础类。“模式识别基础”与“人工智能导论”也被划分到了基础类中。主要因为这两门课程均与数学知识的关联强度大。另一方面反映了教学中存在的一些问题:“检测原理”是“控制仪表与装置”、“过程控制”等课程的基础,但是在这些课程中大多用到的是“温度”、“压力”、“流量”等概念,而对相关检测技术的应用拓展不足。“模式识别基础”、“人工智能导论”这两门课程更是偏重理论讲授,实际课程中对算法编程实现的内容偏少,不利于学生将理论和实际联系起来。
上述问题表明,在自动化专业的本科教学中,应注重专业课程之间的交叉应用,在后续课程中加强先学课程知识的运用,这将有利于学生通过课程内在的知识联系建立头脑中的知识网络,提高学生综合解决工程实践问题的能力。
3.2 根据目标知识点浮现知识脉络
基于自动化专业知识网络,可以模拟知识搜索路径来指导学生学习,实现根据目标知识点浮现知识脉络,起到辅助教学的功能。其具体步骤如下:
(1)基于选择的期望学习目标,在网络A1上找到该目标的知识子图;
(2)在知识子图中生成目标的局部知识子图;
(3)依据局部知识子图中的知识点与其他知识子图的联系,找到上一级的目标知识点;
(4)重复上述步骤,找到整个知识网络上的所有先学知识点;
(5)在知识网络上查看目标知识节点的后继知识点,了解目标知识点的延伸和应用。
上述过程模拟了知识网络上的路径搜索,从而找到目标知识点的所有先行知识点和后继知识点,有针对性的浮现特定知识点的学习脉络。
4 结语
本文构建了基于复杂网络的自动化专业有向知识网络,并对其拓扑结构进行分析,得到了自动化专业知识网络的特性,并结合教学实际问题进行分析和探讨,进一步挖掘知识网络在教学改革中的应用,有助于辅助教学设计及个人学习引导。基于自动化专业知识网络的研究仍有很大空间。例如:利用知识网络的划分结果进行课程重组,优化现有的课程结构;利用知识网络进行学习路径提取和导航,指导学生自主学习;利用知识网络辅助学生选课,让学生根据自身现有知识结构进行合理选课等。需要指出的是,本文所建立的知识网络还有待进一步完善,在以后的研究中将结合教学实际进一步优化知识点的划分,完善知识点之间的连接关系,同时还可将知识网络的构建和研究推广到自动化研究生教学领域和其他相关专业。
[1] 赵蓉英. 知识网络及其应用[M]. 北京: 北京图书馆出版社, 2007年8月.
[2] 崔雪梅,李凤月,Seung Kee Han等. 物理知识网络的特性分析[J]. 青岛:复杂系统与复杂性科学,2013, 10(2):30-36.
[3] 王建冬. 基于复杂网络方法的国内信息服务研究概念网络分析[J]. 北京: 现代图书情报技术,2009, (10):56-61.
[4] 汪小帆,李翔,陈关荣.复杂网络理论及其应用[M].北京: 清华大学出版社,2006年4月.
[5] 刘智洋, 刘鲁. Wiki网复杂网络特性分析[J]. 上海: 计算机工程,2011, 37(5):16-18.
[6] M.E.J. Newman. The structure and function of complex networks[J]. Philadelphian: SIAM Review, 2003, 45(2):167-256.
[7] 刘旭,易东云. 基于局部相似性的复杂网络社区发现方法[J].北京: 自动化学报,2011, 37(12):1520-1528.
Analysis of Automation Discipline Knowledge System Based on Complex Network
YAN Gao-wei, ZHANG Meng-bei, CHENG Yong-qiang, XU Xin-ying, XIE Gang
(CollegeofInformationEngineering,TaiyuanUniversityofTechnology,Taiyuan030024 )
Based on the curriculums, knowledge units and knowledge points of automation discipline serving as nodes, and the learning sequences of them being regarded as edges, a directed knowledge network of automation discipline is constructed. To mine the statistical characteristics and community structure, the theory of complex network is employed to analyze the topological structure of automation knowledge network. And the combination of teaching design, learning guide and characteristics having been mined will benefit the innovation of teaching methods and improvement of students' learning ability, which will have a positive impact for undergraduate teaching of automation discipline.
knowledge network; complex network; topological property; teaching reform
2015-09-15;
2016-01-09
阎高伟(1970-),男,博士,教授,主要从事自动化基础理论教学、知识网络等研究工作,E-mail:yangaowei@tyut.edu.cn
G420
A
1008-0686(2016)04-0001-05