基于粗糙集的学生综合能力判定
2018-01-05马利民裴耀祖白顺宝
马利民 裴耀祖 白顺宝
【摘要】 本文借鉴多属性多准则粗糙集模型,建立相应的智能计算模型,以准确的判断学生的综合能力和兴趣点,旨在帮助教师合理地制订教学方案.
【关键词】 因材施教;学生能力判断;教学方案制订;粗糙集理论
一、引 言
在教育教学中,因材施教是一种非常重要的教育手段,若应用合理,能最大限度地挖掘学生潜力.在实际教学活动中,教师需要有目的、有计划、有组织地去引导学生积极自觉地学习.若找到学生的智能发光点,教师和家长应依据孩子的特点,构建相应的学习计划和课外活动,可激发学生的学习兴趣和潜在的能力.那么如何正确判断学生的综合能力,如何找每名学生的兴趣点?
1982年,波兰学者Pawlak提出的粗糙集理论(其英文名为Rough Set),其主要用来研究不精确、不确定以及不完整的数据或知识的表达、学习和归纳.自从20世纪80年代末以来,粗糙集在数据挖掘、机器学习、模式识别等学科中有了广泛的应用.
在学生的综合判断中可能会用到多种类型的属性和准则,如性别、成绩等,所以本文借鉴多属性多准则粗糙集模型.其针对决策表属性集合存在定性属性、定量属性、定性准则和定量准则的情况,构造知识粒子时需同时考虑四种关系:等价关系,相似关系,支配关系和拟半序关系.由此可以从多属性多准则粗糙集模型中导出三大类决策规则.从而得到每名学生相对较好的综合评价,据此建立相应的教学计划.
二、多属性多准则统计粗糙集模型
定性属性是属性值以代表类别的抽象概念或符号形式存在的属性,定量屬性是属性值以代表类别的具体概念或基数形式存在的属性,定性准则是准则值以代表级别的概念或符号形式存在的准则;定量准则是准则值以序数形式存在的准则.
用四元组S=<U,A,V,f>表示多准则多属性决策表,其中,U为论域;A=C∪D,C∩D=,C为条件属性集合,把C分为C≥,C>,C=,C~,C≥是定性准则集合,C>是定量准则集合,C=是定性属性集合,C~是定量属性集合,D为决策属性集合,且C≥∪C>∪C=∪C~∪D=A;V=∪ a∈A Va,Va为属性a∈A的属性值值域;信息函数f指定U中每一个对象x的属性值.对于 x∈U,与x存在关系的对象组成的集合称为x的邻域,即n(x)={y∈U:xRy},x的邻域系统是x邻域的非空集合,标记为US(x).概念X U的邻域系统为US(X)=∪ x∈X n(x).利用决策准则D可把论域U中的对象分为n个有序决策类Cl1,Cl2,…,Cln,即Cl={Clt,t∈T},T={1,2,…,n},并且 u,v∈T,若u>v,则Clu中的元素比Clv中的元素好.
本文针对决策表属性集合存在定性属性、定量属性、定性准则、定量准则的情况,同时用等价关系、相似关系、支配关系、拟半序关系去构造知识粒子.
被近似集合为t-上合集Cl≥t=∪ s≥t Cls和t-下合集Cl≤t=∪ s≤t Cls.
对于P C,P仍然可分为P≥,P>,P=,P~,其中,P≥=P∩C≥是用支配关系处理的定性准则集合,P>=P∩C>是用拟半序关系处理的定量准则集合,P==P∩C=是用等价关系处理的定性属性集合,P~=P∩C~是用相似关系处理的定量属性集合.P≥,P>,P=,P~需要满足条件P≥∪P>∪P=∪P~=P且任意两个子集合的交集为空,即P≥∩P>=且P≥∩P==且P≥∩P~=且P>∩P==且P>∩P~=且P=∩P~=.
x,y∈U, q∈P≥,x定性支配y关于P≥,标记为xDPy; q∈P>,x定量支配y关于P>,标记为xBu1Py,其中u1为定量支配阈值; P P=,x与y无差异关于P=,标记为xIpy; P P~,x相似于y关于P~,标记为xRu2Py,其中u2为相似阈值.由于对象之间的关系由对象之间的属性值所体现,即
x,y∈U, q∈P≥,xDPy当且仅当f(x,q)≥f(y,q); q∈P>,xBu1Py.当且仅当 f(x,q)-f(y,q) f(y,q) ≥u1 % ,u1为定量支配阈值; q∈P=,xIpy当且仅当f(x,q)=f(y,q); q∈P~,xRu2Py当且仅当 |f(y,q)-f(x,q)| f(y,q) ≤u2 % ,u2为相似阈值.
通过分析可知, x,y∈U, q∈P≥,f(x,q)≥f(y,q)表示关于P≥,x定性支配y;f(x,q)=f(y,q)表示关于P≥,x与y无差异;f(x,q)≤f(y,q)表示关于P≥,x被y定性支配.然而, q P>, f(x,q)-f(y,q) f(y,q) ≥u1 % 表示关于P>,x定量支配y; f(y,q)-f(x,q) f(y,q) <u1 % 表示关于P>,x不被y定量支配; |f(x,q)-f(y,q)| f(y,q) <u1 % 表示关于P>,x与y无差异; f(y,q)-f(x,q) f(y,q) ≥u1 % 表示关于P>,x被y定量支配,其中0≤u1≤1是定量支配阈值.若f(y,q)≠0,则:
(1) f(x,q)-f(y,q) f(y,q) ≥u1 % f(x,q)≥(1+u1)f(y,q);
(2) f(y,q)-f(x,q) f(y,q) <u1 % f(x,q)>(1-u1)f(y,q);
(3) |f(x,q)-f(y,q)| f(y,q) <u1 % (1-u1)f(y,q)<f(x,q)<(1+u1)f(y,q);
(4) f(y,q)-f(x,q) f(y,q) ≥u1 % f(x,q)≤(1-u1)f(y,q).
现在,给出两个二进制关系,记为MP和M*P,对于 x,y∈U有
xMPy当且仅当 P∈P≥有xDPy, P∈P>有xBu1Py, P P=有xIPy, P P~有yRu2Px.
xM*Py当且仅当 P∈P≥有xDPy, P∈P>有xBu1Py, P P=有xIPy, P P~有xRu2Py.
由MP和M*P产生四类知识表达粒子ML+P(x),MU+P(x),ML-P(x),MU-P(x):
ML+P(x)={y∈U|yMPx};
MU+P(x)={y∈U|yM*Px};
ML-P(x)={y∈U|xM*Py};
MU-P(x)={y∈U|xMPy}.
定義1 若P C,t∈T,则Cl≥t的P-下近似为
P-(Cl≥t)={x∈U|ML+P(x) Cl≥t}. (1)
Cl≥t的P-上近似为
P-(Cl≥t)={x∈Cl≥t|MU+P(x)∩Cl≥t≠}. (2)
Cl≥t的边界为
BnP(Cl≥t)=P-(Cl≥t)-P-(Cl≥t). (3)
同理,Cl≤t的P-下近似可以被定义为P-(Cl≤t)={x∈U|ML-P(x) Cl≤t};Cl≤t的P-上近似可以被定义为P-(Cl≤t)={x∈Cl≤t|MU-P(x)∩Cl≤t≠},Cl≤t的边界为BnP(Cl≤t)=P-(Cl≤t)-P-(Cl≤t).
定义2 若P C,t∈T,则Cl≥t的近似精度为
P(Cl≥t)= card(P-(Cl≥t)) card(P-(Cl≥t)) . (4)
Cl≤t的近似精度为
P(Cl≤t)= card(P-(Cl≤t)) card(P-(Cl≤t)) . (5)
定义3 若P C,t∈T,则决策类集合Cl的近似质量为
γP(Cl)= card U- ∪ t∈T BnP(Cl≥t ∪ ∪ t∈T BnP(Cl≤t) card(U) . (6)
由性质3可知:
γp(Cl)= card U- ∪ t∈T Bnp(Cl≥t) card(U) = card U- ∪ t∈T Bnp(Cl≤t) card(U) .
三、基于粗糙集的学生综合能力判定系统
学生综合能力判定系统本质是一个分类(或分级)决策系统,其可以归结为用一组属性(或准则)描述的决策对象(或方案)分类(或分级)到预先定义的决策类中.早期主要用统计学的方法来解决,这类方法可以比较好的帮助人们理解分级问题的特征,但它过分依赖某些苛刻的统计假设.随后,一些学者提出了基于人工智能的分级决策模型,但是假如涉及的系统比较复杂时,这类模型很难找到合适的关系完整的表示出决策模型,并且需要决策者给出一些偏爱信息(这类信息通常以参数的形式给出,如权重、阈值、替代率等).由于决策者的决策行为有时是无意识行为,只是凭着感觉和经验做出判断或选择,一般更倾向于给出一些决策例子,而不是将决策行为解释成关系模型的参数.并且,决策者的犹豫、偏爱等不稳定因素会导致出现不协调例子,需要在构造偏序模型时加以考虑而不能当成噪声干扰而简单忽略.所以,出现了从决策者的经验决策数据(例子)中导出偏好模型的理论与方法,粗糙集理论提供了从决策例子中导出决策规则的有效方法.
下表用来说明多属性多准则决策表,表1的论域U={w1,w2,w3,w4,w5,w6,w7,w8}为一名学生集合,以及6个条件属性:
A1,性别;
A2,数学成绩;
A3,语文成绩;
A4,英语成绩;
A5,体育成绩;
A6,美术成绩;
1个决策属性:
D,学生综合能力.
令C={A1,A2,A3,A4,A5,A6}和D={d}.通过分析可知A1定性属性,A2,A3,A4是定量准则,A5,A6是定性准则.
从多属性多准则决策表可以得到上、下近似集合和边界集合.由定义1,可以得到三大类决策规则,即M≥决策规则、M≤决策规则,M≥≤决策规则.其中P-(Cl≥t)中的对象支持M≥决策规则、P-(Cl≤t)中的对象支持M≤决策规则,P-(Cl≥t)∩P-(Cl≤s)中的对象支持M≥≤决策规则.
(R1)M≥决策规则的形式
如果f(x,q1)≥r1并且…f(x,qu)≥ru并且f(x,qu+1)稍大于ru+1并且…f(x,qv)稍大于rv并且f(x,qv+1)=rv+1并且…f(x,qw)=rw并且f(x,qw+1)相似于rw+1并且…f(x,qz)相似于rz,则x∈Cl≥t.
其中:p≥={q1,q2…qu},P>={qu+1,qu+2…qv},p=={qv+1,qv+2…qw},p~={qw+1,qw+2…qz},并且(r1,r2,r3,…,rz)∈Vq1×Vq1×…×Vqz.
(R2)M≤决策规则的形式
如果f(x,q1)≤r1并且…f(x,qu)≤ru并且f(x,qu+1)稍小于ru+1并且…f(x,qv)稍小于rv并且f(x,qv+1)=rv+1并且…f(x,qw)=rw并且f(x,qw+1)相似于rw+1并且…f(x,qz)相似于rz,则x∈Cl≤t.
其中:p≥={q1,q2…qu},P>={qu+1,qu+2…qv},p=={qv+1,qv+2…qw},p~={qw+1,qw+2…qz},并且(r1,r2,r3,…,rz)∈Vq1×Vq1×…×Vqz.
(R3)M≥≤决策规则的形式
如果f(x,q1)≥r1并且…f(x,qu)≥ru并且f(x,qu+1)≤ ru+1并且…f(x,qv)≤rv并且f(x,qv+1)稍大于rv+1并且…f(x,qt)稍大于rt并且f(x,qt+1)稍小于rt+1并且…f(x,qs)稍小于rs并且f(x,qs+1)=rs+1并且…f(x,qw)=rw并且f(x,qw+1)相似于rw+1并且…f(x,qz)相似于rz,则x∈Cls∪Cls+1∪…∪Clt.
其中:p≥={q1,q2…qu}∪{qu+1,qu+2…qv},P>={qv+1,qv+2…qt}∪{qt+1,qt+2…qs},p=={qs+1,qs+2…qw},p~={qw+1,qw+2…qz},并且(r1,r2,r3,…,rz)∈Vq1×Vq1×…×Vqz.
根据上述三大类决策规则,可以得到每名学生的综合评价,教师基于此可制订出适合不同学生的培养计划和教学方案.
四、结 论
本文结合实际需求,为了更好地实施因材施教教学手段,借鉴多属性多准则粗糙集模型,建立粗糙集的学生综合能力判定系统.
【参考文献】
[1]王倩怡.多属性多准则概率粗糙集模型研究[D].兰州:兰州大学,2016.
[2]瞿彬彬,卢炎生.基于粗糙集的属性约简算法研究[J].华中科技大学学报,2005(8):30-33.
[3]刘丽艳,郑丽英.面向属性的决策规则挖掘算法的研究与应用[J].电气传动自动化,2005(5):13-15.