基于多级知识表示结构的英语动词同形区分方法
2020-02-18付本静
付本静
摘 要:为了实现英语动词同形区分,提出基于多级知识表示结构的英语动词同形区分方法.构建英语动词同形语义结构模型,采用语义本体特征构造方法进行英语动词同形语义特征表达,提取英语动词的语义相关性特征量,结合属性聚类分析方法进行英语动词的同形特征演化分析,采用简单子句归结法进行英语动词同形区分过程中的最佳语法分析和同形特征校验,采用多级知识表示结构进行英语动词同形区分,结合语义相关度分析方法进行英语动词同形区分的语法分析和語义逻辑分析,建立英语动词同形区分的语义多级知识表达模型,在最佳语法分析方案下实现英语动词同形区分.仿真测试结果表明,采用该方法进行英语动词同形区分的适应度较高,区分的准确性较高.
关键词:多级知识表示;结构;英语;动词;同形区分;语义
中图分类号:TP391 文献标识码:A 文章编号:1673-260X(2020)01-0041-04
当前,随着英语动词同形特征的相似度越来越高,在进行英语学习和机器翻译设计中,需要重点进行英语动词同形区分,结合自然语言处理的方法,进行英语动词同形结构区域,建立英语动词同形多级知识结构模型,结合语义领域的本体模型设计方法,进行英语动词同形区分,利用英语动词同形分布,进行英语动词的多级知识结构表达,提高英语动词的词汇表达能力,相关的英语动词同形区分方法研究受到人们的极大关注[1].对英语动词同形区分是建立在语义特征提取基础上,结合英语动词同形分布,进行语义相似度特征提取,建立英语动词同形分布状态特征量,针对语法分析方法,进行英语动词同形区分和多级知识表示,本文提出基于多级知识表示结构的英语动词同形区分方法[2].构建英语动词同形语义结构模型,采用多级知识表示结构进行英语动词同形区分,结合语义相关度分析方法进行英语动词同形区分的语法分析和语义逻辑分析,建立英语动词同形区分的语义多级知识表达模型,实现英语动词同形区分,最后进行仿真测试分析,得出有效性结论.
1 英语动词同形语义结构模型及特征表达
1.1 英语动词同形语义结构模型
为了实现基于多级知识表示结构的英语动词同形区分,需要首先构建英语动词同形语义结构模型,采用语义本体特征构造方法进行英语动词同形特征分离[3],假设英语动词同形CS有m种不同的语法表达结构,如图1所示.
根据图1的英语动词同形语义结构分布,采用多元特征分布模型进行语法规则重建,建立语义相关性特征分布模型,采用权重约束方法,得到英语动词同形语义结构特征分布集,结合模糊度检测的方法,得到英语动词同形状态特征量,在语义方案Ai的情况下:假设英语动词同形状态分布集V为谓语中心词,英语动词的分级特征量S为V,O为V的承受者,在最大语义相关度约束下,用Wi是表示英语语句中的动词Wi,动词的多级知识结构为S、V,WGi是Wi的英语动词同形特征语义修饰目标,那么,英语动词同形状态分布的相关度为fAi,针对语法分析方案Ai,可以得到英语动词同形状态分布集:
fAi=KSVO*(match(S,V)+match(O,V))
用S和O表示英语动词同形特征分布的语义修饰特征集,得到英语动词区分的目标函数集为V,n是实词的个数.
设英语动词同形特征分布的实数集为β∈[0,T],在英语动词同形语言评价集S中,采用语法树分析方法,建立英语动词同形多级知识表达模型, 其中T为语言评价集S中元素的个数,采用最小属性特征划分的方法,进行英语动词同形结构组合分析,得到语义信息分布状态特征量为:
?驻:[0,T]→S×[-0.5,0.5] (2)
即 ?驻(?茁)=sk,K=round(?茁)ak=?茁-k,ak∈[-0.5,0.5) (3)
其中,round为四舍五入取整算子.结合标准的语法量化集进行自适应寻优[4],得到英语动词同形状态特征量为m,对不同语法树进行标准集区分,得到语义逻辑语法树结构模型为:
Ai=argmax(fAi) (4)
建立不同的参数值组合,采用分段划分的方法,将多级知识结构特征分为AB、AA或PD,在英语动词的特征分布集中得到,AB+S(或O)、AA+S(或O)、PD+V等简单语义集,采用语义本体特征构造方法进行英语动词同形语义特征表达,假定L的语义结构为:L→AAPDAB.根据上述分析,构建了英语动词同形语义结构模型.
1.2 英语动词的语义相关性特征量提取
在上述构建英语动词同形语义结构模型的基础上,采用语义本体特征构造方法进行英语动词同形语义特征表达,设{(s1,a1),(s2,a2),…,(sn,an)}是一组二元语义信息,在全局极值最优寻优状态下,得到相应的权重向量为ω=((ω1,a1′),(ω2,a2′),…,(ωn,an′))T,ωj∈[0,1],建立不同的参数值组合,得到英语动词的分级动态二元语义组合[5],构建加权算术平均算子φ2定义为:
其中,英语动词同形状态集被划分为连续的语义单元,为∑■■?棕j,s∈S,a∈[-0.5,0.5].根据上述分析,得到语义单元划分结果如图2所示.
采用有向图模型,进行英语动词同形状态分布式重构,在全局极值高度寻优下[6],得到语法树模型如图3所示.
对英语动词同形区分的综合评价矩阵为R=(rij,aij)m×n,多级知识表示的指标权重W=((?棕1,?茁1),(?棕2,?茁2),…,(?棕n,?茁n)),采用模糊度寻优方法对语法树进行归一化处理,得到:
在有向图模型中,得到标准化综合评价矩阵X=(xij,aij′)m×n和指标权重W=((?棕2′,?茁2′),(?棕2′,?茁1′),…,(?棕n′,?茁n′)).在此基础上,结合属性聚类分析方法进行英语动词的同形特征演化分析,进行英语动词的同形区分表达.
2 英语动词同形区分优化
2.1 同形特征校验
结合属性聚类分析方法进行英语动词的同形特征演化分析,采用简单子句归结法进行英语动词同形区分过程中的最佳语法分析和同形特征校验[7],最佳语法分析的量化特征集分别为:
对英语动词同形区分结构进行无量纲化处理,采用灰度分析的方法,建立英语动词同形区分的特征分布式提取模型,表示为:
建立不同的参数值组合,计算英语动词的同形相对贴近度,确定合理的权重系数,得到多级知识结构表达模型分别为:
式中,Ti为英语动词同形特征分布的相对贴近度,Yi为英语动词同形分布的多级知识结构模型.
采用统计分析的方法,定义英语动词同形特征分布的相对贴近度模型为:
Qi=xTi+yYi,x+y=1 (12)
式中,x和y反映简单语义单元特征集,即,x与y的值反映英语动词同形特征分布的偏好度,采用模糊聚类分析的方法,进行同形特征校验[8].
2.2 多级知识表示结构分析及同形区分
采用多级知识表示结构进行英语动词同形区分,结合语义相关度分析方法进行英语动词同形区分的语法分析和语义逻辑分析[9],构建语言评价集S,即S={s0=EP(语义相关度非常差),s1=VP(语义相关度很差),s2=P(语义相关度差),s3=M(语义相关度中等),s4=G(语义相关度好),s5=VG(语义相关度很好),s6=EG(语义相关度非常好)},得到英语动词同形区分的动态标权重矩阵分别为
建立不同的参数组合策略[10],进行英语动词同形区分.综上分析,得到算法的实现流程如图4所示.
3 仿真实验与结果分析
为了验证本文方法在实现英语动词同形区分中的应用性能,进行实验测试分析,英语动词同形区分的参数决策指标分布见表1.
根据上述参数寻优结果,结合属性聚类分析方法进行英语动词的同形特征演化分析,得到优化动词同形区分结果见表2.
采用简单子句归结法进行英语动词同形区分过程中的最佳语法分析和同形特征校验,测试区分的准确性,得到结果如图5所示.
分析上述仿真结果得知,采用该方法进行英语动词同形区分的适应度较高,区分的准确性较高.
4 结语
建立英语动词同形多级知识结构模型,结合语义领域的本体模型设计方法,进行英语动词同形区分,本文采用语义本体特征构造方法进行英语动词同形特征分离,在最大语义相关度约束下,采用最小属性特征划分的方法,进行英语动词同形结构组合分析,采用简单子句归结法进行英语动词同形区分过程中的最佳语法分析和同形特征校验,采用多级知识表示结构进行英语动词同形区分,结合语义相关度分析方法进行英语动词同形区分的语法分析和语义逻辑分析,在最佳语法分析方案下实现英语动词同形区分.分析得知,采用本文方法进行英语动词同形区分的适应度较高,区分的准确性较高,具有很好的应用价值.
参考文献:
〔1〕周孝青,段湘煜,俞鸿飞,张民.多层信息融合的神经机器翻译[J].厦门大学学报(自然科学版),2019,58(02):149-157.
〔2〕王卓,余正涛,文永华,高盛祥,吴飞.融合词汇翻译概率的汉越神经机器翻译方法[J].昆明理工大学学报(自然科学版),2019,44(01):54-60.
〔3〕于超,王璐,程道文.基于本体的教育资源语义检索系統研究[J].吉林大学学报(信息科学版),2018,36(02):207-212.
〔4〕吴飞龙,程承旗,陈波,等.基于剖分网格的多源资源环境数据统一检索方法[J].武汉大学学报(信息科学版),2017,42(07):943-949.
〔5〕燕蜻.基于二元语义的电子商务网站评价研究[J].图书情报工作,2010,54(10):139-142.
〔6〕庞锦平,陈永亮,刘谱等.立式磨床横梁结构优先设计与比较研究-基于模糊综合评价法、TOPSIS法和灰色关联分析法[J].工程设计学报,2013,20(2):89-95.
〔7〕阮诗芸.中国网络文学的海外传播对翻译研究的启示[J].燕山大学学报(哲学社会科学版),2019,20(01):11-18.
〔8〕吴江,唐常杰,李太勇,崔亮.基于语义规则的Web金融文本情感分析[J].计算机应用,2014,34(2):481-485.
〔9〕余传明,冯博琳,田鑫,安璐.基于深度表示学习的多语言文本情感分析[J].山东大学学报(理学版),2018,53(03):13-23.
〔10〕安静.基于依存句法分析与序列标注的英文长句机器翻译[J].兰州理工大学学报,2018,44(01):100-103.