基于无监督学习的英语语义翻译准确性评定系统设计
2021-05-11孙夏
孙 夏
合肥师范学院 外国语学院,安徽 合肥230601
一、引言
对翻译质量的评价研究是近些年语言处理方向的研究热点之一,对于翻译系统的深入研究具有重要意义[1]。但当前翻译准确性评定主要由相关领域的专家人工评价,但因各专家受自身的才能限制,导致结果准确性不高,不具有客观性。
为此,国内有学者提出基于神经网络的机器翻译评价系统[2],如文献[2]描述系统汉英翻译,在基础词汇、句子准确度和流畅度方面效果较好,无效翻译少,平均质量基本达到及格水准;与此同时,在罕见词、复杂长句、隐性逻辑等方面也相对由于其他机械翻译。上述研究结果表明,神经网络机器翻译质量较高,能为人类译员提供高效辅助。不足之处是,机器翻译存在无法克服的问题,尤其在文化、语境、交际等层面。文献[3]设计并改进基于语义网络的英语机器翻译模型,采用基于向量混合的短语合成语义统计英语机器翻译方法,在翻译相似度模型中,经过带权向量加法的计算,极易辨别两个相似向量的不同之处,从而获取精准的英语翻译结果。
构建英语语义翻译评定的约束对象模型,在语义相关度的最大关联约束控制下[4],构建英语语义翻译准确性评定的目标函数和约束参数集[5-6],可实现英语语义翻译准确性评定和优化设计,最后进行仿真测试分析,展示了本文方法在提高英语语义翻译准确性评定能力方面的优越性能。
二、英语语义翻译评定的约束对象模型
考虑目前已有翻译系统准确性不高、客观性差的特点,从语义翻译的角度入手,建立语义翻译评定的约束对象模型。
(一)上下文关联映射语义检索
为了实现基于无监督学习的英语语义翻译准确性评定,构建英语语义翻译评定的约束对象模型,采用上下文关联映射方法[7],实现对英语语义翻译准确性评价的模糊性融合处理。在英语语义上下文关联映射本体映射分布的关联规则约束控制下,得到英语语义上下文关联映射的相似度特征分布系数为ω=(ω1,ω2,…,ωi),ωi∈[0,1],采用自然语言映射和语义本体模块设计的方法,建立英语语义上下文关联映射本体参数分布规则集,表示为:
式中,a表示英语语义上下文关联词片段,s表示英语语义上下文关联映射。采用本体映射过程中概念之间语义特征分解的方法,得到英语语义上下文关联模型表示为:
式中,表示关键字词在全文中的权重。
在本体结构特征分布中,采用相似传递性原则实现对英语义分析过程中的块匹配和特征提取[8],构建语义映射的关系集合,如图1所示。
图1 英语语义翻译的语义映射关系集合
(二)语义本体结构特征构造
根据图1所示的语义映射的关系集合分布,实现对上下文关联映射语义检索,计算每个子句的语义相似度值,采用强化的无监督学习方法[9],分析英语语义翻译的语义本体特征集,建立本体之间多种语义映射模型[10],得到本体之间语义相关性特征量表示为β∈[0,1],即:
假设(sk,ak),k∈[-0.5,0.5)为上下文的本体结构特征分量,采用父概念(Super-Concept)和子概念(Sub-Concept)联合特征分析的方法,英语语义翻译准确性评定的模糊映射集为:
根据对英语语义翻译准确性评定的最佳约束函数构造,得到语义不相交映射关系模型表示为:
式中,λi为语义不相交映射的模糊加权值,p为决策概率。研究本体之间的语义泛化关系,得到2个英语语义翻译准确性评定的数据块m1和m2,使用关联语义模糊化解析模型[11],得到英语语义上下文的副本中的关联度为:
建立英语语义翻译准确性评定的语言语义相关度计算模型,采用无监督学习方法,得到英语语义翻译的语义映射模型[12],如图2所示。
图2 语义本体结构特征构造
三、英语语义翻译准确性评定优化
(一)无监督学习算法
曾有人提出深度信任网络无监督学习算法,通过无监督学习的方法来解决深度神经网络在训练上存在的问题。深度神经网络具有较好的特征学习能力,通过学习获得的特征更能对数据的本质进行描述,在数据可视化或分类等方面非常有效。采用无监督学习方法,实现对英语语义翻译过程中的非语句主干的分段学习控制[13],通过逻辑推理的方法,得到英语语义翻译的语义映射的关联度模型表达式为:
式中,x为本体之间语义映射因子,y为语义标识的最优解析因子,Hi为概念词语知识的语义分布函数。根据语义词典库和领域知识,采用无监督学习方法,得到语义翻译准确性评估的特征函数为:
分析每个普通实词的静态语义特性,本文定义一个动态传递函数描述英语翻译中存在的歧义项,进行上下文的语义映射[14],映射表达式为:
将各个分词的语义特征量采用模糊聚类方法实现信息融合,得到不同本体的概念分布序列e={e1,e2,…,ei},将连接词和逗号表示成析取形式,采用无监督的语义本体构造的方法,得到不同本体的概念之间的语义关联维分布为:
其中,t为给定的映射集合,n为不同本体的两个概念的相似度。语义等价模型为L(n),采用语义模糊化解析控制,得到无监督学习因子为:
根据上述分析,采用无监督学习方法,实现对英语语义翻译过程中的非语句主干的分段学习,根据分段学习结果实现语义翻译准确性评价。
(二)英语语义翻译准确性评定决策
随着翻译软件的革新,英语机器翻译软件的准确度已不能满足新的要求。在采用英语翻译软件进行英汉翻译过程中,受到英语语句的歧义性和语言表达习惯等因素的影响,导致英汉翻译中出现模糊语句,对语义的分析准确性不好,以致翻译质量下降,需要进行英汉翻译模型的优化设计。
在建立本体之间的语义映射时,把语义块的j个英语语义翻译的语义映射作为做信息包实现词语知识融合,得到概念集为Xj,在有向图节点模型中,将概念的语义表示成逻辑公式(g1,Y1),(g2,Y2),…,(gq,Yq),根据概念附近的各种本体相关性关系,得到语义标识过程的模糊度向量■,分析语义翻译的准确性评估模型,根据语义成分的逻辑相关性关系,得到英语语义翻译准确性评定结果,英语语义翻译准确性评定的暂态函数为:
式中,tc为[n+1]的语义相似度分布特征序列,ta为参考本体与概念本体的融合系数,得到英语语义翻译准确性评价的决策函数为:
在语义等价中,得到语义关系所对应的本体节点,定义两点之间的相似度特征分布聚类中心,在语义相关度的最大关联约束控制下,构建英语语义翻译准确性评定的目标函数和约束参数集[15]。根据对英语语义翻译准确性评定的无监督学习结果实现加权学习和自适应权重分析,结果如图3所示。
图3 英语语义翻译准确性评定决策实现流程
四、测试分析
为了测试本文方法在实现英语语义翻译准确性评定的应用性能,进行试验测试分析,试验的场景如图4所示。
图4 试验场景设定
根据图2的英语语义翻译准确性评定的实验场景设定,设定英语语义翻译语义评价集的个数为1 024个实例集,迭代次数为200,得到英语语义翻译准确性评定的模糊决策属性表见表1。
表1 英语语义翻译准确性评定的模糊决策属性表
分析表1结果,语义特征值越高,关联系数和相似度系数越高。由此揭示:对于不同语义,相似度随其特征值及关联系数总体呈现出正相关的表征。
为实现英语语义翻译准确性评定,英语语义翻译准确性评定的目标函数变化值如图5所示。
图5 英语语义翻译准确性评定的目标函数变化值
根据评定结果,测试英语语义翻译准确性评定的收敛性,得到结果如图6所示。
收敛性通常用于描述函数无限趋近于某值的性质,这里用一组函数计算结果的终值描述其收敛性,以进一步衡量翻译的准确性。
图6 收敛性分析
由图6得知,本文方法实现英语语义翻译准确性评定的收敛性较好。英语语义翻译准确性评定的
稳定性较高,评定结果可靠。结果如下图7。
图7 准确性分析
综上,本文实现英语语义翻译准确性评定的方法具有稳定性高,评定结果准确的优势。
五、结语
本文提出基于无监督学习的英语语义翻译准确性评定系统,采用相似传递性原则实现对英语语义分析过程中的块匹配和特征提取。建立本体之间多种语义映射模型,首先构建语言的内部意义翻译评定的约束对象模型,利用上下文关联映射,模糊性融合处理英语语义翻译准确性评价;其次根据英语语义上下文关联映射本体映射分布的关联规则约束控制,得到英语语义上下文关联映射的相似度特征分布系数,以实现对上下文关联映射语义检索。根据语义词典库和领域知识,采用无监督学习方法,分析每个普通实词的静态语义特性;根据对英语语义翻译准确性评定的无监督学习结果实现加权学习和自适应权重分析,由此实现英语语义翻译准确性评定决策。