APP下载

改进的重心剖分模型研究

2018-03-21潘梦真湖南师范大学数计院

数码世界 2018年2期
关键词:剖分欧式坐标系

潘梦真 湖南师范大学数计院

1 基于属性的重心剖分模型

自属性论被提出以后,不少的学者和研究人员都对其进行了深入的研究和学习,并提出很多优秀的改进意见和方案。从属性论在信息检索领域应用的情况来看,己有不少的研究人员利用属性论来为相似度计算以及信息检索进行模型的搭建。

1.1 文本属性坐标系

2 对重心剖分模型的改进

利用文档向量和查询向量来对文本的核心重心进行描述,可以得到信息之间的内在逻辑推理关系,使用文本属性的坐标系来对属性和元素之间的关系程度进行展现。

通过上面的两个重心公式可以知道,文本的向量与检索向量只是一种的关系。在这种情况下,如果使用欧式距离计算来算出相似度的值是没有实际的意义的。

另一方面,关于模型的不足如在文献[1]中的所提出的:查询向量用查询线与文本重心相交点表示,此时信息量与原本的信息量相比有一定的损失。因此,计算相似度的关键点在于如何将文本的重心考虑进来且不用欧式距离计算方式来找出一个更加合理的算法。

借鉴属性坐标学习分析法的构建,满意度函数可以解释为:在一个量纲的成绩单纯形中,可以量测心理标准与在这个成绩单中的某一个绩点的距离。该心理标准点是从心理学的角度出发的,以机器学习的方式来实现决策者的权重平衡点的获取。这个时候,对成绩点与心理标准点之间的距离是通过基于坐标的满意度函数来计算的,已经不属于欧式距离的范畴。

而对于信息查询来说,用户每一个查询需求对应的是一个坐标系中的查询向量:。这个向量与坐标轴所组成的投影点组成了一个为(n-1)维的查询向量单纯形,与此同时,文本向量也可以用这种方式得到一个维文本的单纯形。在构建的属性坐标系中,与前文所提到的属性坐标学习分析法是非常相似的,本文的文本中心点与学习分析法的心理标准点是一样的,都是对单纯形的一个评价点。交点即在单纯型中的待评价的交点。基于上述的信息,可以得出:在文本的重心点与匹配点的距离就可以使用来作为文章与检索词之间的相似度判断,该函数所得到的值越大,就说明它们的相似程度就越高。

这个单纯形的文本重心表示为:

将公式3和公式4结合起来,得出匹配基准点的坐标:

相似度的公式如下:

3 结束语

总的来说,本文所改进的相似度算法在文本相似度计算上表现较好,精确度能够满足需求。本文的算法适合对查询需求明确、专业的领域,在这些领域有着良好的应用能力,也为后来者提供了借鉴的思路。当前对于查询来说,只是与文本进行了相似性的分析,还没有涉及到对事物的本质进行分析研究。随着研究的深入,这些问题会逐步得到解决,将模型应用到发掘事物的本质和关系推理的处理能力是未来研究的重点方向。

[1]Zarovy S, Costello M. Extended State Observer for Helicopter Mass and Center-of-Gravity Estimation[J]. Journal of Aircraft,2015, 52(6):1-12.

[2]You S, Lu Y, Zhang W, et al. Micro-lens array based 3-D color image encryption using the combination of gravity model and Arnold transform[J]. Optics Communications, 2015,355(2):419-426.

[3]Golpira H, Messina A R. A Center-of-Gravity-based Approach to Estimate Slow Power and Frequency Variations[J].IEEE Transactions on Power Systems, 2017, PP(99):1-1.

猜你喜欢

剖分欧式坐标系
独立坐标系椭球变换与坐标换算
简约欧式9.4.4全景声影院 湖北恩施红星美凯龙
欧式花边的中西宫廷时尚表现
基于边长约束的凹域三角剖分求破片迎风面积
基于重心剖分的间断有限体积元方法
欧式城堡——木炭与色彩的碰撞
坐标系背后的故事
三角函数的坐标系模型
约束Delaunay四面体剖分
简约欧式风格在家装中的应用