谈用综合评价方法寻求合适的配偶
2014-12-24乔铁
乔 铁
(郑州大学,河南 郑州450000)
现在手机上出现了很多用来给相貌评分的软件,这些趣味软件制作初衷大多是为了博君一笑,不讲究评分的准确性和可重复性。 但是这也予人启发:如果婚恋网站的软件能更客观的给每个会员一个准确评分的话,网站就能更好帮助用户,从数百万人的资料中寻找到最符合要求的目标。 本文就探讨一下进行评价需要采集哪些信息,以及如何用综合评价的方法由个人信息得出更合理的评分。
介绍对象的时候通常需要询问择偶者,获得其对身高年龄等方面的要求。所以网站对会员评价前也要先采集身高,体重,年龄,相貌,财产等信息项,然后根据这些信息得到数字型的指标。 这些信息有些本来就是数字,例如身高年龄,可以把这些值直接作为指标值;有些则比较主观,例如相貌,这就需要先取得清晰的照片,之后依据下文的方法从中获得指标值。指标中有些是极大型的,例如收入,指标值是越大越好;有些是居中型的,例如体重,适中最好。 我们要把这些不同类型的指标统一转换成取值范围相同的极大型评分。 下面就具体地分项讨论。
1 身高的评价
常人觉的身高是越高越好, 但实际上配偶双方的身高差太大,不但生活中有很多不便,而且择偶者(评价结果使用者)也会感到不妥。因此目标的最佳身高可以由择偶者的身高加上(女性择偶者)或减去(男性择偶者)社会平均男女身高差确定,在此基础上依据择偶者偏好修正。 可见此项指标是一项居中性指标,最接近最佳身高的指标应取得最高分,偏离到一定程度取得最低分。用公式表示的话,目标身高指标记为H,根据择偶者身高和偏好确定的最佳身高为H0,当事人能接受的偏差值为ΔH,最高分为100 分,最低分为0 分,那么可以使用以下公式:根据身高指标获得评分。另外,年龄的性质和身高类似,评分也可用同样的方法得到。
2 体重的评价
体重是否合适与身高有关,目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准BMI 指数即身体质量指数, 是用体重公斤数除以身高米数平方得出的数字。 bmi 低于18.5 是过轻,18.5-24.99是偏瘦,20-25 是适中,25-28 是过重,超过28 为肥胖。 因此由身高和BMI 适中范围[20,25]能得到一个最佳的体重区间[G1,G2],在这个区间的体重都取得最高分100,超出这个区间递减;根据身高和BMI 指数18 和25 的界限可以得到体重可接受下限L1和上限L2,在界限处取得最低分0 分。 取得的体重指标记为G, 那么,体重的评分可以由以下公式给出:
3 财产的评价
虽然有人对财产是否越多越好有异议,这里还是根据一般人的看法,让更多的财产获得更高的评分。 不过财产也有边际效应,从0 到100 万和从100 到200 万意义完全不一样。 所以评分和财产值不视为线性关系。 由财产数目获得评分,如果要简单处理的话可以用一些初期定义域为0 到无穷大,值域为0 到100,既是单调增加且凸的函数来给出评分,例如:(其中W 为财产数目。ω 为系数,根据物价水平等因素确定)。
如果想要更有理论根据的话可以先对择偶者做一个调查,获得可接受最低财产数,较满意财产数,满意财产数,这些数目对应评分0分,60 分,80 分。这样把财产作为自变量,评分作为变量用程序进行拟合,得到拟合函数。 然后就可以用得到的函数对评价对象的财产指标进行评分。
4 相貌的评价
一般人把相貌看作是主观的事物,其实古人已经给出了一些客观的评价标准,例如“三庭五眼”。五眼指的是脸的宽度比例,以眼形长度为单位,把脸的宽度分成五个等分,从左侧发际至右侧发际,为五只眼形。 两只眼睛之间有一只眼睛的间距,两眼外侧至侧发际各为一只眼睛的间距,各占比例的1/5。 三庭指脸的长度比例,把脸的长度分为三个等分,从前额发际线至眉骨,从眉骨至鼻底,从鼻底至下颏,各占脸长的1/3。 当然这是古人的看法,未必准确,但是也说明了相貌与器官比例有关。 现代人可以用统计学获得最佳比例,例如,有人总结,理想的脸型产生距离。眼睛的宽度,应为同一水平脸部宽度的3/10;下巴长度应为脸长的1/5;眼球中心到眉毛底部的距离,应为脸长的1/10;眼球应为脸长的1/14;鼻子的表面积,要小于脸部总面积的5/100;理想嘴巴宽度应为同一水平脸部宽度的1/2。[2]那么就可以根据评分对象的标准照片来识别出各项比例,根据最佳比例用评价身高的方法对每一项进行评分,再用下文所述方法得到相貌综合分。相貌还取决于肤色,其影响更大的是肤色的均匀程度,肤色越均匀越好。对于这一项,可以从照片的皮肤部分选取采样点,从采样点获取亮度值,然后计算这些值的方差,方差越小说明肤色越均匀。
5 主观印象
如果除了以上信息之外还能获得第三方对评价对象的感受的话,也可以根据这些主观感受进行评分。 例如把感受分为很好, 较好,一般,较差,很差五个选项,用做选择题的方式让网站会员对浏览过的异性会员信息进行评价,我们可以把这些选择量化为100,80,60,40,20这样的数值评分,然后把所有网友评分的算术平均值作为主观方面的评分。
6 综合评价
依照以上方法得到了身高、体重等分项评分S1、S2,…,Sn,然后要根据这些分数获得最后的综合分。 因为各项的重要程度不同,所以要给各项以不同的权值ωi,让更重要的项对最终评分有更大影响。 权值要满足因为这样才能使综合评分有和分项分有一样的取值范围。这里指标的重要性是比较主观的东西,所以要采用主观赋权法。例如可以采用10 分制打分, 评价人按照自己的价值观对每项信息的重要性给出评分Ki,则权值有了各项评价分和各项的权值, 那么我们就可以根据某种评价模型获得综合评分,例如可以用线性加权综合模型,这时第j 个评价对象的综合分也可以使用非线性加权模型,这时第j 个评价对象的综合分还可以用逼近理想解法(TOPSIS),这些方法各有优劣。 如何选择,读者可以参考相关的资料。 这样,用综合评价模型依据每个评价对象的信息给出综合分,对评分进行排序之后就可把分值高的目标推荐给择偶人。
本文的方法适用于婚恋网站,这些网站可以在用户注册的时候要求提供各项个人信息和自己的倾向要求,然后依据用户(评价人)的倾向用综合的方法对网站的数据库里巨量的异性资料进行评分,这样就可以把分值高的推荐给用户。 如果要对模型改进的话,可以用数据挖掘工具对成功配对的会员进行分析, 然后根据获得的关联改进模型。此外,招聘网站亦可从本文得到借鉴。
[1]韩中庚.数学建模实用教程[M].北京:高等教育出版社,2012.