相似度分析方法在亚健康状态症状指标分析中的应用*
2011-05-23李中平沈红艺何裕民倪红梅
李中平 沈红艺△ 苏 越 何裕民 倪红梅
化学计量学及相似度理论已渐渐应用到许多研究领域。作为一个新方法,已为中药指纹图谱的定性定量分析提供了理论依据〔1〕,为寻找中医证候特征提供一种新的思路和方法〔2〕。本文尝试采用4种相似度匹配方法〔3〕对亚健康状态的症状进行相似性分析,提取相似要素,为简化临床指标数量,寻找亚健康状态的临床特征提供简捷、可靠的方法。
亚健康是处于疾病与健康之间的一种状态或一个过程,虽无明确的疾病,但在躯体上、心理上出现种种不适应的感觉和症状群〔4〕,由于含有多领域复杂变量以及变量间关系需要确定等因素,目前尚没有公认的测量评估方法,因此给临床的深入研究带来困难。本研究应用相似度分析的方法,对亚健康流行病学调查信息资料进行分析,旨在精简符合亚健康状态的临床特征指标。
资料与方法
1.资料来源
本资料来自国家科技部“十一·五”科技支撑计划亚健康课题组的调查人群数据库(纳入标准:年龄20~60岁,性别不限,调查时患急、慢性疾病的对象予以排除,愿意合作),随机选取240例流调资料作为本研究分析的对象。
在前期工作的基础上〔5〕,将课题组研制的“中国人亚健康状态评估表"中所包括的三个领域(躯体表现、心理表现、社会适应性)、12个方面(疲劳、消化、睡眠、植物神经系统、免疫力、衰老、抑郁、焦虑、安全感、学习和记忆力、社会适应、生活方式)共78个症状(如疲劳感、消化不良、睡眠障碍等)作为观察指标。将自觉症状程度分4级赋值量化:“从不”赋值为1分,“很少”赋值为2分,“一般”赋值为3分,“经常”赋值为4分,“总是”赋值为5分。自评打分、经线性转换后的亚健康指数得分为实际数值。
2.分析方法
(1)数据处理方法 为尽量减少量纲差异,对变量进行归一化处理。即:设aij表示第i个研究对象的第 j个特征(i=1,2,…,240,j=1,2,…,78),Mj=max(aij);将aij重新赋值,即aij=aij/Mj。经过处理的特征值介于0到1之间。
(2)相似度分析方法 计算系统相似度数值的大小可表示为数学表达式Q=f(K,L,n,u)。其中,K和L分别表示两个系统的各自组成要素的数量,n表示相似要素的数量,u表示相似要素的相似程度。由相似要素的数量确定的相似度为数量相似度,记为Q。
我们考察研究对象集合各个症状之间的相似度,可将两个待计算相似度的症状看作两个系统A和B,假设对照系统中有n个要素,可用n维向量A=[a1,a2,…,an]表示系统A的共有模式,其中ai为 A系统对应的第i个对象的量化值,即特征值。那么,两个系统A和B的相似度可表示为:Q=f(A,B)。
夹角余弦和相关系数法是常用的中药指纹图谱相似度的计算方法;相似度D法是化学计量学中计算匹配的方法;谱图相似度法主要应用在质谱谱图的相似度匹配。其计算公式分别如下:
①夹角余弦(Cosine Distance,CD)法〔6〕:
② 相关系数(correlation coefficient,CC)法〔7〕:
以上4种相似度计算法,Q值越大,表示A变量与B变量越接近。4种算法通过VB程序设计语言编程实现。
运用上述4种方法对亚健康的12个方面共78个症状进行相似度分析。根据数学原理,4种相似度法计算所得的相似度数值在0~1之间,取值为1,则为两者完全相同;取值为0,则为两者完全无关。在0~1之间,数值越大,说明两者相似度程度(关联性)越高。
因此,通过对所获得的计算结果,从亚健康状态的78个症状变量中筛选出高相似度的症状,为亚健康状态的临床指标数量的简化提供依据。将相关系数法、夹角余弦法、相似度D法和谱图相似度法分别设定不同的界限值(分别设为 0.75、0.95、0.90、0.98)。若某个症状与另一个症状的相似度值大于该值时则认为这两个症状是相似的(有关联)。
结 果
4种不同方法筛选出部分相似程度高的变量分别是颈部酸痛、膝关节酸痛、腰背疼痛、胸闷、气促、自责、抑郁、焦虑、紧张、人际关系满意度、工作胜任度、职业满意度、社会适应度、性生活满意度、身体状况自评、心理状况自评、生活质量自评、亚健康指数。
其中,相关系数法分析表明(设界限值0.75):颈部酸痛与膝关节酸痛、腰背疼痛相关;自责与抑郁相关;相关抑郁与焦虑、心理自评、亚健康指数相关;身体自评与心理自评、生活质量自评(r=0.8221)、健康指数相关;心理自评与生活质量自评、亚健康指数相关。
夹角余弦法分析表明(设界值为0.95),颈部酸痛与膝关节酸痛、腰背疼痛相关;抑郁与焦虑、紧张相关,焦虑与紧张相关;人际关系满意度与职业满意度、工作胜任度、社会适应度、性生活满意度相关;职业满意度、工作胜任度及性生活满意度与社会适应度相关;身体自评与心理自评相关;生活质量自评相关,心理自评与生活质量自评相关。
相似度D方法分析表明(设界值为0.90);胸闷与气促相关;颈部酸痛与膝关节酸痛、腰背疼痛相关;抑郁与焦虑、紧张相关,焦虑与不安全感、紧张相关;人际关系满意度与安全感、工作胜任度、社会适应度相关;自我满足感与效率感相关;安全感、职业满意度、工作胜任度及性生活满意度与社会适应度相关;身体自评与心理自评、生活质量自评相关,心理自评与生活质量自评相关。
相似度SS方法分析表明(设界值为0.98),颈部酸痛与膝关节酸痛、腰背疼痛相关;抑郁与焦虑、紧张相关;焦虑与紧张相关;人际关系满意度与职业满意度、工作胜任度、社会适应度、性生活满意度相关;职业满意度与工作胜任度、社会适应度、性生活满意度相关;工作胜任度与社会适应度、性生活满意度相关;社会适应度与性生活满意度相关;身体自评与心理自评、生活质量自评相关;心理自评与生活质量自评相关。
4种方法得到的结果基本一致,除了躯体领域和心理领域,相似度D法、夹角余弦法和谱图相似度法还突出了社会适应领域的重要变量,与传统的相关系数法相比匹配度显著提高,灵敏度高、取舍定量合理,较切合临床实际。
讨 论
本研究采用相关系数、相似度D、夹角余弦、谱图相似度4种方法对“中国人亚健康评估量表”〔5〕所测定的3个领域共78个症状变量间的相似度进行分析,期望能达到简化亚健康状态的症状指标,探讨亚健康状态客观化评价方法学研究的目的。
在躯体领域中,颈部酸痛、膝关节酸痛、腰背疼痛相似程度高。疼痛是机体各种知觉中相对疲劳、消化、睡眠等多种不适而言更为敏感、更加直接影响到生存质量的一个重要症状指标。由于亚健康本身不属于一个明确的疾病,根据较大规模的流行病学调查,亚健康状态的慢性疼痛还具有不确定性、走窜性,甚至存在心理性疼痛等现象,因此,对亚健康状态的判定,没有必要明确到具体部位的疼痛。本研究计算结果显示,不同部位的疼痛具有高度相似性,因此可以考虑将颈部酸痛、膝关节酸痛、腰背疼痛这三个症状指标合并为一个指标。同样,由于胸闷与气促具有较高的相似性,且都属于呼吸系统的功能或适应低下的状态,也可以考虑简练成一个症状指标。
抑郁、焦虑、紧张三者的相似性高,作为亚健康状态心理领域的重要指标,这些不良心理状态的产生,主要是受工作压力大、生活节奏快、精神压抑等负性刺激所致的一系列心理上的功能低下或者不适的表现,这些不良心理状态常常相伴出现或交接出现。因此,考虑到心理领域症状的相似性以及共同的社会-心身影响因素,抑郁、焦虑、紧张等症状指标也可以作进一步提炼。
成功的社会适应使个体在工作和人际关系中不断发挥作用并体验到舒适感和愉悦感等正面情绪;相反,不良的社会适应通常伴有心理及生理上的功能低下和不适,成为较典型的亚健康状态。在社会适应领域中,人际关系满意度、职业满意度、工作胜任度、自我满足感、效率感等相似度较高的症状指标来看,可以进一步精简,如将人际关系满意度、职业满意度、工作胜任度、自我满足感、效率感等提炼归纳为“社会适应度”一个症状指标。
本研究4种分析方法结果基本一致。但医学上常用的相关系数法所反映相似症状指标较少,而其它3种方法在界限值提高的前提下反而获得了更多的有价值的临床信息,表明与传统的相关系数法相比,灵敏度提高,也较为切合临床实际。通过相似度分析从高相似度的症状中选择具有符合临床实际的评价指标,为亚健康状态的症状指标简化和客观评价提供了方法学依据。相似度D、夹角余弦、谱图相似度法可作为对相关系数法的一个有益的补充。
1.梁逸曾,龚范,俞汝勤.化学计量学用于中医药研究.化学进展,1998,11(2):208-212.
2.苏越,王磊,张华,等.肝炎后肝硬化中医征候与疾病信息相似度分析.中国中西医结合杂志,2009,29(5):398-402.
3.周美立,王浣尘.相似系统的分析与度量.系统工程,1996,14(4):1-6.
4.何裕民,沈红艺,倪红梅,等.亚健康的范畴研究.医学与哲学,2008,29(1):2-4.
5.徐丽,夏结来.中国人亚健康状态评估表条目的初步筛选.中国卫生统计.2009,26(1):29-34.
6.相秉仁.计算药学.北京:中国医药科技出版社,1990:160-163.
7.Christensen JH,Mortensen J,Hansen AB,et al.Chromatographic preprocessing of GC-MS data for analysis of complex chemicalmixtures.Chromatogr A,2005,1062(1):113.
8.许禄,郭传杰.计算机化学方法及应用.北京:化学化工出版社,1990:114-117.
9.苏越,廖远熹,郭寅龙.色相色谱/离子阱质谱中组分图谱提取的主成分分析方法.化学学报,2007,65(14):1377-1380.