APP下载

信息熵在系统结构外部影响测量中的应用

2016-06-24华中科技大学同济医学院公共卫生学院流行病与卫生统计学系430030万政策徐小兵熊光练

中国卫生统计 2016年2期
关键词:信息熵影响因素结构

华中科技大学同济医学院公共卫生学院流行病与卫生统计学系(430030) 万政策 徐小兵 熊光练



信息熵在系统结构外部影响测量中的应用

华中科技大学同济医学院公共卫生学院流行病与卫生统计学系(430030) 万政策 徐小兵 熊光练△

【提 要】 目的 探讨系统结构外部影响因素的测量方法。方法 以信息熵的原理和方法为基础,进行统计变换,然后结合多重线性回归分析方法,对系统结构的外部影响因素进行测量。结果 在实例分析中,武汉市某医院2013年和2014年治疗效果结构的构成比例非常接近,结构均衡指数分别为0.5339和0.5358。多重线性回归分析结果提示,危重病人抢救人次数、手术人次数、手术病人术后平均住院日、医院转诊率等四个因素是该医院治疗效果结构的影响因素。结论

信息熵能够较好地运用于多种结构数据中,帮助我们探索结构的外部影响因素。

【关键词】信息熵 结构 影响因素

信息熵作为现代生物医学研究的一种新思路和新方法[1],目前已广泛应用在遗传学、影像学、肿瘤和分子结构研究等领域,在疾病诊断和病理机制探索方面正逐渐展现出独特的优势。信息熵是一种测量系统结构信息量的方法,系统结构的稳定性会受到许多外部因素的影响,本文基于信息熵的理论和方法,结合多重线性回归,实现了对系统结构外部影响的测量,为结构数据的分析提供了一种新的思路和方法。

原理和方法

系统结构可以由多个类别构成。结构的表观特征一般用构成比来描述,结构的内在核心特征是结构所包含的信息量。结构的信息量度量用信息熵表示,信息熵可以反映系统结构无序或混乱的程度,系统越混乱,熵值越大;系统越有序,熵值越小[2]。信息熵最早由Shannon于1948年提出:

pi原指信源发出各种符号的频率或者概率[3],在本文中为系统各类别的构成比。系统共有n个类别,当各类别构成比相同时,信息熵值最大,最大值为log2n[4]。

结构均衡指数(BI)是信息熵与最大熵的比值,能够反应结构的均衡状态,取值范围为[0,1]。BI =0时,结构处于最不均衡状态,即此时结构有序性最高;BI =1时,结构处于最均衡状态,即此时结构有序性最低。BI的计算公式如下:

大数据模拟实验表明,对BI进行logit变换,变换后的值y服从正态分布。此时即可以y为因变量,外部因素为自变量,采用多重线性回归的方法测量外部因素对结构的影响。

实例分析

为进一步说明信息熵在系统结构外部影响测量中的应用,本文使用武汉市某医院2013年和2014年的数据,对该医院116个科室的治疗效果结构(治愈人数、好转人数、未愈人数、死亡人数)进行分析,计算并比较该医院两年的结构均衡指数,并测量危重病人抢救人次数、手术人次数、出院者平均住院日、手术病人术后平均住院日、亲属陪伴率、三日确诊率、医院转诊率等七个因素对治疗效果结构的影响程度。

分析步骤如下:

1.根据各个科室的治疗效果结构,计算各个科室的结构均衡指数。2013年结构均衡指数分布:中位数为0.3661,四分位间距为0.3579。2014年结构均衡指数分布:中位数为0.3567,四分位间距为0.3788。对两组结构均衡指数分布进行秩和检验,χ2=0.40,P =0.5285>0.05,说明尚不能认为两组分布不同。

2.分别计算2013年和2014年该医院治疗效果结构中各类别的构成比例,以及相应的信息熵和结构均衡指数。可以发现,2013年和2014年治疗效果结构的构成比例、信息熵以及结构均衡指数都非常接近,结构均衡指数分别为0.5339和0.5358。结果见表1。

表1 2013年和2014年该医院治疗效果结构情况

3.对结构均衡指数进行logit变换,以logit变换后的值为因变量,以待研究的七个因素为自变量,采用逐步回归的方法,入选标准为0.10,剔除标准为0.15,进行多重线性回归分析。2013年和2014年分析结果显示,危重病人抢救人次数、手术人次数、手术病人术后平均住院日、医院转诊率等四个因素是该医院治疗效果结构的影响因素。结果见表2和表3。

表2 2013年治疗效果结构影响因素分析结果

表3 2014年治疗效果结构影响因素分析结果

讨 论

结构均衡指数能够较好地反映结构的变动情况,从实例分析的结果中可以看出,该医院2013年和2014年的结构均衡指数分别为0.5339和0.5358,说明该医院的治疗效果结构在2013年和2014年处于比较稳定的状态。通常情况下,治疗效果结构在绝大多数科室中表现为治愈率和好转率较高,未愈率较低,死亡率最低。如果存在某外部因素能使得结构的均衡指数变大,治疗效果结构会朝着无序状态发展,结构各部分比例趋于一致,也就是治愈率、好转率下降,或者未愈率、死亡率上升,那么该外部因素就是治疗效果结构的危险因素;反之,该外部因素就是治疗效果结构的保护因素。2013年和2014年的多重线性回归结果均提示,危重病人抢救人次数、手术人次数、手术病人术后平均住院日是治疗效果结构的危险因素。原因可能是这三个因素均能在一定程度上反应病情的恶化程度,手术病人术后住院日在有关研究中已经被作为手术治疗效果的衡量因素[5]。2014年多因素结果提示,医院转诊率是治疗效果结构的危险因素。转诊病人的病情一般比较复杂和严重[6],转诊过程也会影响某些急性病的救治[7],转诊率高可能就会引起治疗效果结构朝着不合理方向改变。运用文中所探讨的方法,可以得到治疗效果结构的影响因素,从而为评价和管理医院的治疗效果结构提供有力的支持。

本文介绍的方法能够广泛地应用在医学相关领域中,除了文中进行阐述的治疗效果结构外,研究中还会遇到许多其他的结构数据。例如目前医疗费用由政府财政投入、社会投入、个人投入三部分组成,构成一个结构数据;该医疗费用结构受到国民收入总值(GDP)、居民可支配性收入、物价指数等因素的影响,可用该分析方法探究各个影响因素对医疗费用结构的影响大小。同样可用该方法分析平均医疗费用、平均住院日等因素对医保基金支出结构的影响。医学相关领域中大量存在的待研究的结构数据,使得该方法具有较好的实践性和现实意义。在实际应用中,文中所探讨的方法也会暴露一些不足之处,比如对于小样本数据,结构均衡指数进行logit变换后,并不一定服从正态分布,如果继续运用多重线性回归分析方法就会出现问题。尤其是结构均衡指数等于或者接近1或0时,logit变换后的值趋近正、负无穷大,对分析的结果会产生较大的影响,这时就需要对强影响点进行相应的处理[8],以提高回归方程的质量。

参考文献

[1]张岱,金宝荣.信息熵在现代生物医学中的应用.数理医药学杂志,2001,(1):74-75.

[2]张登兵,刘思峰.熵与系统有序性研究综述.数学的实践与认识,2008,(24):200-206.

[3]Shannon C.A Mathematical Theory of Commumication.Bell System Technical Journal,1948,27(3):3-55.

[4]田振清,周越.信息熵基本性质的研究.内蒙古师范大学学报(自然科学汉文版),2002,(4):347-350.

[5]Cohan JN,Bacchetti P,Varma MG,et al.Outcomes after ileoanal pouch surgery in frail and older adults.J Surg Res,2015,198(2):327-333.

[6]陈敏.危重患者在基层转诊中存在风险因素及护理干预措施.蚌埠医学院学报,2014,39(7):985-987.

[7]田静,李颖.急性缺血性脑卒中患者院前延误因素的调查与研究.中国卫生统计,2014,(4):622-624.

[8]曲桂玉,陈景武,杜国防.多元回归分析肺吸虫囊蚴脱囊影响因素中有关异常点的探讨.数理医药学杂志,2007,20(2):188-190.

(责任编辑:邓 妍)

通信作者:△熊光练,E-mail:weixiong@ mails.tjmu.edu.cn

猜你喜欢

信息熵影响因素结构
基于信息熵可信度的测试点选择方法研究
《形而上学》△卷的结构和位置
论结构
一种基于信息熵的雷达动态自适应选择跟踪方法
论《日出》的结构
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于系统论的煤层瓦斯压力测定影响因素分析
基于信息熵的循环谱分析方法及其在滚动轴承故障诊断中的应用
创新治理结构促进中小企业持续成长