APP下载

集对分析在职业卫生管理状况聚类分析中的应用

2015-03-09孙爱峰孙齐蕊白城市卫生急救中心吉林白城37000吉林大学公共卫生学院吉林长春300

中国卫生产业 2015年18期
关键词:聚类分析

孙爱峰,孙齐蕊.白城市卫生急救中心,吉林白城 37000;.吉林大学公共卫生学院,吉林长春 300

集对分析在职业卫生管理状况聚类分析中的应用

孙爱峰1,孙齐蕊2
1.白城市卫生急救中心,吉林白城137000;2.吉林大学公共卫生学院,吉林长春130021

[摘要]目的探讨集对分析在职业卫生管理状况聚类分析中的应用价值。方法应用集对分析理论聚类分析我国2003 年10个调查省市职业卫生管理状况。结果Ⅰ类职业卫生管理状况包括地区1、2、3、5、9和10,Ⅱ类包括地区4、6和8,地区7属于Ⅲ类。结论应用集对分析理论进行聚类分析具有一定的应用价值,其关键在于等级数目的确定和各等级定量观测值范围的合理划分以及联系数有效值的计算和不确定度分析,以合理划分并观察其类别的动态变化。

[关键词]联系数;集对分析;职业卫生管理;聚类分析

职业卫生管理是维护劳动者身体健康,预防和控制职业因素危害的重要措施。在职业卫生管理中,一般采用多指标体系描述并评价其职业卫生状况,但由于不同评价指标观测值的参差不齐,这需要运用相应的统计方法进行综合评价。为此,该研究者应用集对分析对2003年我国10个调查省市职业卫生管理状况进行聚类分析,更好地指导职业卫生管理工作,发挥职业卫生监督的作用。现报道如下。

1 资料与方法

1.1资料来源

原卫生部于2003年按不同地区经济发展水平,分层选取10个省、直辖市(北京、广东、福建、广西、山东、安徽、河南、四川、吉林、湖南)20家8种类型用人单位20家,由省级卫生行政部门组织职业病防治机构的专业技术人员现场调查用人单位的职业卫生状况。从26项基础指标中筛选出X1-职业病防治计划和实施方案及安全率(%)、X2-职工健康监护档案建档率(%)、X3-职业病危害事故应急救援预案及安全率(%)、X4-职业病危害项目申报率(%)、X5-职业病危害劳动合同告知率(%)、X6-工作场所职业病危害因素检测率(%)、X7-上岗前职业健康体检受检率(%)、X8-在岗期间职业健康体检受检率(%)、X9-用人单位负责人职业卫生培训率(%)、X10-劳动者上岗前职业卫生培训率(%)、X11-健康监护费用在生产成本中列支率(%)、X12-疑似职业病病人及时安排诊断率(%)和X13-现有职业病人享受国家规定的职业病待遇率(%)13项指标作为评价职业卫生管理状况的指标[1],各指标的检测值见表1。数据来自文献,真实可靠[2]。

1.2统计方法

应用基于三元联系数的集对分析基本原理[3]对2003年我国10个不同经济发展水平省市职业卫生管理状况进行聚类分析。

表1 10个调查省市13项筛选评价指标值及其等级范围和标记

表2 不同省市不同等级对应的联系数及其有效值和等级判定

2 结果

2.1各评价指标等级范围的划定和标记

由于该资料所选用评价指标均为高优,且有的指标观测值不呈正态分布,因此按照统计学要求以均匀划分法在划定各指标各等级的观测值范围。该组研究对象为10各省市,以划分为三个等级为宜。计算同一指标观测最大值(Xmax)与最小值(Xmin)的差值R,则等级由低到高的区间值范围分别为[Xmin,Xmin+R/3)、[Xmin+R/ 3,Xmin+2R/3)和[Xmin+2R/3,Xmax]。如对于职业病防治计划和实施方案及安全率(X1)来说,等级Ⅲ的观测值范围为45.46~59.64,等级Ⅱ为59.64~73.82,等级Ⅰ为73.82~88.00,其余评价指标类推(见表1最后3行)对照各指标的观测值和各等级观测值的范围,观测值在相应区间范围者标记为相应等级(见表1观测值后的罗马数字)。

2.2构建三元联系数

分别计算同一调查省市各评价指标对应的等级序数与三个等级序数之差值的绝对值,数值为0、1和2者分别对应同一等级(m)三元联系数的同部A、异部B和反部C,得到同一省市不同等级对应的联系数Um=Am+ Bmi+Cmj,见表2。

2.3联系数有效值的计算和等级的判定

给予该研究者既往研究及其分析,该文选用较为稳妥的中间(平均)有效联系值来判定每个省市职业卫生管理状况的等级:即根据集对分析之理论,令i=0,j=-1计算各联系数的有效联系值;对于同一地区,以数值较大者作为该地区在既定给出判定准则下的对应等级,如地区1的Ⅰ类、Ⅱ类和Ⅲ类有效联系值分别为10、3和-10,由于Ⅰ类有效值最大,故判定该地区职业卫生管理状况为Ⅰ类,其余地区类推,见表2。

3 讨论

集对分析是赵克勤先生提出的解决确定-不确定问题的一种新的统计方法,其中介媒体为联系数,在预防医学领域的不同地区、不同时间卫生监督质量的排序、聚类分析和发展趋势分析中得到一定应用[3,5-9],以其他方法相比,结论均可接受,由于统计方法的数学原理不同,亦有不同甚或截然相反之结论出现,是值得探讨的一个问题。因此,该文选择基于联系数的集对分析对我国10个不同经济发展水平省市的职业卫生管理状况进行聚类分析。

统计学中对事物进行“分类”的方法有两种,其中判别分析是根据已知其类别的样品,总结出类别的判定法则,用以判断未知类别的新样品的归类;聚类分析是在事物分类面貌尚不清楚,甚至连总共分几类也不清楚确定的情况下,讨论事物的分类问题[10]。由该文给出的基于联系数的聚类分析基本原理和步骤可知,兼有统计学的判别分析和聚类分析的特性,但其原理又不相同。

该文研究中,根据地区数量和数值情况,将不同评价指标的观测值分为3个等级,亦可灵活分为其他数量的等级,以合理对研究对象进行分类。在确定各等级范围时,要根据各指标观测值统计分布类型的不同,选用不同的方法确定各等级的范围,一般对正态分布资料采用均数标准差法或均值离差法,偏态分布采用均匀划分法[11];但对于正态分布资料来说,三种方法划定的范围差别不大,考虑到各指标的统计分布不都为正态分布,因此,该研究者采用更为简单的均匀划分法。在确定评价地区类别时,不确定性在于有效值的计算。根据集对分析的原理,对于该文选用的三元联系数Um=Am+Bmi+ Cmj来说,异部系数j=-1是确定的,异部系数i∈[-1,1],这使类别判定出现了不确定性,会出现莫衷一是的尴尬局面。尽管该研究者的既往研究对异部系数采用中间取值法较为稳妥,如该文Ⅰ类职业卫生管理状况包括地区1、2、3、5、9和10,Ⅱ类包括地区4、6和8,地区7属于Ⅲ类;但当异部系数取其他数值时,会出现不同的结论。如对于地区5,当异部系数为7/9时,难以判定其职业卫生管理状况属于Ⅰ类还是Ⅱ类;异部系数为-1/9时,难以判定该地区属于Ⅱ类还是Ⅲ类。这既是该文所述方法的缺点,也是其优点,因为这可以动态判定不同地区职业卫生管理状况的类别,可以看出当异部系数变化时类别的动态变化,为职业卫生监督管理提供一定的参考依据,以便采取得力的措施避免各地区职业卫生管理水平恶化,并逐步提高监督管理水平,为避免职业病和职业多发病的发生,维护劳动者健康,提高生产力水平奠定坚实的基础。

还应注意的是,应用该方法进行聚类分析时,应根据比较组数和观测值特点合理确定等级数目,一般以5个等级为限;采用不同的方法划分相同数目等级的不同指标取值范围,所得三元联系数和判定的等级类别不尽相同;当为4或5个等级时,不确定度系数宜采用中间取值法计算四元或五元联系数的有效值以合理判定所属类别,出现不同类别有效值相同情况,应根据原始数据合理判定类别,也应如该文一样,合理分析当不确定度系数取不同数值时类别的变化情况。

同时,根据同类别有效值的大小,可对同类别地区职业卫生管理状况进行排序;且规定高类别在前。据此判定当不确定系数取零时10个不同省市职业卫生管理状况排序为地区1>地区3=地区5>地区9>地区2>地区10>地区8>地区4=地区6>地区7(见表2最后一列),与TOPSIS法所得结论差异较大,原因可能与该方法计算所得联系数较没有充分利用原始数据提供的信息,可见排序结论较为粗糙。如应用联系数进行排序,可应用文献[7]的原理进行分析。

该研究与TOPSIS法[1]的综合评价是不同的两个方面,TOPSIS法的着重点是排序(也可根据计算得到的C值,应用基于秩和比的可信区间法或分档法[12]进行综合评价),该文着重点在于根据既定的等级数目和等级范围来判定类别并进行粗糙排序,两者的结论可以互补。实际工作中,应根据比较目的和资料的特点,合理选择统计方法进行综合评价,以指导具体的工作实践。

综上所述,应用集对分析理论进行聚类分析的关键在于等级数目的确定和各等级定量观测值范围的合理划分以及联系数有效值的计算和不确定度分析,只有这样才能合理为各比较组划分类别,并根据不确定度系数取值的不同动态观察同一比较组的类别变化情况,合理运用基于联系数的聚类分析。

[参考文献]

[1]汤海滢,康晓平,康辉,等.职业卫生管理综合评价指标的筛选[J].中国公共卫生,2005,21(2):96-98.

[2]汤海滢,胡永华,康辉,等.加权TOPSIS方法综合评价职业卫生管理状况的探讨[J].中国工业医学杂志,2007,20(1):20-22.

[3]谷玉祥,孙齐蕊,孙爱峰.基于联系数的车站环境和站卖食品卫生情况聚类分析[J].中国卫生产业,2015,12(1):14-15.

[4]邱昭君,孙爱峰.联系数在不同地区卫生监督质量聚类分析中的应用[J].中国医药指南,2011,9(36):490-492.

[5]夏淼,孙爱峰.集对分析在职业卫生监督质量综合评价中的应用价值[J].中国卫生产业,2015,12(3):10-11.

[6]汪丽伟,孙齐蕊,孙爱峰.联系数在公共场所卫生监督质量综合评价中的应用[J].中国卫生产业,2014,11(21):62-63.

[7]吴莹,孙爱峰,孙齐蕊.集对分析在食品卫生监督工作质量分类和排序中的应用[J].中国卫生产业,2014,11(21):61,63.

[8]王丽静,孙齐蕊,孙爱峰.集对分析在不同年度环境空气质量综合评价中的应用[J].科技创新导报,2014,11(8):100.

[9]金丕焕,陈峰.医用统计方法[M].3版.上海:复旦大学出版社,2009.

[10]王文圣,李跃清,金菊良,等.水文水资源集对分析[M].北京:科学出版社,2010.

[11]孙爱峰.秩和比法在不同地区人体蛔虫感染现状调查结果综合评价中的应用[J].中国医药指南,2011,9(31):226-227.

Application on SPA for Cluster Analysis in Occupational Health Management

SUN Ai-feng1, SUN Qi-rui2
1.Baicheng City Health Emergency Center, Baicheng, Jilin Province,137000 China;2.School of Public Health, Jilin University, Changchun, Jilin Province,130021 China

[Abstract]Objective To investigate the value on set pair analysis (SPA) for Cluster Analysis in occupational health management status. Methods Application of set pair analysis theory for cluster analysis of occupational health management status of 10 survey provinces and cities in 2003. Results ClassⅠoccupational health management status, including regional 1,2,3,5,9 and 10,Ⅱclass includes areas 4, 6 and 8, the area belongs toⅢclass 7. Conclusion Application of set pair analysis theory cluster analysis has some value, the key is reasonable in a hierarchy to determine the number and range of levels of quantitative observations and contact number of valid values and uncertainty analysis, and a reasonable division observe the dynamic changes in their category.

[Key words]Correlate;Set pair analysis;Occupational health management;Cluster analysis

收稿日期:(2015-03-24)

[通讯作者]孙齐蕊(1993-),女,吉林白城人,吉林大学公共卫生学院2012级预防医学(医事法学)专业在读学生。

[作者简介]孙爱峰(1968-),男,山东招远人,本科,高级讲师,主要从事预防医学实践及其教学工作。

[基金项目]吉林省卫生厅科研课题(立项编号2012R023,吉卫指标函[2012]37号)。

[中图分类号]R132

[文献标识码]A

[文章编号]1672-5654(2015)06(c)-030-04

猜你喜欢

聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究