模式识别在医学工程领域的应用
2012-10-09冯世领
冯世领
卫生部北京医院 医学工程科, 北京100730
模式识别在医学工程领域的应用
冯世领
卫生部北京医院 医学工程科, 北京100730
本文简要介绍了模式识别的方法,包括决策理论、句法分析和人工神经网络,并指出了不同方法的特点和适用情况,进而介绍了模式识别方法在医疗器械采购风险分析、故障间期分析和损失评估等方面的应用,并提出了将模式识别技术应用于辅助排错方面的构想,阐述了应用方式、可能遇到的困难以及解决困难的思路和设想。
模式识别;贝叶斯决策理论;句法分析;医疗器械风险评估;预防性维护
0 前言
认识世界是人类的一项基本智能。模式识别(Pattern Recognition)技术则是以计算机科学为基础,对事物进行感知和区分的一种新兴的、极具活力、具有广泛应用范围和前景的人工智能技术[1-2]。在过去的几十年中,模式识别技术在医学信号分析、医学影像处理和临床辅助诊断等方面已有较为成熟的应用,是现代医学发展的重要助力。医学工程(Medical Engineering)学科是应用工程理论、技术来研究和解决与医学有关的工程问题的新兴交叉学科。这两种新兴学科的碰撞,必将迸发出绚丽的火花。
1 关于模式识别
1.1 模式识别定义和方法
1.1.1定义
模式识别或称模式分类(Pattern Classification),是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程[3]。这一过程主要包括:输入原始数据(模式的数据采集);确定并提取模式特征(基于先验的特征选择);判别模式类别(基于先验的类别选择);并根据其类别采取相应行为等(训练、评价)[4]。
1.1.2 模式识别方法
(1)决策理论方法(Decision Theoretic Approach),又称统计方法,是发展较早、比较成熟的一种方法,也是理论基础最为扎实的一种方法。它通过特征提取,使得输入模式从对象空间映射到特征空间,即通过多维特征空间中的一个点或一个特征向量表示输入模式。特征的选取依赖于具体的识别对象,要尽量使得模式在特征空间中“抱团”,即所选取的特征对于某种分类应用来说,能够真正地表现出模式的“特点”。最后,再通过引入合适的判别函数对出入模式进行合理的分类。
(2)句法方法(Syntactic Approach),又称结构方法或语言学方法。其基本思想是通过选取合适的基元(底层的最简单的子模式)和语法(转化规则),把一个模式转化为树形结构。所谓句法分析,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。
(3)人工神经网络(Artificial Neural Network Approach),是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统,是从生理的角度对人类大脑系统的一阶特性的一种描述。它通过网络权系数和激励函数对输入模式进行响应,输出分类结果;并通过训练,对权系数进行矫正,改善神经网络性能。
模式识别方法的选择取决于问题的性质。如果先验类的概率和类的条件概率密度或分布是清晰的,则最好采用决策理论方法,因为这种方法的理论基础最为扎实,能够给出最优化的结果;如果被识别的对象极为复杂,但包含丰富的结构信息,一般采用句法方法,这样可以充分利用上下文关系解决问题;如果待解决问题需要突出系统的学习能力,则人工神经网络的方法更为合适,这种方法便于通过训练(学习)来调整网络权系数,进而改善系统性能。在实际应用中,将各种方法结合起来能够更好地解决问题。
1.2 模式识别的应用范围
模式识别可用于文字、语音、遥感、工程和医学等各个领域。在医学领域中,尤其是临床医学中,模式识别在临床自动检验和分析、心电和脑电信号提取分析、医学影像处理和分析、自动治疗计划和辅助诊断等方面,已取得了成效,这些在傅京孙教授[2]的著作中已有阐述。近年来,模式识别技术在医学领域中的应用发展迅速,如石宏理、罗述谦等人[5]在磁共振图像降噪方面取得的成果。另外,模式识别在脑-机接口[6](Brain-Computer Interface, BCI)和临床专家系统(辅助诊疗)等方面的应用也发展极快。
在工程领域中,模式识别在工程可靠性分析、机械部件识别、故障检查和判断、设备风险评估等方面应用广泛。
2 模式识别在医学工程中的应用
医学工程学是医学与工程学相融合的一门交叉学科,以医学需求引导工程发展,以工程发展推动医学进步[7]。近年来,由于医学和工程学的飞速发展,以及两者愈发紧密地结合,使得医学工程学这一年轻的学科发展迅猛,其应用范围不断扩展,这就需要有更多的理论和技术支持,以满足多方面的应用需求。模式识别就是其中重要的一员。目前,模式识别在医学工程学中的应用主要体现在风险评估(Risk Estimation)与辅助决策等方面。
2.1 模式识别在风险评估方面的应用
风险评估主要是针对医疗器械而言。医疗器械直接作用于人体,它的安全性和有效性直接关系到医疗机构的社会和经济效益,其全生命周期管理包括设计、制造、市场、使用、质控、维修、处置等众多环节,每个环节都可以通过风险评估来提高效益。
2.1.1 采购环节
针对医疗器械的价值、技术、环境等风险因素随时间变化快的情况,张洪鹏等人[8]提出采用便于将定性的描述进行量化比较的模糊综合评价法来进行风险评估。该方法一般分为6步:① 收集风险因素,构建因素集;② 对因素集划分等级,建立备择集;③ 对风险因素进行独立评价,建立判断矩阵;④ 根据各风险因素的影响程度确定其权重;⑤ 利用模糊数学方法,计算综合评价结果;⑥ 根据结果给出风险评价意见。由此,可得出对简单采购方案风险的量化比较结果。
2.1.2 质控环节
对于医疗器械来讲,其主要工作内容之一就是建立并执行预防性维护计划(Preventive Maintenance, PM),即在获知设备发生故障或性能下降随时间的概率分布后,有针对性地提前对其进行维护,以降低实际的故障发生概率。周丹等人[9]对基于风险评估的设备管理进行了阐述,认为物理、临床、技术等医疗风险在医学工程中都表现为故障信息,对其进行风险评估主要包括基于报告、经验和先验知识的风险分析,基于以专家评分来确定权重的风险评估,基于技术水平和监控能力的风险控制等内容,其核心工作就是确定PM时间间隔。
在此基础上,刘延武等人[10]利用基于Weibull分布的故障间期分布函数,对医疗器械故障进行可靠性和风险率分析。他们认为,在医疗设备的质量控制中, 故障间期(Failure Interval)是医疗设备的寿命数据,其特点是:① 故障间期始终是正值,单位是时间单位;② 故障间期数据不可能精确地被观察到,因此,只知道它们之中一些高于某个定量。这一数据由以往的维修记录和先验知识而来,通过如医学工程保障信息系统等方式获取,得到各种类型医学工程质量控制所需的相应类型的故障间期。其方法简述如下:
假设医疗设备故障间期分布函数为F(t)(不可直接估算) ,则医疗设备故障间期分布密度函数f (t) = F′(t) ,以及医疗设备故障风险率函数λ( t) = f (t) / [ 1- F (t) ]。设Ti ( i = 1, 2, …, n)表示医疗设备故障间期,它们是非负独立同分布的随机变量。针对这类随机数据,得到医疗设备故障间期分布函数F(t)的经验估计。同时大量实验表明故障间期的分布遵循着韦伯(Weibull)分布,因此采用Weibull分布函数拟合医疗设备故障间期的经验分布函数,并据此计算出医疗设备故障风险率函数:
其工程意义在于可以根据故障风险高低来制定、实施不同的应对措施,有针对性地降低损失。对于这类寿命数据分析的问题,目前已有较为成熟的商业软件,如ReliaSoft的Weibull++等。
2.2 模式识别在辅助排错(Assisted Troubleshooting)方面的应用
一般的故障排错工作包括故障检出、原因分析、故障定位、性能监测等环节,最核心的工作就是通过对故障现象、使用环境等影响因素的检测和分析,判断出故障部位并做出相应的处理。为方便进行此项工作,很多设备厂家在产品设计和制造时就有所考虑,采取了很多措施,如内置错误代码或是连接外置的故障诊断程序等。但限于技术能力,以及实际工作的困难程度,这些措施的适用性小、成本高,而且只能给出一个较大的故障参考范围,准确程度也不能令人满意,对于工程师的帮助力度有限[11]。目前进行故障排错,主要还是依靠工程师的知识和经验。由于这些知识和经验是专属于个人的资源,不是标准化的数据,所以很难复制(一致性)、传输(传授他人)、存储(知识和经验的积累)和查询(参考、借用他人知识和经验);而资源的总量不大(技术好的工程师总是少数),且不易增长(教和学都不是容易的事)[12]。这些原因就成为了限制故障排错总体水平提高的瓶颈。能不能充分利用这些资源为所有的工程师提供帮助,从而突破技术瓶颈呢?辅助决策系统应该是一个行之有效的方法。
在很多领域中都运用了模式识别中的统计决策理论方法进行辅助决策,并进展迅速,如疾病辅助诊断系统等。本文所提出的辅助排错(也可称为故障判别)系统,也是这种方法在工程维修(Service)方面的一种运用,即在已知故障模式类的概率和类的故障现象条件概率密度或分布的基础上,将故障现象等影响因素作为故障模式的输入向量,通过决策理论方法对故障模式进行分类。由于故障现象、操作方式、使用环境等影响因素相对稳定,所以很适于用经典的决策理论(Bayes决策理论)的方法来处理。故障模式分类应是已知的,该故障模式的各种信息也是已知的,这样就可以为维修工程师排除故障提供极大的帮助。
建立并完善辅助排错系统,包括以下一些工作:
(1)术语。建立术语表,并进行编码,以便于计算机自动进行统计分析;同时,通过术语编码来进行标准化的定义和描述,可以极大地减少故障模式和分类数量,使得应用模式识别方法进行辅助排错具有可行性。
(2)分类。根据故障(或性能下降)的影响因素,确定故障模式,并以多维向量(E0~Ek)的方式表示。k(0,1,…k)为故障模式数量,E0表示正常模式。故障模式可以修改和扩展。
(3)先验概率。应用Bayes决策理论的前提,是故障模式类的概率和类的条件概率已知,即得出它们的概率密度或分布函数。
(4)权重系数。考虑系统的“学习”能力,包括故障处理对排错的反馈,需要确定并不断修正相应的权重系数。
(5)系统性能评价。通常以正确率、误判率(第一类错误)、漏判率(第二类错误)、拒判率来评价系统性能。由于故障是已发生的,所以没有漏判,只用其他3个指标进行评价。
辅助排错系统,可以充分利用先验知识和经验,降低工作复杂度,极大地提高维修的整体技术水平(因为任何人都可能借助该系统而成为高水平的工程师)。这将为建立并实施预防性维护计划,确保医疗器械处于完好、待用状态,保证其安全性和有效性提供极大的助力;同时,通过反馈,对设备生产厂家改进设计,提高生产工艺水平也具有极大的促进作用。
3 有关辅助排错系统的一些问题
3.1 关于参数的选择、确定和调整
(1)模式识别方法包括对输入模式的处理(特征提取)和决策(分类)。对于故障模式输入向量来说,包括了在定量/可测量的、定性(二值)的、可视化的或文字的描述等多种测量值并存的情况下,如何进行多元统计分析?可将该问题最大程度地化简,如都先简单地转成“二值”量,以减少系统的复杂程度。
(2)关于权重系数的确定、调整以及激励函数的作用和选取。可用带反馈的人工神经网络来调整权系数,但要注意隐含节点不可太多,否则可能造成对训练样本的“过拟合”。选择合适的激励函数和算法,以便加快神经网络学习的收敛速度[13]。如能在此基础上将激励函数与工程实际相结合,并给出其工程定义,则更有利于故障分析和对系统性能进行评测。
3.2 关于系统的学习和完善
(1)系统的“学习”即是系统随着经验的积累自动提高性能,实现自我改进的过程,但对于故障模式而言存在一些困难:训练(故障)数据集只能来自设备自身或同类设备以往的故障模式,与正常模式相比,应该属于小样本(即便故障模式种类k(j=0,1,…j…k)很小,也有Nj< (2)很难确保故障模式向量观察是完善的,原因有诸多故障现象或变化或条件的不可观测性,物理退化机制的变异性,传感器的不准确等。同时,还有故障多为非正态分布,设备磨损稳定期等因素,在应用时需加注意。 3.3 先验类概率和先验类的条件概率如何建立并完善 实现辅助排错的前提,就是故障模式类的概率和类的条件概率已知,但目前尚未有可靠的数据支持。因此,要建立计算机辅助排错系统,需要做的一项重要工作就是获取可靠的统计数据。其获取途径主要包括: (1)厂家维修手册(已经对故障类进行了编码,但只限于个别设备或厂家)。 (2)个人维修经验(人工故障排错过程是模式分类的现实基础;但个人的知识和经验难以复制、传输、存储和查询)。 (3) 维修记录(设备档案)和技术论坛网站。虽然数量大、范围广、技术高深,但都是非标准化的数据,需要对其进行数据挖掘,以提取有用信息。这可以说是当前获取先验概率的主要手段。 (4)利用维修管理软件(电子化、标准化(小范围)的维修记录)。建立关于设备故障的术语字典,包括:设备及各部件定义、使用环境和方式、故障现象描述、原因分析、故障定位、故障处理、故障模式分类等。尽可能地将以上内容标准化(至少就本系统而言),以减少数据量(减少了故障模式输入向量),降低复杂度。 (5)期望在政府部门和学会的带领和支持下,仿照如国际代码标识符 (International Code of Diseases,ICD) 等系统,建立故障模式分类编码系统,形成统一标准,规范工作流程。例如以故障现象为轴,对动力源(电能、气体动力等,包括辅助动力源(如UPS)等);保护系统(熔断保险、限位开关等);人-机接口(包括控制台、图形显示等I/O模块);能量通路(X线管球、超声探头等能量发射模块和X线探测器、超声探头等能量接收模块);数据通道(医学信息采集、转换、传输和存储等模块);计算单元(嵌入式系统或后处理工作站等数据处理、计算、分析模块)等不同故障现象部位进行分级编码。以此类推,分别以使用环境、故障判别、故障处理等为轴建立分级编码,并将各类编码汇总,最终形成故障模式分类的多轴分级编码,并不断对其进行动态维护。这是一个庞大而复杂的任务,如能完成,则是为医疗设备维修的自动化、智能化打下了坚实的基础。我们可以依托于标准编码,记录维修档案,统计先验概率,发展专家系统,这就相当于用一个广泛的数据库来补充工程师个人的维修经验,协助、指导其工作,并能方便地估算出维修成本和给出处置建议,从而节省出大量的时间和人力资源,提高故障排错准确率,使得医学工程的整体工作水平实现一个质的飞跃。 [1] Richard O.Duda(美).模式分类[M].2版.北京:机械工业出版社,2004. [2] 傅京孙.模式识别应用[M].北京:北京大学出版社,1990. [3] Sergios Theodoridis(希腊).模式识别[M].4版,北京:电子工业出版社,2010. [4] Tom M.Mitchell(美).机器学习[M].北京:机械工业出版社,2008. [5] 石宏理,罗述谦.基于非冗余平移不变小波变换的磁共振图像降噪[J].中国组织工程研究与临床康复,2010,14(52):9739-9743. [6] 任亚莉.基于脑电的脑-机接口系统[J].中国组织工程研究与临床康复,2011,15(4):749-752. [7] 姜远海,彭明辰.临床医学工程技术[M].2版.北京:科学出版社,2009. [8] 张洪鹏,周丹,贺密会.卫生装备采购风险的评估[J].医疗设备信息,2007,22(5):58-62. [9] 周丹,David,Yadin,等.基于风险评估的设备管理[J].中国医院管理,2000,20(9):42-43. [10] 刘延武,吕鹏,王卫东,等.医学工程质量控制风险评估方法[J].北京生物医学工程,2008,20(2):169-172. [11] 程江波,等.数字化医学工程保障体系及其信息系统设计[J].医疗卫生装备,2007,(6):33-34,43. [12] 王卫东,曹德森,吴昊,等.医学工程保障中的质量控制的研究[J].医疗设备信息,2007,22(3):5-8. [13] 肖俊芳,王耀青.一种激励函数可调的快速BP算法[J].自动化技术与应用,2002,21(6):26-29. Pattern Recognition in Medical Engineering FENG Shi-ling R197.39;TP18 B 10.3969/j.issn.1674-1633.2012.06.029 1674-1633(2012)06-0080-04 2011-12-27 2012-05-07 作者邮箱:wymuforever@yahoo.com.cn Abstract:This paper gives a concise introduction of pattern recognition, including decision theory, syntactic analysis and artificial neural networks, and briefly discusses the characteristics and applicabilities of different approaches. The applications of pattern recognition in medicine, especially in the f eld of medical engineering are described. It is currently mainly used in risk estimation of medical devices, which involves the purchase risk analysis, failure interval analysis, loss estimation and so on. An idea is proposed that it can assist engineers in troubleshooting by pattern recognition. The methods, potential diff culties and solutions are also described. Key words:pattern recognition; Bayes’decision theory; syntactic analysis; medical devices risk estimation; preventive maintenance
Department of Medical Engineering, Beijing Hospital of Ministry of Health, Beijing 100730, China