基于人工神经网络的二次脑损伤预后评估
2011-07-28罗二平
荆 斌 张 鹏 李 巍 罗二平
1 引言
受伤部位与伤死关系极为密切,据统计,引起伤亡通常以颅脑伤所占的比重最大[1]。颅脑损伤常常伴有二次脑损伤(second brain injury,SBI)即在原发脑损伤后,某些因素如血压、体温等的异常改变,会加重原发脑损伤,使伤员在短期内死亡或失去进一步救治的机会。
二次脑损伤致病因素很多,通过前期研究发现二次脑损伤可以主要通过动脉血压、颅内压、脑室温度、动脉氧饱和度、呼吸功能、颈静脉氧饱和度等因素的变化来大致衡量。通过建立二次脑损伤伤情数据库,快速收集和管理二次脑损伤敏感数据,通过数据挖掘工具进行分析,可以发现重要的数据模式,对决策者以及知识库构建将起到巨大作用[1-4]。
2 实验设计
在二次脑损伤伤情信息系统中,分别采用决策树、回归分析、ANN以及PCA结合以上3种方法尝试构建早期脑伤多因素死亡预测模型。按照模型预测结合继发性脑损害评分(secondary brain damage scores,SBDS)对患者伤情进行评估,辅助决策者采取合理的治疗措施[1]。
在实验过程中,分别采用常规决策树及人工神经网络模型来建立患者二次脑损伤相关致伤因素与患者致伤后一周内状态的对应模型,根据训练的模型评估患者伤情状态并辅助预测伤情变化。
实验数据:以下实验均采用西京医院神经外科137例患者电子病例为总体样本,其中男性为82例,女性为55例;住院时间1月以内患者16例(预后良好12例,伤残3例,死亡1例)、2~3月患者66例(预后良好53例,伤残12例,重度昏迷1例)、3月以上患者55例(预后良好41例,伤残10例,昏迷3例,死亡1例)。
2.1 通过决策树及继发性脑损害评分建立死亡预测模型
依据费氏标准对患者入院后持续观察1 h、6 h、12 h、24 h、36 h、72 h、168 h患者18项参数,建立决策树报告:
SBDS=静态指标评分+动态指标评分
若SBDS≤48, 患者预后良好:数据满足条件103例(结果伤残12例),预测准确度88.35%;
若SBDS>48, 患者预后非良好:满足数据条件34例(结果伤残13例,死亡及重伤8例,预后良好13例),预测准确度61.76%;
若SBDS>48且存在5项以上单项5分患者预后较差:满足数据条件2例(结果1例死亡,1例重伤),预测准确度100.00%;
若SBDS>48且存在4项单项5分患者预后较差:满足数据条件21例(结果3例死亡,3例重伤, 7例伤残,8例预后良好),预测准确度61.90%;
根据决策树判断患者病死率的平均准确率为:79.38%
本门课程采用项目化教学方法,以完成既定宴会设计项目作为学生完成学习任务的象征(见表1)。课程所需掌握的理论知识,一部分由教师讲授,更多的是学习小组在完成项目的过程中,通过自主学习、搜集资料、教师指导、小组讨论、观摩借鉴等方式获得。
决策树较为适合进行SBDS较高患者的预后判断,能够及时分辨出重度伤情患者;但对于SBDS较低的轻、中度患者判断准确率较低。
2.2 通过ANN建立死亡预测模型
由于颅脑伤情预测具有“黑箱”以及非线型的特点,为了提高预测准确率,利用BP人工神经网络技术进行伤情归纳。输入数据通过前向网络产生输出数据;预期输出与实际输出间误差通过反向网络,回馈并校正元权重和偏差[7]。
2.2.1 网络设置
BP神经网络传导过程可分为:正向传导过程以及反馈回网络,由输入层、隐蔽层及输出层组成。设置患者18项评估指标为输入变量(见表1),设置动态评估指标患者病死率Y为输出变量。利用前向BP神经网络进行病程监测参数预测输入神经元代表了网络中的输入。模拟网络的输入过程,为了凸显出数据的规律,在此对数据进行预处理,通过费氏五级标准,结合OLAP将样本“归一化”(见表2),对输入层参数进行初始化。
表1 输入层设置
表2 人工神经网络参数初始化
由于输入层变量较为复杂,采样频率较多,针对数据进行初始化设计:
按照费氏五级分级标准,将输入层数据分为:I、II、III、IV、V、VI,数据采样频率统一为变量中最低采样频率:1 min-1,空域位置补充为患者该项均值。
正向传导结束后网络产生输出信号。经过“训练”网络将选定的样本输入信号与特定的模型相联系;一个激励函数作用于网络输入产生非线性阈值输出。在此选择Sigmoid Logistic作为激励函数:
期望输出与实际输出之差体现了网络的误差。常用Mean Square Error法来评估误差大小。隐蔽层元数量的原则取决于网络本身类型以及问题类型。
初始化选择输入元数量的30%~40%,当网络不能收敛时考虑在此基础上增加。在初始状态下,由于输入元数量为训练过程设置训练次数不能过低,否则网络会出现“记忆”现象,根据公式2设置训练次数。
通过“训练”将误差反馈回网络改变元偏差和权重,达到减小误差的目的。通过大量样本数据的“训练”,直到网络中误差被限定在允许范围内,此时,网络也具有收敛性。
2.2.2 实验设计
将样本数据分为A、B、C、D、E、F组,将每组均分为23人,按照如下流程进行实验(见表3)。
表3 实验设计
实验结果的网络交叉准确率为90.13%。
3 讨论
在网络训练过程中,学习率过大会导致波动过大,影响精度;学习率过小,收敛过程缓慢,影响程序效率,采用反馈误差率函数 以及调节隐蔽层数调节函数的收敛速度,初始化设置参数。采用反馈误差率函数调节函数的收敛速度,初始化设置参数。
据文献显示,ANN目前已被应用于乳腺癌[5]、肺癌[6]、皮肤损伤疾病[7]等多种疾病的鉴别诊断中。在文献应用过程中,ANN精度在90%~96%之间。在此实验中,由于实验样本容量有限导致网络训练次数较少,网络尚未训练稳定,输出波动较大,直接影响到预测结果,在进一步实验中扩大样本积累,提高网络精确度。
较之决策树挖掘方式相比,ANN显示出较大优势,与伤员人群特点无明显相关,决策稳定性较高;同时,在现代医学临床过程中,由于伤情进展过程受到临床干预较多,ANN可以及时通过输入及其回馈针对变化及时调整,在数据挖掘过程中具有极大优势。
在采用费氏评测体系全部参数时,决策树准确度较低、ANN准确度最高;采用了PCA针对数据项进行前期预处理,采用简化后主成分参数作为输入参量后,回归分析和ANN方法均有所降低,而决策树方法有明显提高,可能与静态参数中非SBI特异性参数有关,不利于决策树对于SBI疾病病程的特异性预测。通过PCA处理,提高了决策树预测精度。但由于输入参量数量降低,收敛速度降低,使得ANN网络稳定性降低。
在后续救治过程中,可根据实际救治条件,选择PCA+ANN方法进行伤员预后评估,进行医疗资源的统筹分配。
4 小结
借助于数据库网络技术,建立以局域网络为基础的二次脑损伤伤情信息系统,形成二次脑损伤伤情信息网络,可以将大量伤情集中存储管理,提高了信息的透明度和全面性;运用数据挖掘技术,建立二次脑损伤知识库,针对不同环境,选择性进行伤情评估,实施辅助决策过程;结合知识库和网络专家系统,给予各级二次脑损伤专家治疗系统技术支持。
[1]费舟,章翔.大鼠二次脑损伤模型的建立[J].中华创伤杂志,2002,18(4):214-217.
[2]Fitzgerald M, Bartlett CA, Evill L,et al.Secondary degeneration of the optic nerve following partial transaction:the benefits of lomerizine[J].Exp Neurol,2009,216(1):219-230.
[3]Coslett HB, Shenton J, Dyer T, et al.Cognitive timing: neuropsychology and anatomic basis[J].Brain Res,2009,1254:38-48.
[4]Karabatak M, Ince MC. An expert system for detection of breast cancer based on association rules and neural network[J].Expert Systems with Applications,2009,36(2):3465-3469.
[5]Davis DP. Early ventilation in traumatic brain injury[J].Resuscitation,2008,76(3):333-340.
[6]张杰,周元明.二次脑创伤对颅脑伤预后的影响[J].医用文选,2005,24(5):10-13.
[7]左治强,俞燕生.二次致伤因素对颅脑损伤患者预后的影响[J].实用临床医学,2006,7(4):67-69.