数据挖掘技术在检验标本质量监控中的应用
2021-01-07魏学敏康小强孟皓宇胡坤融
魏学敏,黄 洁,康小强,孟皓宇,胡坤融
(1.景洪市第一人民医院,云南 景洪 666100;2.云南盛时迪安生物科技有限公司,云南 昆明 650000;3.西南林业大学大数据与智能工程学院,云南 昆明 650000)
0 引言
在检验标本的采集、传输、检验的过程中,标本质量控制是一个要重点关注的问题。本文主要讨论通过对检验标本采集、检验标本传输、检验质量控制过程的中形成的数据,应用数据挖掘的分析方法,对检验标本质量进行管理。
1 检验标本数据的获取
1.1 检验标本采集过程的数据获取
检验标本采集前,病人的饮食情况、运动及情绪、体位、服药情况等各方面都可能影响检测结果的准确性;护士岗前技术培训不到位、无采集规范标准、护士责任心缺乏等原因也会对导致检验标本质量不合格。
如图1所示,在基于互联网的云检验系统中,检验标本采集过程需要的数据可以及时录入系统。在这些录入系统的数据中,提取一些影响检验标本质量的关键数据项参与研究。
图1 云检验系统中的检验标本采集
1.2 检验标本传输过程的数据获取
基层医疗机构采集标本后装入智能标本箱,交由专业冷链物流运输。智能标本箱密封性、防震性能好,且能依据检验标本目的和保存温度不同进行设置,能较好地提高标本质量。智能标本箱在血液、疫苗、DNA等生物标本的小批量运送场景下,通过内置传感器实时采集标本箱内生物标本的温湿度、密封性、位置等数据,并实时上传至云平台。
如图2所示,在基于互联网的云检验系统中,能实时获取到检验标本传输过程的数据,本研究提取在标本传输过程中影响检验标本质量的关键数据项参与研究,主要是标本传递时间和温度。
图2 云检验系统中检验标本运输过程数据监控
1.3 检验标本检验分析过程的数据获取
在检验分析过程中,检验机构建立了室内质量控制(IQC)体系,检验人员按照一定的频度连续测定稳定样品中的特定组分,并采用一系列方法进行分析,按照统计学规律推断和评价本批次测量结果的可靠程度,以此判断检验报告是否可发出,及时发现并排除质量环节中的不满意因素。
如图3所示,在基于互联网的云检验系统中,把检验机构的临床实验室质量体系运行监控与管理平台也整合到系统中,本研究提取在检验分析中影响检验标本质量的关键数据项参与研究。
图3 检验分析
作为一种利用患者标本检测结果进行IQC的方法,其更加符合真实的实验室情况,因此无基质效应、无互换性等问题;患者标本在不断地被检测,因此质控也可以持续地进行下去,甚至可以与患者的临床状态直接相关。精心设计的患者数据质控方法可以帮助临床实验室了解自己实验室特定检测项目的生物学和分析特性以及患者人群情况。
2 检验标本数据的质量控制数据挖掘方法设计
检验标本数据的质量控制数据挖掘方法设计的基本思路:通过已有的数据形成数据集,数据集包括两部分内容,一部分是描述属性,一个是分类属性。分类属性把检验数据分成两类,达标的和不达标的。本研究通过建立朴素贝叶斯分类挖掘模型,然后对新产生的检验数据进行分类预测,如果模型分类预测结果为不达标,则对该标本的检验过程进行回溯,以达到质量控制的目的。
2.1 检验标本数据组织
在检验标本采集阶段,重点提取检验项目名称、样本类型、标本存放时间等作为描述属性。数据项的采集不涉及病人的具体信息,达到了脱敏处理的效果,为了表示每一个检验项目,进行检验质量追踪,记录了检验条码号。
在检验标本传输阶段,重点通过提取标本传输时间、标本温度这两个数据项作为描述属性。标本温度在没有异常值的情况下,选取传输时间段的平均温度。
在标本检验阶段,提取检验结果、检验参考值、异常提示三个数据项作为描述属性。
通过前期的工作积累,把所有标本的检验数据按照上述提取的描述属性构造一个数据集,同时纳入检验质量符合要求的数据以及检验质量不符合要求的数据,并把数据分为检验质量达标和检验质量不达标两类。构成数据集的基本形式如表1所示。
表1 检验质量数据集的数据构成
2.2 检验标本数据的质量控制的朴素贝叶斯模型建立
Microsoft Naive Bayes 算法是由 Microsoft SQL Serv er Analysis Services 提供的一种基于贝叶斯定理的分类算法,通过发现输入列与可预测列之间的关系来进行预测性建模。对于可预测性变量的每个状态,朴素贝叶斯算法会计算出输入的每一个可能状态的概率。然后可以利用这些概率对新的目标进行预测。由于该算法相当简单,所以它构建模型非常快。
在本项目的研究中,提取的数据保存在SQLServer中,通过SQLServer的分析服务来构建朴素贝叶斯分类模型。操作步骤较多,仅描述主要的步骤如下。
(1)安装配置好SQLServer的分析服务。
(2)按照3.1节设计的方法准备好的数据集。
(3)在SQL Server Data Tools中建立Microsoft Naiv e Bayes数据挖掘模型。
(4)通过建立的挖掘模型对新产生的检验数据进行分类预测。
(5)对分类预测结果为质量不达标的检验标本进行回溯处理,以提高检验质量。
3 结束语
在分级诊疗体系中,开展标本云检验可以使得农村和社区医院分享到更先进的检验设备,患者也减少了路途的时间和经费开销。但是检验标本需要采样后保存一段时间,并经过冷链长距离运输,可能会对检验质量产生影响,本文提出的基于朴素贝叶斯的检验样本质量分类办法可以帮助找出那些质量异常的检验样本,可以达到保护患者权益、提高检验水平等效果,是一种值得推广的方法。