基于AI技术的医院智能审核平台的构建
2020-11-20孙浩
孙浩
AI技术即人工智能,近几年在各个行业得到了广泛的应用,如自动应答系统,图文识别系统等。它通常有两种实现方法:一种是工程学方法,采用传统的编程技术,使系统呈现智能效果;另一种是模拟方法,应用到遗传算法或人工神经网络。医院智能审核平台使用第一种的工程学方法,通过编程技术实现医院的消息异步处理、大数据训练模型、医生标注三部分功能。该系统通过读取医院各个检测设备的数据,实现模拟医生给出病人最终的健康情况诊断。医生诊断是人为因素很大的行业,不同的知识储备和行业经验会得到不同的诊断结果,AI技术通过大数据分析实现了专家级的诊断结果,成为行业的指导规范,为医生诊断提供很大的帮助作用。
一、 消息异步处理
消息异步处理的逻辑架构包括读取仪器设备信息并推送到消息队列的程序、监控消息队列并处理收到的消息的程序、提供给医生操作的智能审核平台程序。传输数据采用Json格式,图片采用二进制流传输,审核平台采用微服务架构,为了保障每个API提供的服务能够最大化的得到各个科室的共享,我们尽可能的做业务层的拆分,从自动化测试到自动化部署,为平台的敏捷化管理提供了保障。
医院就诊病人的信息来源有两大类设备,一种是病人挂号时的登记信息,被称为Lis下单设备,包括病人ID、年龄、性别、需要做的检查项目等信息;另一种是医院各个检测仪器返回的信息,被称为中间件信息,包括血清检测、尿液检测等信息。系统首先通过监测程序实时监测Lis下单信息,将病人基本信息及所做检测项读取到消息队列中。再通过监测中间件的程序,实时的将各个检测项值读取到消息队列,当监测到某一病人的所有检测项都有返回结果值了,系统就将这个病人数据传入事先训练好的AI模型中,模型根据病人的年龄、性别、检测项值给出一个最终诊断结果,系统将这个结果通过消息队列传输给Lis中。医生在自己的系统操作页面可以查看到病人的整个检测情况和系统给出的诊断结果,参照该结果医生给出病人的诊断结论。
Lis下单的消息处理,分为新增检测项、取消检测项、重做检测项和重做检验单的不同处理流程,病人的每次检测的检测项值都会通过历史值查看中找到,保证每个就诊病人都在大数据库中科查询,可追踪。配置检测项的范围值,显示顺序,显示名称,在医生的操作页面就可以按配置显示检测项信息,低于范围值的检测项会有向下的箭头标识,超过范围值的检测项会有向上的箭头标识。
中间件的消息处理,各个设备的检测项结果值传输到消息队列中,监测程序将结果值更新到Lis中,同时要检测这些检测项是否有满足的计算项,当计算项中包含的所有检测项都在同一个检验单中,则将该计算项添加到检验单中,并调用公式引擎得到计算项的结果值。所有检测项和计算项的结果值传入规则引擎,将不通过的规则一一列出,医生可以查看到该检验单的所有规则描述,同时系统会对不通过的检验单给出诊断结果,不再调用AI模型。当所有规则都通过的检验单,才调用AI模型,由AI模型返回診断结果,系统维护诊断值范围,超过范围值会以红色标记高风险字样。图片采用二进制流传输,接收程序将图片存储到服务器磁盘,并调用图片识别API,自动识别图片中的信息保存到数据库中,医生在系统操作页面即可预览图片,也可图文信息做汇总统计分析。
二、大数据训练AI模型
AI模型的核心时算法,训练模型是为了达到高识别率的目标,通过大数据不断的迭代测试,直到找到最优配置。AI模型的逻辑架构包括模型训练和验证、模型管理、模型部署。其中涉及能力有模型训练、参数配置、训练任务管理、训练状态可视化及管理、模型版本管理、模型文件管理、模型操作和处理、模型策略管理、模型部署及业务管理等。
通过采集仪器设备信息,医生对采集数据做完标注处理后,数据已经都存储到了AI模型库,之后即可调用AI算法开始增量或全量的模型训练。在训练过程中训练状态是可视化的,帮助业务人员对当前训练任务的进度有所了解,可以对任务进行暂停、取消等操作。依据大数据可以对不同数据集同时进行多个模型训练,最后汇总模型准确率来对模型的质量进行验证。
模型管理主要进行模型版本控制,是对模型有优化更新、替代、异常等情况的管理。做到完善的日志记录,可查询及追溯。算法工程师会不断的有算法更新,大数据量处理也需要有不断优化过程,这样会导致模型有不同版本的升级,要求要有严格的部署流程。
模型部署主要会出现部署环境问题,容器化应用程序是近年来应用最多的技术,采用Docker容器化部署,通过生成镜像文件,只要几行脚本命令就可以使部署文件能在不同操作系统下正常运行。
三、 医生标注
医生标注是该平台的核心功能模块,整体架构包括前端采用Vue框架,后端调用API的微服务架构,服务之间通过轻量的通讯机制进行交互,系统在服务解耦方面上花了更多的时间,使得每个服务更专注于自己的业务,满足高内聚低耦合的设计原则。由于一个科室平均每天会接待3000名病人,每个病人的检测项目平均在50项左右,这样一年的检测项数据就会达到千万级数据量,为了解决海量数据的快速存储和读取问题,平台采用分布式负载均衡,数据库采用主从读写分离设计,并充分利用缓存技术减少传输数据量。
系统角色分成平台管理员、医院管理员、医生三类。系统功能权限分为系统配置、数据标注、报表制作及查看,功能级、按钮级和数据级权限由平台管理员进行配置。医生操作的数据有两部分组成,一部分是为训练AI模型的数据,可以用于培训医生的业务操作能力,医院管理员选定一批数据,以CSV格式导入数据库,并将这些数据分派给医生,医生登录自己的账号对这些数据进行标注。系统进行自动过滤,所有医生都一致认为是通过的数据直接传给AI模型库,只要有一个不同意见,则由专家在进行一次批注,直到所有数据都达成一致意见,再将这些数据也传给AI模型库。通过以上反复操作,既提高了医生的业务操作能力,也增加了AI模型库的知识储备。医生操作的另外一部分数据是病人的实际诊断数据,病人的检测数据经过系统各级处理,并由AI模型给出了参考诊断结果,医生参考这些数据,再根据自己的经验能力做出最后的诊断结果,其诊断结果同时传入AI模型库。
系统的报表采用BI工具做到了自定义方式,用户通过鼠标简单地拖拽想要的字段就可以得到想要的报表,还可以将生成的图表预制发送到指定的邮箱。常规编程方式实现的报表开发周期长成本高,而采用BI工具后,不懂技术的业务人员也可以通过菜单页面实现构建报表,避免以后的业务变更时新报表的二次开发。
总之,通过AI技术实现了现有病例的医生模拟诊断,在一定程度上消除了医生的误诊,提高了医院的诊断效率,未来该系统会向新型的病例诊断做进一步的探索研究。
作者单位:中国电子-文思海辉智科科技有限公司大连分公司