基于多维评价模型的国产迈瑞呼吸机可用性评价研究
2023-09-19严毅陆文健任广彬黄海燕赵征华刘胜林王国宏
严毅,陆文健,任广彬,黄海燕,赵征华,刘胜林,王国宏
华中科技大学同济医学院附属协和医院 a.生物医学工程研究所;b.重症医学科;c.麻醉科,湖北 武汉 430000
引言
呼吸机作为一项能人工替代自主通气功能的有效手段,已普遍用于各种原因所致的呼吸衰竭、大手术期间的麻醉呼吸管理、呼吸支持治疗和急救复苏中,是一类非常重要的急救生命支持医疗设备,在现代医学领域占有十分重要的位置。研究发现,呼吸机面临着各类严峻的可用性问题[1-5],如不良的用户界面、交互模式、硬件设计等,这些因素会导致人为使用错误和不良事件的发生[6-9],增加临床应用安全风险[10-12],为患者带来各类潜在伤害[13]。
可用性评价能够有效地发现医疗器械可用性问题,提高产品设计及质量,降低医疗器械使用风险,提升医疗安全[14-18]。目前国内鲜有关于国产主流品牌呼吸机的临床应用可用性评价的研究,而国外针对的是国外人群特征和外资品牌呼吸机,研究结果对国内临床应用和产品研发的指导性作用有限[1-4]。有研究分别从临床医护人员和呼吸治疗师角度开展了临床可用性测试,探讨了呼吸机系统的用户使用界面和维护保养方面的可用性[5,12]。但呼吸机的可用性不能仅从单一用户类型进行评估,应根据多用户群体从多个角度综合评估。基于此,本研究旨在针对临床医务人员和临床医学工程师两类人群,根据主观和客观评价指标对3 个不同型号国产迈瑞呼吸机开展临床可用性评价研究。
1 测试方法
1.1 测试呼吸机
调查发现,2020 年10 月至2021 年9 月国内2321 家医院采购了12484 台呼吸机,其中迈瑞呼吸机占全国医院端呼吸机中标品牌市场占有率(根据销售额)的31.3%,约占全部国产呼吸机品牌的80%[19];同时考虑到迈瑞呼吸机在我院使用较广,因此选取迈瑞比较有代表性的3 个型号[SynoVent E5(E5)、SV300 和SV800]进行测评(每个型号选择1 台呼吸机)。3 款呼吸机均为有创呼吸机,均可用于对成人、小儿和婴幼儿患者进行通气辅助及呼吸支持。其中SV300 和SV800 是同一个系列不同型号,E5 是早期研发的另一个系列,这3 款呼吸机能较好地展现国有品牌的迭代发展。其中,SV800包含CO2模块、呼吸力学模块、血氧模块、气囊管理模块、涡轮模块;SV300 包含CO2模块和涡轮模块;E5包含CO2模块,需要外接空气压缩机。实验中,受限于环境和条件,每个型号呼吸机选择1 台作为测试机。
1.2 测试人员
本研究招募了我院28 名临床医务人员和14 名临床医学工程师参与测试。测试前,所有人员均已被告知测试目的及注意事项。测试人员在实验前,经过实验人员的操作培训和指导,了解各型号呼吸机基本原理和操作方法。实验过程中,测试人员按随机顺序在3 台呼吸机上分别完成测试任务,避免使用经验学习等因素的影响。
1.3 测试地点
选择医院ICU 办公室搭建实验呼吸机测试环境,模拟常见的临床使用、维护保养和质控场景。
1.4 多维度可用性评价模型
本研究建立的多维度可用性评价模型如图1 所示,选择临床医务人员和临床医学工程师两类人群作为评估对象,以评估对象常用操作的临床任务和维护任务作为测试任务,对测试任务的绩效进行主观和客观评价。
图1 多维度可用性评价模型
临床医务人员的测试任务包括:① 系统自检;② 通气模式和参数设置;③ 泄漏警报测试;④ 分钟通气量警报测试;⑤ 清洁消毒。
临床工程师的测试任务包括:① 更换氧电池和蓄电池;② 清洁更换防尘网;③ 检查并清洁呼气阀;④ 流量传感器校准;⑤ 查看机器高级报警信息。
客观评价:记录实验人员完成任务所用时间和操作步数。
主观评价:评价工具采用难易程度评估量表(Likert scale) 和精神负荷量表(NASA Task Load Index,NASA-TLX)[20]。任务难易程度评估采用7 分制的Likert scale 评估量表(1 分:非常困难;3 分:中立;7 分:非常容易),分数越高表示任务完成难度越低。NASATLX 精神负荷量表包括6 个测量维度:脑力需求、体力需求、时间需求、业绩水平、受挫程度以及努力程度,对测试人员的工作负荷进行综合评判,每个维度采用10 分制,分数越高表示完成任务的精神负荷越大。
1.5 统计学分析
采用SPSS 20.0 软件进行数据分析,评价指标的统计结果采用±s表示,采用方差分析,以P<0.05 为差异有统计学意义。
2 测试结果
2.1 临床医务人员实验结果
如表1 所示,3 种型号呼吸机开机自检、通气模式和参数设置、泄漏警报响应比较差异有统计学意义(P<0.05),其中SV300 系统开机自检需要的时间明显长于SV800、E5,E5 通气模式和参数设置耗时明显短于SV300、SV800,SV800 泄漏警报响应明显长于SV300、E5,人为设置呼吸回路发生泄漏,呼吸机发出警报,测试人员检查报警原因并且消除该警报。在这个过程中,3 种型号呼吸机通气模式和参数设置、泄漏警报响应、分钟通气量警报响应、清洁消毒任务完成步数比较差异有统计学意义(P<0.05),其中SV800 需要更多操作步数,SV300 和E5 对泄漏警报测试表现更灵敏,当分钟通气量超出或低于限值时,测试人员检查报警原因并消除警报,E5 需要的时间最短。如图2 所示,测试者在操作E5 时的工作负荷最大。
表1 临床医务人员平均任务完成时间和操作步数(±s)
表1 临床医务人员平均任务完成时间和操作步数(±s)
序号任务任务完成时间/s任务完成步数/步SV300SV800E5F值P值SV300SV800E5F值P值任务任务1 开机自检 203.64±10.99 174.21±10.37 177.10±9.56 66.720 <0.001 2.64±0.91 3.04±1.45 2.43±0.90 2.512 0.087任务2通气模式和参数设置50.82±16.26 54.00±17.75 37.00±18.34 7.224 0.001 8.64±3.91 13.25±2.23 5.57±4.90 29.120 <0.001任务3 泄漏警报响应22.32 ±11.31 35.25±17.20 25.79±10.49 6.793 0.002 2.79±1.05 3.50±1.48 2.27±0.70 8.012 <0.001任务4分钟通气量警报响应47.46±19.07 42.32±21.99 34.46±19.54 2.825 0.065 4.61±1.35 4.25±1.35 2.68±0.85 19.560 <0.001任务5 清洁消毒 29.96±9.15 35.75±18.56 34.96±9.77 1.524 0.224 5.00±1.60 5.68±1.56 3.00±1.17 24.690 <0.001
图2 临床医务人员3个型号呼吸机任务难易程度评分(a)和NASA-TLX精神负荷评分(b)
2.2 临床医学工程师实验结果
由表2 可知,3 种型号呼吸机清洁更换防尘网、流量传感器校准、查看高级报警信息3 个任务完成时间和完成步数比较差异均有统计学意义(P<0.05),此外,更换氧电池和蓄电池任务,E5 所需时间最长。SV300清洁更换防尘网所需时间更长,步骤更多。吸气和呼气阀的拆卸清洁任务测试,SV800 所需时间最长,说明SV800 的吸气和呼气阀拆卸较麻烦。流量传感器校准时间,E5 所需时间最长,而SV800 任务完成时间最短。查看E5 呼吸机的高级报警信息需要最多步数,耗时也最长。如图3 所示,针对氧电池和蓄电池更换、清洁更换防尘网与清洁吸气和呼气阀3 个测试任务,SV800 比SV300 和E5 易于操作。测试者在操作E5 时的工作负荷最大,与临床医务人员实验结果基本一致。
表2 临床工程师平均任务完成时间和操作步数(±s)
表2 临床工程师平均任务完成时间和操作步数(±s)
序号 任务任务完成时间/s任务完成步数/步SV300SV800E5F值P值SV300SV800E5F值P值任务任务1氧电池和蓄电池更换108.07±18.49 108.71±13.72 154.00±23.80 24.210 <0.001 12.50±1.12 12.00±2.54 11.14±0.99 2.122 0.133任务2清洁更换防尘网21.43±10.84 10.00±3.05 10.14±2.97 12.360 <0.001 5.43±0.98 3.79±0.94 3.71±0.70 15.730 <0.001任务3清洁呼吸安全阀35.07±10.89 44.64±27.15 35.36±13.96 1.100 0.343 7.79±0.77 7.00±1.69 4.57±1.18 22.620 <0.001任务4流量传感器校准111.40±11.40 63.57±16.90 128.14±2.70 103.600 <0.001 5.00±1.13 4.43±0.50 7.64±0.48 65.150 <0.001任务5查看高级报警信息13.57±5.84 21.00±8.15 21.36±9.38 3.998 0.026 5.07±1.39 5.86±1.13 6.79±0.41 8.555 <0.001
图3 临床工程师3个型号呼吸机任务难易程度评分(a)和NASA-TLX精神负荷评分(b)
3 讨论
临床医务人员的客观评价指标数据统计结果显示,3 种型号呼吸机的差异主要体现在系统自检、泄漏警报测试和分钟通气量警报测试3 个方面,开机自检的操作步数无显著差异。但由于不同机器的系统结构差异,其自检项目略有差异,导致不同机器自检时间不同。系统自检主要包括泄漏测试、流量传感器检测、氧浓度传感器标定等部分,其中氧浓度传感器标定耗时最长,生产厂商可以在氧浓度传感器标定技术的研发上加以改进。在发生管路泄露或者分钟通气量超过限值时,由于用户界面和硬件设计差异,对于不同机器用户检查警报原因并消除警报的时间有差异,例如,SV300 在泄露警报测试中耗时最少,SV800 则在分钟通气量警报测试中耗时最少。
更换氧电池和蓄电池的差异主要在于蓄电池的拆卸和安装,E5 耗时最长,因其蓄电池保护壳的设计比另外两台呼吸机更复杂,硬件设计不利于拆卸和更换操作。流量传感器校准时间SV800 最短,除本身校准时间短之外,临床工程师在用户界面进入到校准选项花费的时间也更短。呼吸机记录的高级报警信息是临床工程师进行维修维护时的重要辅助信息,查阅报警信息SV300 所需要的时间最短、步数最少,说明SV300 该界面的设计对于临床医学工程师的维修维护更友好便捷。
临床医务人员和临床工程师实验结果中,任务完成时间和任务完成步数对用户主观评价的影响不一样。多种潜在的原因可能影响实验结果,例如,呼吸机的用户界面设计的友好性、美观性和操作便捷性等,都可能会对用户使用感受产生一定影响,从而影响主观评价结果。综合来看,用户的主观使用感受是由多个因素决定的,并不直接取决于任务完成时间和任务完成步数。对于主观与客观评价指标之间的相关性,后期将会进一步展开相关的研究。
相比前人研究[1-5,12],本研究建立的多维度可用性评价模型具有一定创新性,特别是评估人群多样,包含医护技,能更完整体现设备临床操作情况。同时评估内容针对性强,针对国人及国产呼吸机,为国内的研究者提供更多视角综合评估呼吸机的临床可用性的思路。另外,本研究存在一定局限性。首先,每个型号的呼吸机仅评估1 台,不能完全排除测试呼吸机的个体差异;其次,本研究的参与者是临床工作人员,研究场景设置在医院,探讨的是设备在临床应用中的可用性,对于生产设计环节的建设性意见存在局限性;最后,测试任务设置较简单,而呼吸机的功能非常复杂,仅依靠测试任务来进行可用性评价是不全面的。
4 结论
本研究建立了针对不同人群、多维度的国产呼吸机可用性评价模型,并利用该评价模型对3 个型号的同品牌国产呼吸机进行可用性测试实验。综合比较,E5 因研发较早,系统可用性相对较差。SV300 和SV800 可用性表现更好,尤其是SV800,能有效降低操作人员的精神负荷,提升临床工作人员的操作水平。说明国产呼吸机在产品迭代过程中,质量和性能的也在不断提升。需要注意的是,SV800 虽然产品可用性表现最好,实验中也反映出,新款设备在学习使用中的难度较老款设备给测试人员感觉略大,但在大家熟悉后,使用起来因可用性更好,更受大家欢迎。需要考虑如何在推动产品技术的进步的同时,不增加使用者的学习负担。