APP下载

放射影像调阅行为的统计与分析

2010-09-22郭华源薛万国黄辉冯涛

中国医学影像学杂志 2010年5期
关键词:字段日志次数

郭华源薛万国黄辉冯涛

放射影像调阅行为的统计与分析

郭华源1薛万国1黄辉2冯涛3

放射科,医院;X线胶片;数据说明,统计

【中国图书资料分类法分类号】 R179.323

1 引言

随着医疗业务的快速增长和放射影像在临床诊断中作用的不断增强,放射影像资源呈快速增长趋势,影像存储空间也日趋紧张。如图1所示,我院放射影像每月新增量由2004-12的30GB增长到2007-11的470GB。

图1 放射影像每月新增量

通过日志分析来获取用户行为规律和特性,已成为一种重要的信息挖掘手段。如文献[1]研究了网络日志中是否蕴含用户访问Web的规律性特征以及如何据此提高Web服务质量的问题;文献[2]基于用户行为分析的思路,提出一种自动进行搜索引擎性能评价地方法。因此,本文通过对医生日常工作中调阅放射影像的日志进行统计和分析,获取被调阅影像的资源分布特征和影像调阅行为的时间分布特征,为医院对放射影像进行高效存储与管理提供有效参考。

2 统计算法

我院放射影像存储服务器面向临床提供放射影像查询和调阅服务,并且所有影像调阅的通信过程都详细写入日志文件。日志文件采用数据表的方式,按照调阅行为发生时间的先后顺序记录每一次DICOM通信的状况。日志文件的每一行表示一条记录,每条记录都由多个字段来描述一幅影像的传输状况,如表1所示。

现有两种统计粒度可选择。一种是基于Image级,统计的基本单位是Image;另一种是基于Study级,统计的基本单位是Study。由于临床医生调阅影像通常是以Study为参考单位,又鉴于DICOM协议的“Patient-Study-Series-Image”四级信息模型特点[3],将统计粒度定义为Study级将会更加凸显调阅行为特征。

统计算法如下:

①根据Communication Date&Time字段的值,从日志文件中依次读入一定时间段内的每条记录。

②判断SCU/SCP字段的值,如为SCU则表示在此次通信中影像存储服务器把影像存储到请求者的工作站上,也就是为某应用实体提供影像调阅取回服务。

③判断InstanceUID字段值,如非空则表示有影像传输。

④判断Success/Failure字段值,如为“1”则表示通信成功。

⑤日志文件中只记录了每次通信中所传影像的 InstanceUID,还需要得到这些影像所对应StudyUID的存储时间。所以要连接影像存储服务器,通过查询DICOMDB来获取被调阅影像的采集时间。

⑥根据采集时间,将满足上述条件2~4的日志记录按照日期时间分别统计。由于同一次通信中每个Image_uid都联合查询了 Study_uid_id,因此要剔除 Communication ID和Study_uid_id分别都相同的重复项。

最后,得到基于Study级的影像调阅统计数据。

表1 日志记录的字段解析

3 结果分析

根据上述统计算法,对2007-10-26~11-01、11-21~11-27的两个时间段内的放射影像调阅日志进行数据统计和处理分析。

3.1 按采集时间统计影像被调阅次数 见图2及表2。

图2 被调阅影像按采集时间分布

图2和表2表明,临床医生调阅放射影像绝大部分是集中在最近1个月内患者检查所采集的影像,产生时间越久远的影像,其被调阅的次数也越少。主要有以下两方面的原因。

一方面,新近采集的影像刻画了患者病情的最新进展状况,是医生做临床诊断最主要的影像学根据。同时这些影像也是医生为患者制定手术方案、拟定治疗计划、撰写病案等最重要的参考信息,因此导致新近采集的影像被调阅的次数要远远高于其他影像。

表2 影像被调阅次数按采集时间段的百分占比

另一方面,产生时间较久远的影像被调阅的次数很低。虽然这部分影像的现实诊断意义已经大大降低,但是还具有参考比较价值。例如临床医生在回溯病情、分析病因,或者寻找疾病发展规律时,不仅要调阅新近的影像,而且还可能会调阅在此之前的所有相关影像以资参考和比较。

3.2 按24h统计医生影像调阅次数 见图3及表3。

图3 24h医生影像调阅行为分布

表3 时间区段内调阅次数与全天调阅总次数的百分比

图3和表3表明,临床医生每天影像调阅主要集中在7:00~22:00之间。其中,三个影像调阅高峰时段分别是 9:00~12:00,14:00~17:00,以及20:00~21:00。这些高峰时段正好是每天医生会诊、手术、讨论等最集中的时候。这从一个侧面凸显现代影像技术不仅在准确展现病情、精确定位病灶、科学定制治疗方案等方面起到不可替代的信息支撑作用,而且还直接参与手术、治疗的全过程,成为临床医生不可或缺的辅诊工具和疾病救治利器。

另外,在23:00~6:00极少发生影像调阅行为。主要因为这是晚间休息时段,除非出现急诊、抢救等突发情况需要调阅影像。

4 应用策略

医院影像数据的快速增长,一方面将会为临床医生提供更多的辅诊信息,另一方面也给信息管理部门带来日趋沉重的运行维护压力。如何在确保存储可靠性与经济性的同时又能够实现影像调阅的便捷性与实效性,通过对放射影像调阅行为的统计和分析,本文对此问题进行如下探索。

(1)根据被调阅影像的资源分布特征,可以对影像数据的存储实施如下策略:

①对近段时间内采集的影像数据实行在线存储,对一段时间以前采集的数据进行近线或离线存储。时间阀值的选择则需要对影像调阅的资源分布特点、现有在线的存储容量、近线/离线的调取速度等条件进行权衡。

②对访问次数高的数据实行无损压缩,而对访问次数很低的数据则可以实行有损压缩。从磁盘空间利用率上比较,有损压缩要高于无损压缩;但从图像质量上比较,则是无损压缩要好于有损压缩。此外,基于影像调阅的资源分布特点,近段时间内采集的影像数据的访问次数高,而一段时间以前采集的数据的访问次数低。因此,通过综合两者所长,使有限存储资源的利用最大化。

(2)从影像调阅行为的时间分布特点来看,每天7:00~22:00是影像调阅的集中时段。在此期间,要确保系统影像服务的可靠性和高效性,一切可能危及影像服务质量和安全的行为都要尽量规避。而每天23:00~6:00之间则是系统“运维窗口”,系统维护、升级、切换、数据备份和迁移等都可优先考虑在此时间段内进行。

5 结论

本文通过对医生日常工作中对放射影像的调阅行为进行统计和分析,发现被调阅影像的资源分布特点是绝大部分集中在最近一个月内患者检查所采集的影像,而产生时间越久远的影像,其被调阅的次数也越少。同时,医生影像调阅行为的时间分布特点是集中在每天7:00~22:00,而23:00~6:00影像调阅稀少。最后,根据这些分布特点,本文还就如何对放射影像进行高效存储与管理提出应用策略。

[1] 郭岩,白硕,杨志峰,等.网络日志规模分析和用户兴趣挖掘.计算机学报,2005,28(9):1483-1496.

[2] 刘奕群,张敏,茹立云,等.基于用户行为分析的搜索引擎自动性能评价.软件学报,2008,19(11):3023-3032.

[3] National Electrical Manufacturers Association.Digital Imaging and Communication In Medicine(DICOM),PS3.3-2007 [EB/OL].[2007-12-9].ftp://medical.nem a.org/medical/ dicom/2007/.

(责任编辑 于晓红 纳琨)

1.100853 北京 解放军总医院计算机应用与管理科;2.100853 北京 解放军总医院放射诊断科; 3.200335 上海 上海岱嘉医学信息系统有限公司

郭华源 E-mail:guohy2005@163.com.

猜你喜欢

字段日志次数
一名老党员的工作日志
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
俄罗斯是全球阅兵次数最多的国家吗?
扶贫日志
浅谈台湾原版中文图书的编目经验
基于切削次数的FANUC刀具寿命管理
雅皮的心情日志
雅皮的心情日志
题名与责任说明附注字段用法分析
探索性作战仿真实验重复次数控制研究