APP下载

时空监测软件应用研究进展*

2021-03-05雷永春朱小康林少龙章志红上官致洋李炜娟综述张洁妤审校

现代医药卫生 2021年22期
关键词:时空软件监测

曹 飞,雷永春,朱小康,林少龙,章志红,上官致洋,李炜娟 综述,张洁妤△ 审校

(1.南昌大学抚州医学院,江西 抚州 344000;2.黎川县疾病预防控制中心,江西 抚州 344600)

时空扫描法在疾病的暴发监测中被广泛应用,监测数据集常常是巨大而复杂的,使时空监测分析软件的实用性变得越来越重要[1-5]。通过应用时空监测分析软件,时空扫描统计量以不断变化的动态扫描窗口对不同空间和时间的变量进行扫描,能够很好地识别变量的时空聚集性。在时空扫描统计中,假设研究区域为一个圆柱形,其高度代表时间区域,对最可能的聚集区域采用蒙特卡洛模拟法进行估计[6-7]。

1 软件筛选

软件筛选条件:(1)该程序可以用于处理空间和时间2个维度的问题;(2)该程序的分析方法已经内置在软件中,不要求编程。最终筛选出4个符合条件的软件包,即SaTScan、Clusterseer、GeoSurveilance和R-Surveillance。专业的疾病监测系统软件包括数据采集和常规处理、数据库整合、系统专题分析及排除可视化模块[8-9];一般具有很高的等级且普遍在企业水平上应用,对研究者或分析师来说并不容易操作。

2 数据预处理

2.1SaTScan 要求数据被整理成3种不同格式的文件:(1)存储空间位置信息的geography文件;(2)存储病例信息的case文件;(3)存储每个研究地区人口数据的population文件。所有的SaTScan文件都是基于文本格式的,其导入工具也支持导入公用数据(如CSV、DBF文件)。对于空间数据资料,SaTScan能够将其按年、月或日进行整合。因此,数据可以最优的空间精度被录入。当需要尝试以不同分析参数重新构建数据结果时SaTScan的这项功能相比其他程序更具优势。

2.2ClusterSeer 要求每一个监测的时空记录都是唯一的,不能重复。运行时空扫描统计量时也需要有4个项目(位置、数据、病例、人口)的子集及扫描区域内每个时期的所有记录。而要生成所需要的表格则应采用R-Surveillance软件中的特定数据重构功能。若将数据以星期的方式进行整合则需要构建出具有52周×扫描区域个数记录的表格。

2.3GeoSurveillance 要求数据以时间和空间的整合形式存在。病例计数为多边形几何和属性特征文件格式或纯文本文件,文件命名必须按顺序进行。这一步可通过ArcGIS的常用功能进行自动完成,其将空间链接和地址信息结合成新表格文件。与ClusterSeer相类似,GeoSurveillance在空间信息整合方面不是特别灵活。但GeoSurveillance与ClusterSeer却均能够读取多边形shapefile文件,并自动计算扫描圆心坐标。

2.4R-Surveillance 要求数据以监测的时间为行,空间单元作为列构建矩阵。除SaTScan外,所有的程序对数据输入格式、时空数据整合都严格受限。目前,没有一款软件程序能够在数据不经过任何预处理的情况下导入2种shapefile文件。

3 软件的应用

3.1SaTScan 可用于诸如空间[10-12]、时间[13-15]、时空[7,16]方面的扫描统计,也有回顾性和前瞻性模式。不同的数据类型可通过包括泊松模型、伯努利模型、时空重排、多项式、指数和常规模型等恰当的模型进行分析。经典的圆形扫描统计研究区域也可以转换成椭圆形或随着空间单元关系的变化而自定义形状。

3.2GeoSurveillance 主要应用累积和控制图进行时空监测,回顾性模型仅适用于进行球形的空间分析,而前瞻性模型中累积和控制图则局限于单变量监测。多元累积和控制图目前尚未在GeoSurveillance中得以应用。

3.3ClusterSeer 在时空分析方法方面种类最多,这使得ClusterSeer更加适用于时空扫描的疾病监测。当应用累积和控制图进行时空监测时ClusterSeer与GeoSurveillance相似,但其还可用于时空交互作用的检测[17-19]。因此,ClusterSeer是用于疾病监测数据挖掘的有力工具。一旦数据被构建成适用于ClusterSeer应用的格式,其可进行多种方法的分析。

3.4R-Surveillance 也包含有许多分析方法,如法林顿算法[20]、泊松累积、控制图法[21]、负二项分布等[22]。其包含的算法主要以构建模型为基础。尽管在某些时空监测应用时R-Surveillance被用于分析多变量的时间序列问题,但由于缺乏相应的空间信息,其应用也存在一定的局限性。

4 技术问题

4种时空监测软件在运行过程中均会出现各种技术问题。SaTScan能够处理以“天”为单位的病例数据,进行回顾性时空扫描统计。ClusterSeer则不能够处理以“天”为单位的数据。起初内存及数据集是ClusterSeer运行的受限因素,然而随着版本的升级,其也能够处理并分析以“星期”为单位的数据。尽管这两款软件得到的结果相似,但SaTScan分析以“天”为单位的数据所用时间相对而言更长。GeoSurveillance可用于分析以“星期”为单位的数据,但其在处理最大累积和控制图与地图间的连接时却显得十分缓慢。R-Surveillance也能够运用累积和控制图原理进行时空分析,而且对于以“星期”为单位的数据,其分析所耗费的时间和得到的结果与GeoSurveillance相似。

R-Surveillance是一款均能在Windows、Mac、Linux操作系统中运行的软件。当前,SaTScan有windows、linux运行版本,但mac运行版本尚在研发当中。ClusterSeer、GeoSurveillance仅能在Windows操作系统中运行。所有的分析运行均要求至少3.0 Ghz的奔腾4处理器及2 GB的随机处理器内存的Windows XP操作系统。但与其他三款软件相比,SaTScan进行一次完整性的分析所需时间最短。

5 数据输出

SaTScan的数据输出选项局限于文本文件和数据库文件。数据库文件能与输入GIS中的shapefile文件进行连接和进一步的集群检测。然而,SaTScan的缺陷是没有数据挖掘功能。

GeoSurveillance的分析结果可被写成其他软件容易操作的文本文件,而且GeoSurveillance还能够提供一个与累积和控制图相连接的地图界面,其中累积和控制图表也可展示整体研究区域或者单个研究区域的累积得分。

ClusterSeer在结果输出功能方面更胜一筹,如其绘图功能可以将结果以图片的形式输出。其结果也可以与数据一起形成新的文件,用于内部统计学测试或GIS软件。

R-Surveillance具有广泛的可视化处理功能和输出功能,对于具体的研究对象也有默认的创建绘图功能。当然,这需要操作者对R-Surveillance程序的语法十分熟悉。

6 小结与展望

随着电子病案、综合性数据源及低成本地理传感器的出现,病例资料越来越多地兼具空间和时间信息。这些新的数据来源可以更加全面地了解疾病分布、疾病危险因素和随着时间与空间而变化的人口健康问题。监测数据给公共卫生实践及研究带来方便的同时也给处理及应用这些新数据集的软件带来新的挑战。采用传统统计学假设检验法或GIS可视化对这些数据进行处理的过程中均存在固有问题,这些问题在很多研究中已被证明[23-24]。因此。需要特定的方法来处理这些数据。本文所综述的4款软件均能够提供不同类型数据的分析功能,但SaTScan是用于自动集群监测中最好且最稳定的软件包。

在SaTScan扫描统计基础上希望探求一种以构建模型为处理方式的监测软件包。此外,对结果的全面方位监测要求软件兼具绘图的功能。采用建模方式的原因:(1)获得更加精确的基于协变量效能估计的预测率;(2)调整疾病发病率的空间异质性;(3)平滑相对危险度。如果有GIS为基础的系统来辅助数据的探测,ClusterSeer将被更好的应用。除时空方法外,单纯空间、时间方法使原始数据探测变得越来越方便。当然ClusterSeer还有一系列的输出选项。尽管其是二进制文件不能够配置成递增参数,但ClusterSeer的项目文件能够设置成自动运行。不过由于自动监测的局限性,ClusterSeer可能更适合探究性研究而不是前瞻性集群检测系统。虽然方法(和软件)已被分类为假设检验类或构建模型类,但这些方法是相互补充的而不是相互对立的[25]。

本文中所综述的4款软件的程序均需安装在本地电脑中。虽然这是计算机软件应用的体系结构,但新计算技术将利用不断发展的因特网来执行前瞻性、高效能的计算任务[26]。分析型服务项目(如集群分析)的在线传输使软件服务更加集中于某一个服务员手中。这些可以促进不同地区卫生机构疾病监测指标的标准化,增加疾病监测分析的透明度。基于网络的ClusterSeer及R-Surveillance软件服务器界面当前处于发展阶段,对未来监测系统的完善提供了希望。

新型疾病的威胁和慢性病日益增长的负担使整合监测方法显得尤为必要。分析疾病的时空趋势可以与研究环境中的危险因素进行连接,在自动监测系统中标记异常事件、提供疾病暴发期间的最新信息。充分研究和掌握这些方法才能保证方法的透明性和结果重复性。疾病统计、监测方面大量的文献是掌握和应用这些方法的基础,但距离软件应用的标准化还十分遥远。时空监测统计分析方法的成熟及发展使相关应用软件的改善显得很必要。未来疾病监测软件发展最理想的情况可能是计算机源代码的开放,因为不同的统计监测软件就能够有效整合在一起。然而当数据需要在不同软件包中进行分析时数据结构仍然是处理时空数据的重大问题。在R-Surveillance语言或另一种开放源代码的环境下标准化时空数据可能成为未来一个富有成效的发展领域。

猜你喜欢

时空软件监测
跨越时空的相遇
特色“三四五六”返贫监测帮扶做实做细
禅宗软件
镜中的时空穿梭
软件对对碰
玩一次时空大“穿越”
时空之门
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月
不穿戴也能监测睡眠