时空扫描统计量三维可视化的实现*
2015-03-09唐咸艳李黄秋兰仇小强黄高明黄志碧周红霞
唐咸艳李 峤△黄秋兰仇小强黄高明黄志碧周红霞△
时空扫描统计量三维可视化的实现*
唐咸艳1李 峤1△黄秋兰2仇小强1黄高明1黄志碧1周红霞1△
Kulldorff M提出的时空扫描统计量(spatiotemporal scan statistic)是基于大小和位置处于动态变化的圆柱形窗口(cylinder w indow)进行扫描,已广泛应用于探测疾病的时空聚集区[1-3]。时空聚集区不同于单纯性空间聚集区,它不仅体现出空间维度上聚集范围的大小,还反映出时间维度上聚集时间的长短。作为时空扫描统计分析的专业实现平台,SaTScan软件和FleXScan软件目前尚无实现时空聚集性三维可视化的窗口或模块[4],这在一定程度上影响了分析结果的直观化报告。为此,研究者常通过在地图中添加文本框来标注时空聚集区所覆盖的时空范围[5-6]。就本质而言,这种添加文本标注的形式没能真实展示时空聚集区的三维特性,其效果一般。因此,本文旨在探讨时空扫描统计分析中时空聚集区的三维可视化方法,为时空扫描统计分析结果的直观报告提供参考。
时空扫描统计量的实例
本文实例分析所用数据引自《广西壮族自治区1989-2006年流行性乙型脑炎时空动态趋势分析》[6],在SaTScan 9.3中进行回顾性时空扫描统计分析,探测到的时空聚集区见表1。
表1 1989—2006年广西乙脑发病的时空聚集区
首先,将探测到的时空聚集区保存到文件名“spatiotemporal cluster.xls”中,同时将广西县界矢量电子地图保存到文件名“Guangxi.shp”中。为实现时空聚集区的三维可视化,我们将尝试在R 3.1语言中编写时空聚集区三维可视化的程序块[7]。
三维可视化的R程序
1.设置好R语言的工作路径
2.装载和调用相关程序包
3.读取矢量地图和时空聚集区数据
4.编写时空聚集区三维可视化的程序块
5.运行时空聚集区三维可视化的程序块
结果与讨论
扫描统计专业软件SaTScan 9.0版本后[4],空间聚集区(spatial cluster)通过SaTScan to Google Earth Conversion Tool工具可自动被加载到Google Earth中,实现空间聚集区的可视化,这极大方便了用户。然而,SaTScan软件迄今没能提供时空聚集区(spatiotemporal cluster)可视化的窗口或模块。因此,如何实现时空聚集区的自动可视化,便成了研究者们期待早日解决的问题。本文在调用R语言相关程序包,以及读入地图数据和时空聚集数据后,通过运行已编好的时空聚集区三维可视化R程序(plot.cylinders<-function(map,data,col=“risk”)),可得到圆柱形的三维时空聚集区(图1)。圆柱的底部对应时空扫描统计量的空间窗口,代表聚集区的空间范围大小(km)。圆柱的高度对应时空扫描统计量的时间窗口,代表聚集区的时间跨度长短(年或月);圆柱的下端代表聚集区的起始时间,圆柱的顶端代表聚集区的终止时间。可见,三维圆柱较好模拟了时空扫描统计量的扫描窗口,直观展示了时空聚集区,增强了复杂统计量的可读性。
图1 三维时空聚集区
目前,大多数研究者尝试通过在地图中添加文本标注来展示时空聚集性[5-6],但这并非真正意义上的三维时空聚集区,其效果一般,可读性尚需提高。因此,在目前尚无快速、简便、自动化软件(平台)来实现时空聚集区三维可视化的情况下,本文所编写的R程序块可用于实现时空聚集区的三维可视化,效果较好,便于分析结果的可视化报告。
值得注意的是,本文推荐的方法是基于Kulldorff M的规则型扫描统计量,其空间扫描窗口为圆形或椭圆形[4]。当采用Tango T推荐的不规则扫描统计量(flexible scan statistics)进行时空聚集性探测时[8],所探测到的时空聚集区在空间维度上是不规则区域(irregular district),本文所提供的方法则较难适用,尚需进一步完善与优化程序。
[1]Tang F,Cheng Y,Bao C,et al.Spatio-temporal trendsand risk factors for Shigella from 2001 to 2011 in Jiangsu province,People′s Republic of China.PLoSONE,2014,9:e83487.
[2]Xie Y-h,Chongsuvivatwong V,Tang Z,et al.Spatio-Temporal Clustering of Hand,Foot,and Mouth Disease at the County level in Guangxi,China.PLoSONE,2014,9(2):e88065.
[3]唐咸艳,周红霞.扫描统计及其在流行病学中的应用.中国卫生统计,2011,28(3):332-337.
[4]SaTScan User Guide for version 9.3.http://www.satscan.org. 2014.
[5]Liu Y,Wang X,Liu Y,et al.Detecting spatial-temporal clusters of HFMD from 2007 to 2011 in Shangdong Province,China.PLoS ONE,2013,8(5):e63447.
[6]唐咸艳,甘文烨,徐斌,等.广西壮族自治区1989-2006年流行性乙型脑炎时空动态趋势分析.中华流行病学杂志,2011,32(3):274-278.
[7]The R Project for Statistical Computing.http://www.r-project.org/.
[8]Tango T,Takahashi K.A flexibly shaped spatial scan statistic for detecting clusters.International Journal of Health Geographics,2005,4(11):4-11.
(责任编辑:邓 妍)
广西科学研究与技术开发计划项目(桂科攻10124001A-65);广西自然科学基金(2013GXNSFBA019125).
1.广西医科大学公共卫生学院流行病与卫生统计学教研室;
2.广西南宁市疾病预防控制中心.
△通信作者:李峤,E-mail:liqiao4316@hotmail.com;周红霞,E-mail:gmuies@163.com