APP下载

GetData Graph Digitizer软件在生存分析中的应用*

2016-02-06王媛媛秦刚汪徐林张建何书沈

中国卫生统计 2016年2期
关键词:曲线图亚组本例

王媛媛秦 刚汪徐林张 建何 书沈 毅△



GetData Graph Digitizer软件在生存分析中的应用*

王媛媛1秦 刚2汪徐林1张 建1何 书1沈 毅1△

1.南通大学公共卫生学院流行病与卫生统计学教研室(226001)

2.南通市南通大学附属第三人民医院

在生存资料的meta分析中,个体原始资料的提取一直以来都是异常棘手却备受关注的问题。本研究以某篇生存分析为例,介绍GetData Graph Digitizer软件(以下简称GetData软件)的基本功能及其在生存分析曲线图中获取数据的方法。

资料和方法

1.从网址http:/ / getdata-graph-digitizer.com/ download.php下载GetData软件,安装后双击图标即可打开软件主界面。

2.以Chen等[1]发表在BMC Cancer上的文献中关于口腔癌患者3年生存率亚组分析的数据提取过程为例,详细说明GetData软件的使用步骤和数据提取过程。

结 果

1.图像的生成与导入:先将要获取数据的图片利用截图软件截出,并保存为GetData软件支持的格式,如JPEG、TIFF、BMC和PCX格式。本例截取文献[2]中的figure 3B,打开GetData软件,点击“File->Open Image”,选择要处理的图像文件。

2.选定坐标:选择软件左上方按钮Set the scale分别设定X最小值=0、最大值=300,Y最小值=0、最大值=1。

3.获取数据:在“Operations”菜单下有三种提取数据的方法,本例采用“Digitize area”过程。点击“Operations->Digitize area”启动“Digitize area”,进一步选择“Rectangular area”,界面中的dx值控制曲线上提取点的密度,dx值越大,所提取到的点越稀疏,本例设置为3。设置好“Rectangular area”后鼠标变为黑色箭头,用之拖出一个矩形区域,区域内部的曲线就会被自动提取,因本例要提取36个月的生存率,故拖出的矩形区域在36附近。这种方法的好处是简单的一次操作即可提取出所有的数据点。

4.数据的输出与保存:按照以上步骤提取的数据在软件右侧会以表格的形式自动显示出来,直接选择File菜单下的“Export data”即可输出数据,输出格式包括TXT、XLS、DXF、EPS四种。数据保存可以选择File菜单下的“Save Workspace”。本例中提取的两组数据是(36,0.5467)和(36,0.7867)。

5.GetData软件的准确性检验:由于meta分析中的这篇文献没有提供原始数据,无法对GetData软件提取数据的准确性进行验证,因此我们选择了Qin等[3]发表在Medicine(Baltimore)上的文献对GetData软件所提取的数据与真实数据进行比较。采用Get-Data软件提取到该文献图figure 2B中第一年和第二年ALSS组的生存率分别为50%和45.10%,对照组的生存率分别为37.75%和32.84%;而通过该文献提供的原始数据计算第一、二年ALSS组生存率分别为50%、46.15%,对照组的为38.46%、33.85%,与Get-Data软件提取的生存率数据近似程度均在95%以上,说明GetData软件提取数据的准确性较高。

讨 论

在Chen等人的meta分析实例中,由于亚组分析的文献只提供了总生存曲线图,没有提及3年生存率,无法进行亚组分析。通过GetData软件在生存曲线中提取相关数据,最终完成了口腔癌3年生存率的亚组分析。因此,GetData软件可以提取基于时间点的数据,数据提取准确性高。

与有些研究使用过的提取生存数据的Engauge Digitizer软件相比,GetData软件有很多优势。首先,提取数据的方法多种多样,既有简单易学的“抓点法”(point capture mode),又有一次提取多个数据的“数字化区域法”(digitize area);其次,GetData还可以设定生存曲线的颜色,如果生存曲线图中存在多条曲线,而研究只需提取其中一条曲线的数据,则可以将其他曲线的颜色设置为底色而不受干扰,而Engauge Digitizer软件只能识别灰度图,彩色线条的生存曲线图必须经过图片处理软件调整为黑白图片才可以进一步提取数据;GetData软件还可在“Settings→language”中更改界面的语言,适合不同语种人的使用,所以GetData软件比Engauge Digitizer软件的应用更加普遍。

总之,GetData软件可以补充不同时点的生存数据,提取过程简单,所得结果准确,但目前应用还不是特别广泛,其主要原因是该软件在国内缺乏推广,很多人甚至都没有听说过这个软件,本研究旨在为研究者提供一个简单实用的软件进行生存曲线中独立患者数据(individual patient data,IPD)的提取,从而使没有提供IPD的亚组生存资料meta分析成为可能。

参考文献

[1]Chen J,Zhou J,Lu J,et al.Significance of CD44 expression in head and neck cancer:a systemic review and meta-analysis.BMC Cancer,2014,14(15):2-9.

[2]Kosunen A,Pirinen R,Ropponen K,et al.CD44 expression and its relationship with MMP-9,clinicopathological factors and survival in oral squamous cell carcinoma.Oral Oncol,2007,43(1):51-59.

[3]Qin G,Shao JG,Wang B,et al.Artificial liver support system improves short-and long-term outcomes of patients with HBV-associated acute-on-chronic liver failure:a single-center experience.Medicine (Baltimore),2014,93(28):e338.

(责任编辑:郭海强)

·专题研究·

*基金项目:国家自然科学基金面上项目(81370520),江苏省自然科学基金面上项目(BK2012653);南通市科技计划项目(MS12015004)

通信作者:△沈毅,E-mail address:sunny@ ntu.edu.cn

猜你喜欢

曲线图亚组本例
基于Meta分析的黄酮类化合物对奶牛生产性能和血清免疫指标影响的研究
慢性阻塞性肺疾病患者膈肌移动度分析
槭叶铁线莲亚组的研究进展
《思考心电图之176》答案
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
《思考心电图之169》答案
秦皇岛煤价周曲线图
秦皇岛煤价周曲线图
冠心病患者肠道菌群变化的研究 (正文见第45 页)