eICU合作研究数据库申请及数据提取流程
2019-04-04郭晓娟田国祥闫小妮冯晓婕赵帆帆吕军
郭晓娟,田国祥,闫小妮,冯晓婕,赵帆帆,吕军,5
重症医学是现代医学发展进步的必然趋势和显著标志,是医学科学发展到相当高度条件下的时代性产物[1]。重症医学涉及的难点问题很多,包括无创通气的应用与管理,抗生素的合理使用,营养评估与营养支持的实施,镇痛与镇静剂的应用指征,及ICU风险评估模型的适用范围等[2],需要开展大量的临床研究去获得循证医学证据。重症监护病房(ICU)患者是重症医学的核心[3]。患者生命体征不稳定,一个或多个器官功能受累,潜在或已危及生命。患者特点决定了ICU医务工作者工作节奏快,医疗护理任务繁重,难以拥有大量时间和精力去收集大量完整的诊疗信息[4]。飞利浦医疗保健是ICU设备和服务的主要供应商,提供了称为eICU计划的teleICU服务。在实施eICU计划后,大量数据被收集并流式传输,以供远程ICU团队实时监控。这些数据由飞利浦存档,并由eICU研究所转换为研究数据库[5]。eICU合作研究数据库(eICU-CRD)是由飞利浦集团与麻省理工学院(MIT)计算生理学实验室(LCP )合作创建的大型公共数据库[6],是从美国境内的大量医院收集的完全独立的数据集。eICU-CRD的发布旨在MIMIC-Ⅲ成功建立的基础之上,通过从多个中心提供数据来扩大研究范围。该数据库由来自美国大陆的许多重症监护病房的数据组成,目前的版本是v2.0,于2018年5月17日发布,涵盖了2014年和2015年入住重症监护病房的200 000多例患者的常规数据,收集了大量高质量的临床信息,包括生命体征,护理计划文件,疾病严重程度,诊断信息,治疗信息等。 数据的免费可用性将支持许多应用,包括机器学习算法,决策支持工具和临床研究的开发等。
3.筹资不足风险。因PPP项目遭遇不可预见的因素,需要追加投资,而政府或社会资本方均无法追加投资,也无法通过金融机构筹集资金,导致筹资风险。
1 数据库申请
要想获得eICU合作研究数据库的使用权限,必须先进行注册申请。数据在注册申请通过后公开[7]。申请者需要完成有关人类受试者研究的培训课程,并签署数据使用协议。协议规定申请者不会与他人共享数据,不会尝试重新识别任何患者或机构,并且应使用与该数据发布相关的代码。要求负责任地处理数据并遵守协作研究的原则[8]。该协议一旦获得批准,数据可以直接从PhysioNet上的eICU合作研究数据库项目下载。由于去除识别过程的复杂性和所需的高灵敏度,并非所有数据都可以在当前版本的eICU-CRD中获得。eICU-CRD v2.0包含2014~2015年间入院患者的数据。当数据通过可以发布的安全认证后,会对当前数据集进行更新。
从插秧和铲、担秧的公式中,每插一亩秧可得28分,每铲、担一亩秧得12分,也就是说,这一系列工作做完有40分,一天插一亩田正常需要4个一级工,每人插0.25亩,而十队当天出工的社员大部分都是二、三级工,平均每人插了0.29亩。此外,十队所插的田是分布在四个不同地方,这其中距离的远近也会对工作效率产生影响。即便如此,当天的劳动效率还是高于正常劳动水平。
1.1 访问数据库网站 首先打开网站,点击“Getting Started/Requesting Access”,因为该数据库使用了ICU患者的数据,为了尊重该数据并保证合理利用,研究人员需要完成一个培训课程,然后才可以访问(图1)。
1.2 注册课程账号
1.3.2 选择课程 在这个页面,最重要的是第一个问题,选择“Data or Specimens Only Research”(图3),其他问题选择 N/A或者NO,完成后,在个人中心里面会出现该课程。
资料显示,自2015年起,我国全面推进实施农药使用量零增长行动方案,大力推进农药减量控害,积极探索高效、安全、资源节约、环境友好的现代农业发展方式。
1.3.1 在培训首页,点击“Add a Course”
1.3 完成培训
1.2.2 输入相关信息 相关信息如:姓名,邮箱地址,用户名,密码,国家,单位等信息后,完成注册流程。
1.2.1 点击链接 https://www.citiprogram.org/index.cfm?pageID=154&icat=0&ac=0 进入注册页面,然后在输入框中输入Massachusetts Institute of Technology Affiliates,并且勾选下面的同意须知,最后点击“Continue to Create Your CITI Program Username and Password”(图2)。
图1 数据库注册页面
图2 知情同意确认页面
图3 用户申请目的页面
1.3.3 点击“Data or Specimens Only Research”开始课程 首先要完成诚信声明,点击“Complete The Integrity Assurance Statement before beginning the course”。
MDOS出现雨量疑误信息的原因是多方面的,如软件精度不同,仪器或通讯故障,人为因素等等,这就要求台站的工作人员能认真查询核实数据,确定原因,熟练掌握MDOS平台的使用方法,及时准确反馈疑误信息,保证雨量数据准确、完整的采集和上传,以满足现代气象业务对气象资料在完整性、时效性、一致性和高质量方面的要求。[4]
1.3.4 开始完成课程 总共有9个模块需要学习,需要平均正确率90%以上才可以成功(图4)。课程主要是关于美国对于使用个人信息做研究的法律规定,用来保证个人隐私不会泄漏和滥用。
2.4 安装数据库软件PostgreSQL访问
2.1 使用注册的用户名密码登陆 下载链接中的csv文件(图6)https://physionet.org/works/eICUCollaborativeResearc hDatabase/files/
1.5 完成注册后,点击链接申请数据访问权限 https://physionet.org/works/eICU Collaborative Research Database/access.shtml,在该页面,需要上传课程结业证书,并且填写推荐人的联系方式,完成之后提交,几个工作日后会通知结果,是否批准数据访问。
2 数据提取
图4 培训课程完成页面
图5 PhysionNet账号注册页面
1.4 创建PhysionNet账号 点击 https://physionet.org/pnw/login ,在该页面输入邮箱地址,网站会给该邮箱发送确认邮件,打开邮箱之后进入注册页面,输入密码,姓名后完成注册(图5)。
2.2 根据提示在命令行中执行 YOURUSERNAME对应网站用户名,执行命令后根据提示输入密码。
2.3 下载完成后,获取数据文件 eICU合作研究数据库文件作为一组逗号分隔值(CSV)分发(图7),可以加载到任何关系数据库系统中。每个文件包含单个表的数据,使用斜体字表示对表的引用,使用等宽字体表示对列的引用。几乎所有表都使用patientunitstayid作为主标识符,每个表格删除所有受保护的健康信息(PHI),如个人号码(电话,社会保障),地址,日期等。因此,eICU-CRD中的标识符无法链接回原始的可识别数据。所有医院和ICU标识符也已被删除,以保护贡献机构和提供者的隐私。所有表格的大部分由至少三名人员进行人工审查,以验证所有数据是否已被识别。在GitHub上有一个存储库来保存eICU合作研究数据库代码:https://github.com/mit-lcp/eicu-code。用于生成表格和描述性统计数据的代码可在线获取[9]。
集成电路布图设计专有权保护相关问题研究——国内首例侵权纠纷行政裁决案件引发的思考.........................................................................曹志明 王志超 07.60
2.5 设置密码 剩下的几个步骤都直接点击“Next”,完成安装(图9)。
图6 文件下载页面
图7 CSV文件页面
https://www.openscg.com/bigsql/postgresql/installers.jsp/,这里选择PostgreSQL 9.6.11版本(图8 )。
2.6 导入数据
另外,生物教师应该多接触学生,上课提前到班,利用课间时间与学生聊聊天、开开玩笑;中午时间,与学生在办公室内聊聊天(我认为课后师生是朋友关系,不是师生关系)。在平等的关系中,缩短了彼此间的距离,学生易接受和领悟教师的一些意图,暗示效果好。教师要告诉学生,你能行,你会更好等。
2.6.1 在命令行中输入命令 打开数据库(图10)2.6.2 连接上数据库之后,创建一个eICU用户,和eICU数据库(图11)
2.6.3 为了使用方便,将默认路径修改为eICU(图12 )
2.6.4 创建空白的数据表,以便导入数据(图13)
2.6.5 将下载的csv文件导入数据库 例如导入“ADMISSIONDX.csv”入院表图(图14 )。
心事重重的欧阳锋坐公交时误过了两站,回到家菜都已经凉了。吕凌子重新去厨房热了菜,端回餐桌。吃饭时两个人都不说话,欧阳锋始终埋着头。欧阳锋的这种精神状态令吕凌子暗自担忧,身为妻子,她十分了解丈夫的个性,即便自己有满腹怨言,也只能忍着,她不能眼睁睁地看着丈夫被逼上绝路,或推下深渊。
图8 数据库软件版本选择页面
图9 数据库软件安装过程页面
图10 数据库打开页面
图11 用户创建页面
图12 默认路径修改页面
图13 空白数据表创建页面
2.6.6 创建index以提升查询效率(图15)
2.6.7 测试查询 例如查询所有因为心血管入院的患者(图16)。
图14 文件导入数据库页面
图15 创建index页面
图16 患者信息查询页面
2.6.8 其他csv文件使用同样的方式导入数据库而后就可以做复杂查询了,例如先查到所有因为心血管入院的患者ID,然后查该患者的治疗用药,护士的观测数据等。
1.1 对象 选取2009年7月—2010年7月在上海市交通大学附属第六人民医院消化内科行结肠镜检查的老年慢性便秘患者150例,男87例,女63例,年龄60~86岁,平均年龄(69.5±2.7)岁。
另外,网站提供了可以公开访问的Jupyter notebooks21,22来演示数据的使用,包括对每个表的详细审查,以及对处理数据时的最佳实践的评论。一般的笔记本可在前面引用的代码存储库中获得,包括用于队列提取、人口特征总结和时间序列数据可视化的笔记本。公开发布eICU-CRD的一个核心目标是促进电子健康记录二级分析方面的合作。开发者认为,公开获取关键概念和定义代码的可靠和一致很重要,这对加速该领域的研究和确保未来研究的可重复性都是至关重要的。详细的文档可以在网上找到,包括有关数据访问、表内容和数据中表之间关系的示意图等信息。Github上提供患者特征的源代码包供全世界研究者免费使用,减少了收集整理信息的漫长过程和编写分析代码的困难,为医务工作者开展临床研究提供了巨大的支撑。围绕数据使用的讨论可以通过GitHub存储库的问题面板进行。
3 讨论
随着卫生信息网络的出现,人类需要开发具有成本效益的系统,以减少记录卫生保健数据所花费的时间和精力,同时增加从这些数据中获得的知识的应用,这种必要性在医疗保健中是毋庸置疑的[10]。重症监护病房患者在整个住院过程中都会受到密切监测,以便及时发现病情变化。患者的病情变化需要医务工作者及时修改治疗方案。床旁监护仪可实时方便地对重症监护患者进行监测,连续不断地传送大量的数据,但只有相对较小的一部分数据被记录在患者的病历信息中,其余大部分数据的归档需要集成不同的信息系统和构建一个处理所有类型数据的全面系统。eICU合作研究数据库解决了医务工作者难以拥有大量时间和精力去收集大量完整的信息的困扰,且向全世界医务工作者免费开放。目前版本eICU-CRD v2.0包含2014~2015年间入院的200 000多例患者的数据,数据集会不断进行更新,可为临床研究者提供宝贵的信息。本文通过介绍eICU合作研究数据库的用户申请及数据提取流程,旨在帮助医务工作者更方便快捷地获取需要的数据,减少使用者在探索数据库过程中需要花费的时间和精力,提高工作效率。