大数据时代肿瘤心脏病学的机遇和挑战
2018-02-12王阿曼综述夏云龙审校
王阿曼 综述 夏云龙 审校
(1.大连医科大学附属第一医院肿瘤科,辽宁 大连 116011;2.大连医科大学附属第一医院心内科,辽宁 大连 116011)
近年来,随着肿瘤综合诊治水平的提高,肿瘤患者的预后得到了极大的改善[1]。然而,肿瘤幸存者生存期的延长也使得抗肿瘤治疗的心脏毒性发生率显著增加。肿瘤治疗能够直接导致心脏损伤或通过加重心脏疾病的风险因素间接导致心脏损伤[2]。作为肿瘤学与心血管病学的交叉学科,肿瘤心脏病学的主要研究内容包括抗肿瘤治疗的心脏毒性、肿瘤合并心脏疾病、心血管疾病与肿瘤共有的危险因素及心脏肿瘤等[3-4]。其中,抗肿瘤治疗心脏毒性的特点和机制、一级和二级预防策略、生物标志物、筛查指南和风险预测模型是目前临床上亟需明确的关键问题[5],这些领域的研究离不开科学有效的研究方法。
随机对照研究(RCT)是目前常用的循证医学体系中最高级别的证据,然而部分RCT仍存在不少缺陷,如结果偏倚,入组条件严格无法充分体现真实世界中的疾病特点和诊疗需求等。随着计算机技术和生物信息学的发展,医学研究进行大数据时代,从疾病的流行病学、基础研究、新药研发到临床研究,无不贯穿着对数据的获取、管理和分析。现将重点探讨大数据方法在肿瘤心脏病学研究中的作用。
1 大数据的概念及价值
“大数据”作为近年来的新兴概念,目前尚无具体界定标准。大数据(big data)是指体量巨大、类型多样、结构繁杂的海量数据集合,用传统的数据处理方式难以进行有效分析和利用。业界通常用“4V”来概括大数据的特点:Volume(容量巨大)、Velocity(数据创建和分析速度快)、Variety(数据类型多样)、Value(价值)。重要的是,大数据并不仅仅意味着数据量大,而是以数据的异质性、有效性、高输入速度为特征,这些特点为数据的存储、处理和统计分析带来了巨大的挑战,然而其丰富的资源也为相关研究带来了前所未有的机遇。早在2015年,美国总统奥巴马首次提出“精准医学”概念,2016年副总统拜登提出癌症登月计划(Cancer Moonshot),并拨款至少10亿美元用于提升癌症的诊治水平,这些举措直接和间接地为大数据在肿瘤心脏病学中的应用提供了资金和技术支持。
据统计每天能够产生2.3万亿千兆字节(GB)的数据量。随着医疗信息化的发展,健康体检、疾病监测、公共卫生、社会保健、医疗保险索赔、医疗系统等产生了海量数据,2011年全球医疗卫生领域数据量达到1 610亿GB,这些数据亟待收集和挖掘。医疗大数据旨在从这些海量真实世界数据源中为患者、医生和研究者提取出有效信息,总结规律,制定更为合理的诊疗标准,IBM研发的沃森机器人在肿瘤治疗决策中的应用是大数据临床转化的典型成功案例。
2 大数据在肿瘤心脏病学中的应用
近年来抗肿瘤新药的研发速度极快,然而,绝大多数新药的获批均基于RCT结果,入组这些RCT的受试者经过严格筛选可能仅代表了相对“更健康”的小部分患者,往往更年轻且心血管疾病风险更低,其观察到的心脏毒性发生率可能无法准确地反映真实世界中的发生风险。NSABP B-31研究对1 830例乳腺癌患者进行了7年的随访,在应用曲妥珠单抗组和对照组中观察到心脏不良事件的发生率为4.0%和1.3%[6]。在统计学上,临床研究多基于特定药物和患者人群,其心脏疾病的绝对发生率相对较低。大数据为更好地识别发生率低但意义重大的低频事件提供了可能。
肿瘤心脏病学是一门相对年轻的学科,随着对新的病理生理基础和亚型的深入研究,心脏毒性的识别和监测离不开大量的数据。此外,肿瘤治疗的心脏毒性涉及人口统计学、基因状态、辅助检查、药物治疗等复杂的多因素,需要整合医疗信息、电子健康档案、基因组数据等多样化数据来进行风险评估和治疗决策的研究。欧洲的肿瘤研究组织近年来倡导对肿瘤心脏病学数据进行系统地收集和分析,并致力于推动建立和共享肿瘤心脏病的国际档案,而中国在该领域仍处于空白,这项工作对于肿瘤心脏病学研究的实施具有重要意义。
尽管肿瘤心脏病学大数据研究刚刚起步,国内外部分专家学者已取得了令人瞩目的成果。Patel教授及其团队利用CathPCI数据(美国心脏学会注册数据)分析了来自663所医院共40万例接受选择性冠状动脉造影患者的数据[7]。结果显示2/3接受该治疗的患者存在非阻塞性疾病,亟需在冠状动脉造影前对患者进行更好的危险分层以避免过度治疗。CathPCI数据库自1998—2013年已纳入来自美国的1 577个参与中心的1 200万例档案[8]。去年,国际医学期刊编辑委员会发布了一项倡导,建议临床试验在发表后6个月内公开原始数据[9]。最近编辑部再次明确表示支持临床试验数据的透明化和开放获取[10-12]。
Chen等[13]和Ezaz等[14]团队的两项研究分别应用了疾病监测、流行病学和临终医疗数据,进行了肿瘤心脏病学研究。Chen教授团队分析了至少45 000例年龄67~94岁曾接受蒽环类、曲妥珠单抗单药或联合以及未使用以上两类药物的患者心力衰竭或心肌病的发生率数据。Ezaz教授团队分析了1 664例接受曲妥珠单抗治疗的乳腺癌患者的数据并建立了心力衰竭和心肌病风险评估系统。大数据对于明确以上发生率低且评估困难的心脏毒性发病率具有一定的优势。
中国肿瘤心脏病学的发起者之一夏云龙教授利用大数据方法分析了2006—2007年开滦集团职工健康体检的81 110例男性中血脂异常如总胆固醇 (TC)、低密度脂蛋白胆固醇(LDL-C)及非高密度脂蛋白胆固醇(non-HDL-C)与动脉粥样硬化性心血管疾病和肿瘤发生的关系[15],结果显示高水平的TC、LDL-C和non-HDL-C 增加动脉粥样硬化性心血管疾病的发生风险,但TC、 LDL-C、 non-HDL-C与整体肿瘤及部分肿瘤的发生呈负相关,不排除低水平的TC、LDL-C、non-HDL-C可能增加肿瘤的发生风险。该研究对于明确血脂与肿瘤发生的关系具有重要意义。
肿瘤治疗心脏毒性的定义对于肿瘤心脏病学研究至关重要。目前对曲妥珠单抗心脏毒性最广泛认可的定义即左室射血分数(LVEF)下降至少5%或<55%伴有心功能不全的症状,或无症状性LVEF下降至少10%或<55%。美国超声心动图学会和欧洲心血管成像学会将心脏毒性定义为LVEF下降至少10%或<53%,这是第一个将应变作为亚临床左心室功能损伤标准的指南推荐。然而,有研究显示经胸廓超声心动图检查检测该指标,不同诊断者之间存在10%的变异[16]。无症状性LVEF下降10%的标准尽管敏感但临床上较少使用,错误的阳性判断标准可能混淆临床上有意义的终点事件。上述争议未来可能需要更多的大数据研究来解答。
化疗或放疗相关心脏疾病需要国际分类(ICD)诊断编码以快速纳入大数据管理和本地电子化健康档案,这类数据集有助于获取人口统计学数据和发病趋势。此外,肿瘤心脏病注册资金是建立注册体系的基础。类似于CathPCI数据库,涵盖多机构多变量如肿瘤分期、受体状态、化疗剂量和应变模式海量数据的肿瘤心脏病学注册体系的建立对于肿瘤心脏病学真实世界研究极其必要。
近年来曲妥珠单抗等靶向药物的出现改变了肿瘤的治疗模式,尤其是多种酪氨酸激酶抑制剂药物和免疫治疗为肿瘤患者提供了新的治疗选择,其心脏毒性的特点也与化疗药物截然不同。一些新药在FDA的审批时间明显缩短,甚至绕开了标准1-2-3临床试验流程[17-18]。药物的快速上市使得上市后监测和药物警戒极为重要。目前为止,药物警戒性分析已经能够简单地应用源于行政索赔或电子健康档案的大数据来获取肿瘤治疗暴露与心脏疾病发生率的相关性。作为更先进的技术手段,大数据还可作为补充有助于更好地识别药物在临床前研究中未显现出的心脏毒性危险信号,未来有望用于药物监视过程中的心脏毒性的识别和监测。
3 大数据研究面临的问题和挑战
诚然,大数据在肿瘤心脏病学领域的应用仍存在诸多挑战。美国FDA下设健康数据科学和信息部门联合药物警戒性数据挖掘部门(如FDA不良事件报告数据库)专门负责提取药物化学结构和靶点相关信息,并分析其与特定药物不良反应的关联性[19],其近期的研究重点为酪氨酸激酶抑制剂与心肌病左心室损伤的临床亚型和机制的潜在关系[20]。该研究一旦顺利完成有望成为预测其他药物-结局关系的模型。其方法学上的难点之一为缺乏一个涵盖各种不良事件的总体来有效整合分析所需的各种数据流。这些数据可能包括基因表达序列、RNA序列、组织病理学数据、动物毒性数据和人类临床亚型等。另一个方法学难点为大数据研究纳入数据的不完整。典型的系统分析使用普通微分方程来确定本体网络中节点和边缘之间的关系。大数据研究无法满足该方法所需的数据完整性,因而需要寻找新的替代方法。
除了数据的整合和分析以外,药理机制方面的数据挖掘也存在挑战。制药企业、学术机构、科研人员和医疗体系的协作有助于提高数据资源共享水平。目前美国国家癌症研究所(National Cancer Institute,NCI)已经开发了试验性治疗临床试验网络平台,旨在实现各方协作以及分子、药理学和临床数据的整合[21]。
面临的另一项挑战是寻找符合临床表型分析要求的大数据源。仅仅依靠ICD-10编码或收费数据来识别终点事件仍具有局限性,充分的表型特征分析需要来自临床评估、实验室检查和影像学检查的数据源。NCI肿瘤临床试验计划中包含的心脏功能和心血管活动不良事件通用标准术语也存在缺陷。来自制药企业的数据可能更丰富并有助于亚型分析,然而目前并不清楚这些数据是否能够满足FDA的预期要求。两项FDA发布的数据源FAERS和Sentinel均尝试扩大数据共享联盟。FDA的Sentinel计划拟纳入多个组织,包括大型保险公司、医疗系统和学术机构。PCORnet和OHDSI网站是未被挖掘的数据和信息源的代表。PCORnet是由患者导向医疗成果研究所(Patient-Centered Outcomes Research Institute)倡导建立的,旨在利用大型医疗数据集和患者组织的合作关系促进以患者为中心的研究。有效整合这些数据联盟是获得有研究价值的数据集的关键。
越来越多的证据表明肿瘤和心血管疾病具有共同的发病基础。流行病学数据显示两者具有共同的高危因素如吸烟、肥胖和糖尿病,并且均涉及包括炎症和氧化应激等在内的共同分子机制。来自ARIC的研究数据表明如果患者达到7项理想的心血管健康标准,则肿瘤的发病率可显著降低[22]。对于肿瘤和心血管疾病的关系进行深入研究十分有必要。大数据方法能够更好地明确遗传因素、生活方式和环境因素之间的复杂关系,基于人群水平的医疗数据有助于对人群进行目的性干预以预防肿瘤和心血管疾病[23]。利用大数据的药物警戒性方法有助于识别多种新型靶向治疗的心血管毒性。尽管大数据方法研究仍存在诸多挑战,其为肿瘤心脏病学这门新兴学科的发展提供了机遇。
[1] Aleman BM,Moser EC,Nuver J,et al.Cardiovascular disease after cancer therapy[J].EJC Suppl,2014,12(1):18-28.
[2] Khouri MG,Douglas PS,Mackey JR,et al.Cancer therapy-induced cardiac toxicity in early breast cancer:addressing the unresolved issues[J].Circulation,2012,126(23):2749-2763.
[3] Francis SA,Asnani A,Neilan T,et al.Optimizing cardio-oncology programs for cancer patients[J].Future Oncol,2015,11(14):2011-2015.
[4] Bellinger AM,Arteaga CL,Force T,et al.Cardio-oncology:how new targeted cancer therapies and precision medicine can inform cardiovascular discovery[J].Circulation,2015,132(23):2248-2258.
[5] Bhave M,Shah AN,Akhter N,et al.An update on the risk prediction and prevention of anticancer therapy-induced cardiotoxicity[J].Curr Opin Oncol,2014,26(6):590-599.
[6] Romond EH,Jeong JH,Rastogi P,et al.Seven-year follow-up assessment of cardiac function in NSABP B-31,a randomized trial comparing doxorubicin and cyclophosphamide followed by paclitaxel (ACP) with ACP plus trastuzumab as adjuvant therapy for patients with node-positive,human epidermal growth factor receptor 2-positive breast cancer[J].J Clin Oncol,2012,30(31):3792-3799.
[7] Patel MR,Peterson ED,Dai D,et al.Low diagnostic yield of elective coronary angiography[J].N Engl J Med,2010,362(10):886-895.
[8] Moussa I,Hermann A,Messenger JC,et al.The NCDR CathPCI Registry:a US national perspective on care and outcomes for percutaneous coronary intervention[J].Heart,2013,99(5):297-303.
[9] Taichman DB,Backus J,Baethge C,et al.Sharing clinical trial data:a proposal from the International Committee of Medical Journal Editors[J].Rev Med Chil,2016,144(1):11-13.
[10] Patel MR,Armstrong PW,Bhatt DL,et al.Sharing Data from Cardiovascular Clinical Trials—A Proposal[J].N Engl J Med,2016,375(5):407-409.
[11] Krumholz HM,Waldstreicher J.The Yale Open Data Access (YODA) Project—A Mechanism for Data Sharing[J].N Engl J Med,2016,375(5):403-405.
[12] Navar AM,Pencina MJ,Rymer JA,et al.Use of Open Access Platforms for Clinical Trial Data[J].JAMA,2016,315(12):1283-1284.
[13] Chen J,Long JB,Hurria A,et al.Incidence of heart failure or cardiomyopathy after adjuvant trastuzumab therapy for breast cancer[J].J Am Coll Cardiol,2012,60(24):2504-2512.
[14] Ezaz G,Long JB,Gross CP,et al.Risk prediction model for heart failure and cardiomyopathy after adjuvant trastuzumab therapy for breast cancer[J].J Am Heart Assoc,2014,3(1):e472.
[15] Guan XM,Wu SL,Yang XL,et al.Association of total cholesterol,low-density lipoprotein cholesterol,and non-high-density lipoprotein cholesterol with atherosclerotic cardiovascular disease and cancer in a Chinese male population[J].Int J Cancer,2018,142(6):1209-1217.
[16] Thavendiranathan P,Grant AD,Negishi T,et al.Reproducibility of echocardiographic techniques for sequential assessment of left ventricular ejection fraction and volumes:application to patients undergoing cancer chemotherapy[J].J Am Coll Cardiol,2013,61(1):77-84.
[17] Chabner BA.Early accelerated approval for highly targeted cancer drugs[J].N Engl J Med,2011,364(12):1087-1089.
[18] Chabner BA.While We’re at It,Let’s Whack the FDA[J].Oncologist,2016,21(3):259-260.
[19] Bai JP,Abernethy DR.Systems pharmacology to predict drug toxicity:integration across levels of biological organization[J].Annu Rev Pharmacol Toxicol,2013,53(1):451-473.
[20] Sarntivijai S,Zhang S,Jagannathan DG,et al.Linking MedDRA((R))-Coded Clinical Phenotypes to Biological Mechanisms by the Ontology of Adverse Events:A Pilot Study on Tyrosine Kinase Inhibitors[J].Drug Saf,2016,39(7):697-707.
[21] Koene RJ,Prizment AE,Blaes A,et al.Shared Risk Factors in Cardiovascular Disease and Cancer[J].Circulation,2016,133(11):1104-1114.
[22] Rasmussen-Torvik LJ,Shay CM,Abramson JG,et al.Ideal cardiovascular health is inversely associated with incident cancer:the Atherosclerosis Risk In Communities study[J].Circulation,2013,127(12):1270-1275.
[23] Mandawat A,Williams AE,Francis SA.Cardio-oncology:the role of big data[J].Heart Fail Clin,2017,13(2):403-408.