生存资料分析中肿瘤发生时间的修正*
2017-06-29张晋昕温兴煊
张晋昕, 温兴煊
(1.中山大学公共卫生学院, 广州 510080; 2.东莞市疾病预防控制中心, 广东 东莞 523125)
•专家述评•
生存资料分析中肿瘤发生时间的修正*
张晋昕1, 温兴煊2
(1.中山大学公共卫生学院, 广州 510080; 2.东莞市疾病预防控制中心, 广东 东莞 523125)
据2011年世界卫生组织(WHO)统计,全球每年因患癌症死亡的人数约为600余万。目前,包括中国在内的世界大部分国家居民的生命健康均面临着高发病率、高病死率恶性肿瘤的严重威胁[1-2]。预计到2020年,中国每年新发恶性肿瘤病例将达388万,年癌症死亡总数也将增至276万[3]。如何做到更加有效地预防和治疗恶性肿瘤,仍将是整个社会面临的亟需解决的重大课题之一。由于目前尚无完全根治恶性肿瘤的有效方法,因此做好预防仍是恶性肿瘤防治的关键[4]。要想针对性地采取预防措施,前提是能够获悉影响恶性肿瘤发生发展的各种因素,并能准确地把握关键因素。为此,相关研究者进行了大量的恶性肿瘤发生发展的影响因素探索及相应的病因流行病学研究[5]。此类研究中包含生存资料的分析,通常都会用到时间信息(如,Cox比例风险回归分析),此时必然涉及到肿瘤发生时间的确定。尽可能准确地获取肿瘤发生的时间,才能使后续分析结果更加可靠。
1 肿瘤生存资料收集中发生时间的记录方法
目前,在肿瘤的影响因素探索和病因流行病学的研究中被广泛应用的研究方法主要包括队列研究、生存分析等[6-8],而此类研究中包含了大量的生存资料分析处理工作,在这类资料分析中有时会用到随访和阳性事件发生的时间信息,这必然会涉及到肿瘤发生时间确定的问题[6]。在被广泛应用的生存资料分析方法中,肿瘤发生时间的确定方法包括:在进行Kaplan-Meier法生存分析及Cox比例风险回归分析时,研究者通常把观察到肿瘤发生(如,确诊发生肿瘤、发现肿瘤发生转移等)时对应的随访时间点记作肿瘤发生的时间;而从临床的角度来看,医务人员通常把出现相关症状的时间[9]或把随诊过程中肿瘤确诊的时间当作肿瘤发生时间[10]。目前肿瘤随访研究者均默认采用这些传统的结局事件发生时间确定方法,但是这种确定肿瘤发生时间的方法存在问题:在用此方法确定的时间点上肿瘤已具有一定的大小,即研究资料中记录的时刻之前肿瘤已经生长了一段时间,这个时间点并不是肿瘤真正的发生时间。肿瘤真正的发生时间应该要早于记录的时间,即用这种方法确定的时间信息实际是左删失的。
时间信息存在的偏差,必然会影响利用了时间信息的后续相关统计分析方法的结果,如生存分析中位时间、Cox比例风险回归中筛选到的危险因素的类别和风险(HR)大小的估计等。当时间偏差较小时,中位时间的估计和影响因素的筛选结果不会受到严重影响;而当时间偏差大到一定程度时,与真实情况相比中位时间估计结果会有严重改变,而筛选出的危险因素的种类及各因素相对危险度大小排序也会不同,致使有关肿瘤病因学研究中相应分析结果发生偏差,导致在对肿瘤进行干预和采取预防措施时,无法准确地考量轻重缓急。因此,为获取更准确的分析结果,在肿瘤生存资料分析中对肿瘤发生时间信息修正是有必要的。
2 肿瘤生长曲线模型
已有研究阐明肿瘤细胞的增殖不受机体内部机制的调控,同时,肿瘤生长也非一种无组织的行为。作为一种特殊生命体,肿瘤可被看作一个拥有自组织能力的复杂动态系统。虽然其复杂的行为模式很难用体外模型(in vitro)、活体模型(in vivo)或一般的数学模型来描述和模拟,但各相关领域的学者们依然做了大量的努力,旨在对肿瘤生长过程建立一套理想的模型以达到模拟肿瘤生长的目的[11],构建了能准确刻画多种肿瘤生长的数学模型[12-14]。自19世纪20年代起,很多著名的肿瘤生长曲线模型先后被建立,主要包括:Mottram 指数模型[15]、Logistic 模型[16]、Gompertz模型[21]和Gompertz-Laird模型[17]、多细胞肿瘤球体(Multicell Tumor Spheroid)[18-19]模型以及West’s一般生长(West’s General Growth)模型[9]。
在这些模型中除了West’s一般生长模型仅适用于包括女性乳腺癌和前列腺癌在内的几种特定的肿瘤外,其它的几个模型在一定条件下是对所有肿瘤普遍适用的。
West’s一般生长(West’s General Growth)模型,首先是由美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)在研究一般生物体生长的共同规律时提出(《Nature》,第413卷,第 628页,2001年)。该研究发现,包括3种肿瘤细胞体外培养(in vitro)、8种大鼠肿瘤(in vivo, rodents)和2种人体肿瘤(in vivo, patients)在内的13种恶性实体肿瘤沿循同样的法则在生长。这2种人体肿瘤分别是前列腺癌和女性乳腺癌[9]。虽然West’s一般生长模型的应用范围仅局限于几种肿瘤,但是与其它模型相比,该模型对其适用的几种肿瘤的实际生长情况有更优的拟合效果[9, 15-19]。
3 基于肿瘤生长数学模型实现对肿瘤发生时间的修正
目前,肿瘤生长数学模型相关研究已相对比较成熟,多种能够很好地模拟肿瘤生长的模型被建立。其中Mottram指数模型主要被应用于肿瘤早期生长曲线的模拟研究中,而经典Gompertz模型和Gompertz-Laird模型因其能用于模拟在特定条件下肿瘤的完整生长过程,使这些模型得到了更广泛的应用[17, 20]。
某些特定的肿瘤,如乳腺癌具有发病部位局限、多为单发和原发等特征,且目前包括CT、钼靶、B超在内的影像学检查技术能够准确检测乳腺癌的大小。这就为乳腺癌发生时间信息的修正提供了可能,即可借助测量获得足够充分的参数估计值代入肿瘤生长曲线数学模型,实现女性乳腺癌生存资料分析中肿瘤发生时间的修正。
West’s一般生长模型对于在没有外来干预的前提下欧洲女性乳腺癌生长有很好的拟合效果(R2= 0.97)[9]。在获取适用的模型参数后结合准确测量的肿瘤大小信息,其不仅可以用来估计女性乳腺癌发生的具体时间,还能够在乳腺癌生存资料分析时对肿瘤发生时间的确定方法加以调整和完善。使得此类生存资料中的时间信息得以修正,从而使进一步利用了时间信息的统计分析结果更切合实际。
有研究通过收集和分析乳腺癌大鼠模型和乳腺癌患者肿瘤生长数据,进一步证实了West’s一般生长模型适用于人体乳腺癌生长轨迹和模式的刻画,能反映无药物干预的女性乳腺癌的生长情况[25-30],利用可准确测量的肿瘤大小信息,West’s一般生长曲线模型可运用于没有药物干预时女性乳腺癌实际生长时间的估计。
4 West’s一般生长模型用于乳腺癌生存资料分析
利用成功建立的West’s一般生长模型,根据乳腺癌生存资料中记录的原始肿瘤大小信息推算出对应的生长时间,从而修正肿瘤的发生时间。具体的修正流程如图1:
→根据模型函数式,获得乳腺癌生长相对时间τ:τ=-ln(1-r)
图1 利用West’s一般生长模型修正乳腺癌发生时间流程图
先利用West’s肿瘤生长曲线模型以及生存资料肿瘤大小的信息对资料中记录的女性乳腺癌发生时间加以修正后,再用Kaplan-Meier生存分析、Cox回归分析等统计分析方法对修正时间信息后的资料进行分析。特别指出,由于实际研究中收集的资料可能具有层次结构,各观测间有组内聚集性或相似性而不独立,此时传统模型和统计分析方法将不适用。因此在探讨自变量和因变量的相互关系时,无论是自变量还是因变量的层次结构都不能被忽略。为解决此类问题,应采用混合效应模型即多水平模型回归分析方法。根据因变量的分布特征(正态分布、二项分布等)合理选择多水平线性回归模型、多水平logistic回归模型、多水平Cox回归模型等;根据数据的层次特征合理选择二水平、三水平甚至包含更多水平的模型(均可在SPSS、SAS等分析软件中实现)。综上,肿瘤生存资料Cox回归分析前不仅要考虑时间信息的修正,必要时需考虑资料存在的层次结构。
虽然目前尚无可以反映所有肿瘤的生长模式的数学模型,但是已有研究者提出了能够适用于人体特定肿瘤的生长曲线模型——West’sgeneralgrowth模型。这样的数学模型能够很好地反映出人体女性乳腺癌和前列腺癌在没有药物干预下的生长模型,不仅可以用来估计肿瘤发生的具体的时间,还能够在肿瘤随访研究资料分析时,针对肿瘤发生终点事件的时间定义在传统方法的基础上加以调整和完善。需要指出的是,恶性肿瘤种类繁多,而针对这些肿瘤生长模式的前瞻性研究尚在逐步完善,时间信息偏差的问题依然存在,如何归纳出肿瘤生长的一般规律,针对性地修正生存资料中的发生时间,这是实现精准化评价肿瘤发生发展的基础。
[1]MilneR,VesseyM.Theassociationoforalcontraceptionwithkidneycancer,coloncancer,gallbladdercancer(includingextrahepaticbileductcancer)andpituitarytumours[J].Contraception,1991,43(6):667-693.
[2]ThompsonS,TonelliM.Generalhealthchecksinadultsforreducingmorbidityandmortalityfromdisease[J].CochraneDatabaseSystRev,2012,11(1):ED000047.
[3] 陈万青,郑荣寿,张思维,等. 2003~2007年中国癌症发病分析[J].中国肿瘤,2012,21(3):161-170.
[4]ForsytheLP,GadallaSM,HamiltonJG,etal.Enhancingacancerpreventionandcontrolcurriculumthroughinteractivegroupdiscussions[J].JCancerEduc,2012,27(3):428-435.
[5] 黄灵潇, 姚文秀. 乳腺癌筛查和预防措施研究进展[J]. 肿瘤治疗与预防,2013,26(1):38-44.
[6]HogstedtC,JanssonC,HugossonM,etal.CancerincidenceinacohortofSwedishchimneysweeps, 1958-2006[J].AmJPublicHealth,2013,103(9):1708-1714.
[7]FahyBN.Follow-upaftercurativeresectionofcolorectalcancer[J].AnnSurgOncol,2014,21(3):738-746.
[8]HopuleleD,Zugun-EloaeF,CozmaGL,etal.Vascularmolecularmarkersfordeterminationofdiseasefreesurvival(DFS)ofbreastcancer[J].RevMedChirSocMedNatIasi,2006,110(4):950-954.
[9]GuiotC,DegiorgisPG,DelsantoPP,etal.Doestumorgrowthfollowa"universallaw"?[J].JTheorBiol,2003,225(2):147-151.
[10]LiCI,UribeDJ,DalingJR.Clinicalcharacteristicsofdifferenthistologictypesofbreastcancer[J].BrJCancer,2005,93(9):1046-1052.
[11]吴金. 肿瘤生长过程的仿真分析[D]. 华中科技大学,2004.
[12]WestGB,BrownJH,EnquistBJ.Ageneralmodelforontogeneticgrowth[J].nature,2001,413(6856):628-631.
[13]RochaJL,AleixoSM.AnextensionofGompertziangrowthdynamics:weibullandfrechetmodels[J].MathBiosciEng, 2013,10(2):379-398.
[14]YorkeED,FuksZ,NortonL,etal.Modelingthedevelopmentofmetastasesfromprimaryandlocallyrecurrenttumors:comparisonwithaclinicaldatabaseforprostaticcancer[J].CancerRes,1993,53(13):2987-2993.
[15]青义学. 生物医学数学模型[M]. 长沙:湖南科学技术出版社,1990.
[16]CramerJS.TheOriginsofLogisicRegression[R].2002.
[17]NahashonSN,AggreySE,AdefopeNA,etal.Gompertz-LairdmodelpredictionofoptimumutilizationofcrudeproteinandmetabolizableenergybyFrenchguineafowlbroilers[J].PoultSci,2010,89(1):52-57.
[18]DurandRE.Cellcyclekineticsinaninvitrotumormodel[J].CellTissueKinet,1976,9(5):403-412.
[19]SutherlandRM,DurandRE.Radiationresponseofmulticellspheroids-aninvitrotumourmodel[J].CurrTopRadiatResQ,1976,11(1):87-139.
[20]Mignon-GrasteauS,BeaumontC,LeBihan-DuvalE,etal.Geneticparametersofgrowthcurveparametersinmaleandfemalechickens[J].BrPoultSci,1999,40(1):44-51.
[21]NortonL.AGompertzianmodelofhumanbreastcancergrowth[J].CancerRes,1988,48(24):7067-7071.
[22]BaadePD,YouldenDR,CrambetSM.EpidemiologyofprostatecancerintheAsia-Pacificregion[J].ProstateInt,2013,1(2):47-58.
[23]HorevoetsJ,SmetB,PattynetP.Desmoidtumourofthebreast:casereportandreviewoftheliterature[J].ActaChirBelg,2013,113(4):304-307.
[24]Riihimaki M,Thomsen H, Brandtet A. Death causes in breast cancer patients[J]. Ann Oncol,2012,23(3):604-610.
[25]崔尚斌, 艾军. 关于抑制物对肿瘤生长直接效果模型的数学分析[J]. 应用数学学报,2002,25(0):617-625.
[26]Wang ZH, Deisboeck TS. Mathematical modeling in cancer drug discovery[J]. Drug Discov Today,2014,19(2):145-150.
[27]Xu J, Vilanova G, Gomez H. A mathematical model coupling tumor growth and angiogenesis [J]. PLoS One, 2016,11(2): e0149422.
[28]Castorina P, Carco D, Guiot C, et al. Tumor growth instability and its implications for chemotherapy[J]. Cancer Research,2009,69(21):8507-8515.
[29]Antipov AV, Bratus AS. Mathematical model of optimal chemotherapy strategy with allowance for cell population dynamics in a heterogeneous tumor[J]. Computational Matheatics and Mathematical Physics,2009,49(11):1825-1836.
[30]Bratus AS, Chumerina ES. Optimal control synthesis in therapy of solid tumor growth[J]. Computational Matheatics and Mathematical Physics,2008,48(6):892-911.
2017- 03- 06
*广东省科技计划项目(编号:2014A020212713)
张晋昕,男,医学博士,副教授,中山大学公共卫生学院医学统计与流行病学系主任。1989年本科毕业于天津大学,1997年、2000年先后在山西医科大学、第四军医大学获流行病与卫生统计学专业硕士、博士学位,2003年在中山大学公共卫生学院完成博士后研究,留校任教至今。现为中山大学临床试验中心建设领导小组成员,广东省抗癌协会肿瘤流行病学专业委员会常务委员,广东省医学会循证医学分会委员,广东省突发事件应急管理专家,广东省生产安全事故应急预案评审专家,中国卫生信息学会医学统计教育专业委员会委员,中国中西医结合委员会时间医学分会委员,国际生存质量研究学会会员。参编教材、专著20余本,发表学术论文200余篇,主持或参与30余项各级各类课题,获省部级科研或教学奖励5次。国家精品课程、国家双语示范课程、教育部来华留学生品牌课程、国家级资源共享课、爱课程网MOOCs课程、广东省远程教育精品课程、广东省精品视频公开课《医学统计学》主讲教师之一;广东省优秀教学团队成员。国家自然科学基金、广东省自然科学基金函审专家,《中国卫生统计》、《中华预防医学杂志》、《中国医院统计》等10余本学术期刊的编委或审稿专家。研究方向为统计学方法及其医学应用,主要在医学科研设计、疾病流行预测建模、多因素统计方法等领域开展系列研究。已培养硕士研究生55名。
R730.1
A
10.3969/j.issn.1674- 0904.2017.02.001