结直肠癌筛查方法研究进展*
2020-01-01邱智宇综述李济宾审校
邱智宇 综述,李济宾 审校
510060 广州,中山大学肿瘤防治中心 肝脏外科(邱智宇), 临床研究部(李济宾)
结直肠癌是常见的消化系统恶性肿瘤。2018年国际癌症研究组织报道,全球新发结直肠癌患者约180万例,死亡人数约86.1万[1]。我国是结直肠癌高发国家,发病率和死亡率分别位居所有癌种第4位和第5位[2]。因此,结直肠癌的筛查与防治已成为我国当前面临的重大公共卫生问题。
近20年来,得益于结肠镜筛查的普及与避免高危因素的暴露,发达国家结直肠癌发病率和死亡率呈显著下降趋势[3]。但对于发展中国家而言,由于肠镜筛查成本高、专业医生短缺等原因,全面开展肠镜筛查并不现实。以我国上海为例,在结直肠癌初筛阳性的受检者中,仅有47.01%选择接受进一步的肠镜检查[4]。近几年,医学研究者针对结直肠癌筛查、肿瘤标志物、风险预测模型及数据挖掘方面开展了系列的探索性研究,本文就现行筛查方法与策略、筛查预测模型、肿瘤标志物组合的研究进展,以及联合数据挖掘技术的应用前景进行系统综述。
1 现行结直肠癌筛查方法
目前,国内外常用的结直肠癌筛查策略以粪便潜血试验(fecal occult blood test,FOBT)为初筛方法,辅以结肠镜或CT等检查手段。为减少患者的负担,指南一般推荐采用序贯筛查方法,即在愈创木脂潜血试验(guaiac FOBT,gFOBT)或粪便免疫化学实验(fecal immunochemical test,FIT)等测试结果阳性的基础上,建议受检查者进行内镜检查。近年来,随着研究的进一步深入,多种基于崭新思路的检验方法陆续出现,部分方法在国外甚至已获批进入临床使用,详见表1。
表1 现行结直肠癌筛查方法一览
Table 1. Current Screening Methods for CRC
Screening methodAdvantageDisadvantageEfficacy[5]High risk factor assess-ment questionnaire[6]Simple and easy accessibility;Wide cov-erageThe positive predictive value is low;It is not recommended to use it alone.Not reportedFOBT(gFBOT and FIT)Easy to conduct;Suitable for countries with insufficient colonoscopy equipment and low accept-ance of endoscopyEasily affected by diet and other fac-tors, leading to false negative/ positive results32% lower modality of CRCEndoscopy Colonoscopy[7]Gold standard which can be used to di-rectly observe the whole process of co-lon and rectum and remove polyps for pathological examinationsBowel prep is needed;Risk of intestinal perforation; Low acceptance68% lower modality of CRC Flexible sigmoidoscopy[8]Easier to conduct, shorter time, lower risk and higher acceptance; Can be used as a substitute to some ex-tent when performing the whole course of colonoscopy is impossibleCan only be used for detecting the dis-tal part of spleen flexure; Lesions in the proximal colon are easily missed; Lower efficacy than colonoscopy26%-31% lower modali-ty of CRC Capsule endoscopy[9]Fewer complications (such as intestinal perforation) than colonoscopy and flex-ible sigmoidoscopyShort working time of battery; Can only reach the ileocecum; Higher cost and lower sensitivity than colonoscopyNot reportedCT colonography[8]Suitable for people who cannot tolerate endoscopyLesions cannot be resected; Radioactive exposure; Risk of extra colon lesions, causing ad-ditional medical expensesSimilar to endoscopy for polyps≥10 mm; Inferior to endoscopy for polyps<10 mm Fecal DNA test (FIT-DNA)[10]Higher sensitivity than FITLower specificity than FITNot reportedCirculating DNA test (SEPTIN9)[11]Easy to conduct;Only blood samples are neededLower sensitivity than FOBT, FIT and colonoscopyNot reported
CRC: Colorectal cancer; FOBT: Fecal occult blood test; gFOBT: Guaiac fecal occult blood test; FIT: Fecal immunochemical test.
2 结直肠癌筛查策略
结直肠癌筛查是一个完整的鉴别诊断过程,包括筛查对象、筛查年龄、筛查方法和筛查间隔等。除筛查方法外,世界各国在其余几个方面所实施的具体策略亦不近相同。
2.1 筛查对象
以美国的结直肠癌筛查指南(US preventive services task force recommendation statement,USPSTF)为代表,目前达成国际共识的筛查对象是处于一般风险下的无症状人群;对于有结直肠癌或增加结直肠癌患病风险的遗传病(比如Lynch综合征或家族性多发结肠息肉)家族史,以及有炎症性肠炎、腺瘤样息肉、结直肠癌等既往史的高危人群,则需要考虑提前接受筛查[12]。
2.2 筛查年龄
对于一般风险人群而言,包括我国在内的绝大多数国家都选择了50~74岁或75岁作为筛查年龄。如果将筛查起始年龄提前至45岁,可增加每一千人的获得生命年(life-years gained,LYG;衡量筛查收益的常用指标),且能将结肠镜的筛查间隔从10年延长至15年,从而部分抵消每一千人的终身结肠镜检查次数(lifetime number of colonoscopies,No.CSY;衡量筛查负担的常用指标),使LYG和No.CSY达到更好的平衡。但这种策略所增加的LYG其实并不可观,且会增加个人的卫生经济负担以及内镜检查带来的风险,故没有被USPSTF推荐。虽然76~85岁人群接受筛查的收益大为降低,但个体若合并其他疾病,可在医生建议下继续接受筛查;对于85岁以上人群,尚无足够证据表明他们能从筛查中获益。对于高危人群而言,筛查年龄可一定程度地提前:如果待检查者有1位在60岁前患结直肠癌的一级亲属,或2位以上在任意年龄段患结直肠癌的一级亲属,起始年龄应提前至40岁或亲属患癌年龄的10年以前[12]。先前未接受过筛查的高危人群在80岁后仍能从筛查中获益[13]。
2.3 筛查间隔
USPSTF指出,以下4种不同间隔的筛查策略在增加LYG方面无显著差别:(1)每年1次FIT;(2)每年1次FIT 联合10年1次FS(已有研究表明FS联合FIT在减少死亡率方面优于单用FS[14]);(3)10年1次结肠镜检查;(4)5年1次CT检查。对于新近出现的FIT-DNA联合法,指南推荐的间隔为3年1次,但其筛查效果仍存在争议,尚未明确相较上述4种策略而言是否具有可比性[12]。
3 结直肠癌风险预测模型
流行病学研究已找到多个与结直肠癌发生相关的因素,除社会人口学因素外,主要可分为遗传因素(结直肠癌及相关疾病的家族史或既往史、基因位点等)和环境因素(饮食习惯、吸烟、基础疾病等)两类[15]。在此基础上,国内外的研究者建立了多种包含不同类型因素的风险预测模型。表2列举了主要的肠癌风险预测模型,需要注意的是,基于风险预测模型的筛查策略目前仍处在研究阶段,多数模型并未在临床得到验证。
表2 国内外主要预测模型一览
Table 2. Common Predictive Models at Home and Abroad
ModelCountries/regionsFactors includedPredictive value(AUC/C statistics)Ma[16]JapanAge, BMI, physical activity, smoking, alcoholC statistics: 0.64APCS[17]Asian-Pacific coun-tries and regionsAge, gender, family history of CRC, smokingNot reportedAdelstein[18]AustraliaAge, symptom (bloody stool, mucus stool and fatigue)AUC: 0.83 (CRC); 0.70 (advanced adenoma); 0.67 (non advanced adenoma)Wang[19]China16 single nucleotide polymorphism sitesAUC: 0.72Tao[20]GermanyAge, gender, smoking, history of CRC in first-degree rela-tives, alcohol, history of polyps, red meat consumption, histo-ry of NSAIDs or colonoscopyAUC: 0.68Shin[21]KoreaMale: age, height, BMI, fasting blood glucose, serum total cholesterol, family history of cancer, alcohol consumption, meat consumption;Female: age, height, family history of cancer, fasting blood glucose, meat consumptionC statistics: male 0.78; female 0.73Li[22]ChinaAge, gender, smoking, alcohol, 7 single nucleotide polymor-phism sitesAUC: 0.59
AUC: Area under the curve; BMI: Body mass index; APCS: Asia-Pacific Colorectal Screening; CRC: Colorectal cancer; NSAIDs: Nonsteroidal antiinflammatory drugs.
研究者期望将优秀的筛查模型用于结直肠癌的筛查策略中,从而提高现行筛查策略的卫生经济学效果。有研究指出,结合流行病学危险因素的预测模型能进一步提高“gFOBT/FIT—结肠镜序贯筛查策略”的筛查能力[23-24],但目前已有的模型并未纳入足够的结直肠癌预警症状。一项关于预警症状组合的研究表明,阳性预测值最高的组合为贫血与腹壁紧张(>10%),其它表现较优的组合还有腹痛与贫血(6.9%),以及腹壁紧张和体重下降(7.4%)[25],但这些症状并未被纳入现有的预测模型。此外,充分纳入遗传因素,也有望进一步提升现有模型的预测能力。
4 肿瘤标志物
肿瘤标志物是另一类备受关注的筛查方法。目前,研究者已在血液、粪便、尿液等标本中发现了多种具有潜在筛查价值的结直肠癌标志物。
4.1 血液标志物
4.1.1 DNA DNA类肿瘤标志物可以进一步分为三个亚类:(1)细胞游离DNA(cell free DNA,cfDNA),即由于疾病、治疗等原因从细胞中释放到外周血中的DNA,通常不包括循环肿瘤DNA(circulating tumor DNA,ctDNA)。Gallardo-Gómez等[26]借助微阵列技术比较结直肠癌患者与健康人群的cfDNA后,发现二者的甲基化位点存在显著差异;Molparia等[27]则直接从拷贝数变异(copy number variants,CNV)入手,发现cfDNA中>100mb的CNV同样能预测结直肠癌的发生;(2)异常甲基化DNA,其中最具代表性的便是甲基化septin9(SEPT9)基因,目前已有多款筛查工具(如Epi’s proColon®、ColoVantage®等)投入临床应用。除SEPT9外,其他正在研究中的甲基化DNA还有runt转录相关因子-3、速激肽-1、眼缺失蛋白同源物4和生长抑素等,但均停留于试验阶段[28];(3)ctDNA,ctDNA与cfDNA一同被视作“液体活检”技术的代表,当前研究的主要靶点包括KRAS、APC和TP53等基因[29]。2018年的一项研究表明,甲基化APC2有望成为中国结直肠癌人群的新标志物[30]。但ctDNA在临床应用中仍面临着假阳/阴性率高、缺乏标准等问题,其用于结直肠癌筛查的效果具体如何,还有待更深入的研究。
4.1.2 非编码RNA 结直肠癌细胞中存在着多种调控癌细胞生物学行为的非编码RNA(non-coding RNA,ncRNA)。迄今为止,国内外已发现了超过50种能作为筛查标志物的ncRNA或组合;然而,在较大样本(人数≥100)的试验中表现出不逊色于FIT的筛查效果(敏感度≥79%,特异度≥94%)的ncRNA仅有miR-139-3p一种[31]。最近Mai等[32]又揭示出,一种与Piwi蛋白相互作用的pi-RNA54365在结直肠癌组织中呈现出高表达。这种可能促进癌细胞增殖的小分子RNA不仅能在患者血清中得以检测,且表达水平与患者的预后呈负相关。
4.1.3 可溶性蛋白 可溶性蛋白种的代表性分子有癌胚抗原、CA19-9、胰岛素样生长因子结合蛋白2、C反应蛋白、Dickkopf3、PKM2和甲基化FOXE1等。由于目前并没有找到一个结直肠癌专属的可溶性蛋白分子标志物,故新的研究思路是将多种蛋白质标志物联合用于肿瘤的筛查,继而产生了各类标志物组合(表3)。
表3 新近出现的结直肠癌蛋白质标志物组合一览
Table 3. New Protein Marker Combinations of CRC
Biomarker combinationSensitivitySpecificityAUCGDF15, amphiregulin, FasL, Flt3L, TP53[33]CRC: 56.4%;Advanced adenoma: 22.0%90%CRC: 0.82;Advanced adenoma: 0.60BAG4, IL6ST, VWF, EGFR, CD44[34]62.3%-73.3%90%0.79-0.87Combination of nucleosomes[35]Clinical stage I: 72%;Clinical stage II: 86%90%0.97Antitumor antibodies: anti-TP53, anti-IMPDH2, anti-MDM2, anti-MAGEA4[36]26%90%Not reportedCEA, GDF15, anti-p53[37]54%98%Not reported
CRC: Colorectal cancer; AUC: Area under the curve; VWF: von Willebrand factor; EGFR: Epidermal growth factor receptor; CEA: Carcinoembryonic antigen.
4.2 粪便标志物
结直肠癌患者的粪便中可检测到从病灶脱落的肿瘤细胞,而它们所携带的突变基因(突变KRAS、APC、TP53、微卫星不稳定性相关基因等)亦可作为肿瘤筛查的目标靶点[38]。表1提及的粪便基因检测工具,便是最新一代的多靶点粪便筛查工具Cologuard®,其检测的基因位点包括突变KRAS、BMP3和NDGR4。此外亦有报道,联合甲基化TWIST1检测和FIT对进展期腺瘤筛查的敏感度可上升至82.4%[39],表明这项技术的筛查效果还有更进一步的提升空间。
肠道菌群也是影响结直肠癌变的重要因素之一。一项2017年的研究表明,微小微单胞菌(Parvimonasmicra)和抗口臭致病菌(Solobacteriummoorei)这两种细菌与结直肠癌的发生存在显著的相关性。经过进一步的外部验证,研究者筛选出了4种在不同国家结直肠癌患者的粪便标本中稳定存在的微生物基因。这些结果提示,特定菌群及相关的基因有望成为新一类的结直肠癌筛查标志物[40]。
4.3 尿液标志物
尿液具有易于采集、较少受到蛋白质与微生物干扰、含有代谢产物等优点,故同样被视作是寻找结直肠癌标志物的理想标本。迄今为止报道的尿液标志物主要包含:(1)尿蛋白,如组织因子、Cyr61、TFF3等;(2)尿DNA,如甲基化VIM、甲基化WIF1、甲基化NDGR4等;(3)代谢产物及其组合,如二乙酰精胺和犬尿氨酸等;(4)前列腺素与活性氧[41]。尽管部分尿液标志物已在试验中表现出优异的筛查效果,但目前的临床证据尚不足以支持它们投入临床应用。
5 数据挖掘在肿瘤筛查中的潜在价值
近年来,不少思路开阔的研究者将目光投向数据挖掘,期望能将这一项新兴技术应用于临床工作,为临床决策提供更有力的支持。数据挖掘是一种以统计分析为基础,从大量的模糊信息中寻找出有价值的知识的技术,包括人工神经网络、Bayes判别分析和决策树等方法。迄今为止,数据挖掘已在肿瘤诊治这一领域取得了可观的成绩。表4汇总了应用数据挖掘技术建立的结直肠癌标志物组合模型。综合来看,标志物组合的筛查效果较单个蛋白标志物表现优异。可以设想,如果在现行的筛查策略中纳入标志物组合,有望进一步提升筛查的准确性。
表4 基于数据挖掘技术建立的结直肠癌标志物组合一览
Table 4. Marker Combinations of Colorectal Cancer Based on Data Mining
Biomarker combinationData mining methodSpecificitySensitivityPositive predictive rate/accuracyCEA, CA19-9, CA24-2, CY21-1, CA72-4[42]Neural networks95%83%Positive predictive rate: 95%CEA, AFP, CA50, CA12-5, CA19-9, CA24-2, CA72-4[43]Neural networks96.4%91.4%Accuracy: 93.9%CEA, CA72-4, 4 chosen protein biomarkers[44]Neural networks96.7%92.3%Not reportedCEA, CA19-9, CA72-4, CY21-1[45]Neural networks87.01%80.03%Accuracy: 81.77%CEA, CA72-4, CA24-2, CA15-3, HSP60[46]Machine learningNo dataNo dataAccuracy: 62.5%-91.3%
CEA: Carcinoembryonic antigen; AFP: Alpha-fetoprotein.
类似于蛋白标志物组合,孟潘庆等[47]结合神经网络和组织芯片技术建立了一种原位杂交诊断模型(包含ST13、Bcl-2、Survivin与HSF1 mRNA四种指标)。刘皛等[48]则将决策树分类方法运用于激光诱导自体荧光技术,开发出一套可辨别癌变组织的早癌诊断系统。总而言之,数据挖据技术在结直肠癌筛查方面的应用才刚刚起步。如果将这一技术的应用扩大到对各种筛查方法进行整合与训练,建立一个更完备的筛查模型,有望革新现行的筛查策略。
6 讨 论
我国的结直肠癌筛查工作尚属起步阶段,但国家对肿瘤筛查高度重视,2005年启动了包括结直肠癌在内的农村癌症早诊早治项目,涵盖全国的10余省份;2012年启动了国家重大公共卫生服务项目——城市癌症早诊早治项目,涉及我国城市高发的五大肿瘤(肺癌、乳腺癌、肝癌、上消化道癌和结直肠癌),扩展至全国16省份的20余城市。目前,我国尚未建立起全国性的筛查系统,急需一套易于操作且符合卫生经济学的筛查策略。现行的筛查策略采用高危因素风险评估问卷或FOBT作为初筛方法,但前者没有纳入足够的危险因素(包括流行病学因素、预警症状和遗传因素等),筛查效能较低;而后者针对的主要是一般风险人群,难以指引高危人群接受进一步的检查。因此,我国的结直肠癌筛查策略在提高受检者依从性和平衡收益与负担方面仍有较大的改善空间。风险评分、肿瘤标志物的研究进展,以及数据挖掘技术的跨学科应用,为新策略的制定提供了更广阔的思路。因此,充分利用医学大数据、数据挖掘和人工智能技术,建立更加精确的肿瘤筛查预测模型,预期可以提高结直肠癌筛查的早诊率,获得更高的成本效益。
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。