2016年四川省以医院为基础的恶性肿瘤发病情况分析*
2022-08-01刘潇霞乔良罗玉英马婧李丽娜李博钟志刚许佳豪张文彬
刘潇霞,乔良,罗玉英,马婧,李丽娜,李博,钟志刚,许佳豪,张文彬
610041 成都,四川省肿瘤医院·研究所,四川省癌症防治中心,电子科技大学医学院 预防部(刘潇霞、乔良、马婧、李丽娜、李博、钟志刚、许佳豪、张文彬);610041成都,四川省卫生健康信息中心 统计分析部(罗玉英)
恶性肿瘤严重影响公民健康,给人类健康和社会发展带来沉重的负担。世界卫生组织国际癌症研究机构(International Agency for Research on Cancer,IARC)发布的2020年全球最新癌症负担数据显示,2020年全球预估新发癌症患者1 929万例,约996万人死于癌症, 全球癌症疾病负担在近年来呈持续上升趋势[1]。在我国,恶性肿瘤依然是危害我国居民健康的重大健康问题,国家癌症中心最新数据显示,2016年中国恶性肿瘤发病率为291.13/10万(世标率为183.31/10万)、死亡率为177.05/10万(世标率为104.50/10万)[2]。2018年四川省肿瘤防治状况报告显示,通过四川省部分县区肿瘤登记数据预估2016年四川省恶性肿瘤粗发病率为255.68/10万(男性306.55/10万、女性202.28/10万)[3]。大数据时代背景下,卫生行政决策更加注重准确性和时效性,为此在人群肿瘤登记基础上,四川省充分发挥大数据资源优势,整合全省病案首页,探索开展以医院为基础的肿瘤发病监测数据采集,搭建四川省医院为基础的肿瘤随访登记大数据服务平台,本文对基于平台获得的2016年四川省肿瘤发病数据进行统计分析,首次全面呈现大数据共享模式下四川省以医院为基础,覆盖全省全人群的恶性肿瘤流行状况,及时、全面、准确呈现全省癌症发病全貌,助力政府决策。
1 资料与方法
1.1 数据来源
1.1.1 数据来源 由四川省卫生健康大数据信息中心管理下的“四川省卫生统计和病案首页”数据库,按月采集全省具有住院医疗服务的医疗机构的全部病案首页数据并进行质控。借助该数据库的具备肿瘤相关诊断的病案首页数据,搭建四川省以医院为基础的肿瘤监测平台,即“四川省肿瘤随访登记大数据服务平台”(后简称“平台”),采集2015年起全省6 848家医疗机构(其中二级及以上医疗机构采集率达99%以上)上报的800余万份肿瘤患者病案首页信息,包括患者基本信息、诊断信息、诊疗日期、病理诊断等。人口数据使用2016年四川省以县区为单位的年龄别户籍人口数据,来源于《四川省卫生统计年鉴》。
1.1.2 研究对象 本文就平台中2016年内确诊(首次诊断时间在2016年1月1日至2016年12月31日期间)的全部肿瘤患者病案首页信息进行统计分析,基于医疗机构诊疗数据呈现四川省2016年肿瘤发病情况。
1.2 质量控制
1.2.1 病案首页质量控制 按照四川省中西医病案首页考核标准对各级各类医疗机构上报的全部病案首页信息的完整性、逻辑性、时效性及编码准确性等进行质控,质量缺陷者由上报医疗机构核实修正[4- 5]。
1.2.2 平台数据质量控制 上述经质控的病案首页信息在平台中按个人唯一身份标识进行精准个案整合,对个人唯一身份标识不明确记录辅以多条件匹配、合并,同时根据内设逻辑判定并重新生成每一个案的确诊日期、所患癌种、肿瘤形态学等信息。
1.2.3 质控结果 四川省医院为基础的肿瘤随访登记大数据服务平台采集2016年确诊恶性肿瘤患者共计295 738例,其中四川省户籍新确诊恶性肿瘤个案241 491例。四川省户籍个案中身份证号缺失共计21 307例,占当年全部个案比例的8.82%,户籍详细县区地址缺失(仅记录四川省户籍)6 559例,占当年全部个案比例2.72%。对上述身份证号缺失患者采用姓名、出生日期等核心信息联合查重并进行合并,身份证号缺失且未匹配到高度疑似重复信息者按单一个案处理,以上个案全部纳入分析。户籍所在县区信息不详个案(仅记录四川省户籍)纳入全省发病统计。
1.3 统计学方法
1.3.1 统计对象 按照《中国肿瘤登记工作指导手册(2016)》中肿瘤登记对象的定义[6- 7],将首次发生的恶性肿瘤及中枢神经系统良性肿瘤患者纳入,作为统计对象(ICD- 10编码为C00-C97,D32-D33,D42-D43,D45-D47)。
1.3.2 数据处理 使用患者身份证号作为唯一识别标识,整合同一患者多次就诊记录;按照肿瘤登记原发肿瘤的确定原则制定平台数据处理及逻辑判定规则,从而确定每一位癌症患者的原发癌种、形态学、确诊时间等信息,可实现多原发肿瘤分别记录,对继发肿瘤追溯原发部位等目标,对所有诊断记录均无法确定原发部位的患者,癌种定义为“原发部位不明”。
1.3.3 统计指标及方法 计算不同性别、不同城乡地区恶性肿瘤的粗发病率、年龄别发病率、标化发病率以及恶性肿瘤发病顺位、构成比等。人口数据使用四川省2016年县区为单位的户籍人口数,中国人口标准化率(简称中标率)采用2000年人口普查标准人口年龄构成进行计算[8- 9]。数据处理采用SPSS 22.0软件。
2 结 果
2.1 基本情况
四川省肿瘤随访登记大数据服务平台最终采集全省2015以来质控合格的肿瘤患者病案首页共计8 282 254份,其中6 971 019份为四川省户籍患者,覆盖全省21个市州、183个县区的9 100余万户籍人口,省内县区全域覆盖。
2016年四川省年中户籍人口数为9 119.54万,其中包括男性4 688.17万人,女性4 431.37万人,城市3 468.50万人,农村5 651.04万人。
2.2 恶性肿瘤发病情况
以医院为基础的四川省肿瘤发病监测数据显示,2016年四川省新发恶性肿瘤241 491例(男性141 705例,女性99 732例),其中107 377例分布在城市地区,占44.46%;127 555例在农村地区,占52.82%(6 559例患者详细户籍县区信息不明,占2.72%)。恶性肿瘤发病粗率为277.40/10万(男性315.16/10万,女性236.94/10万),中标发病率为179.57/10万。城市地区发病粗率为322.98/10万(男性369.72/10万,女性274.83/10万),中标发病率为195.50/10万;农村地区发病粗率为237.05/10万(男性268.85/10万,女性202.13/10万),中标发病率为160.68/10万。
四川省恶性肿瘤发病率男性高于女性,城市高于农村,调整人口结构后,不同性别、城乡地区间发病率差距减小,但依然呈现男性高于女性,城市高于农村的趋势(表1)。
表1 2016年四川省以医院为基础的肿瘤监测全部癌症发病率
2.3 恶性肿瘤年龄别发病分布
基于四川省以医院为基础的肿瘤发病监测数据显示,四川地区30岁以下人群恶性肿瘤发病处于较低水平,30~49岁之间有缓慢上升趋势,50岁以下人群男女发病率差异不大,女性略高,50岁以后,发病率呈快速上升趋势,且男性发病明显高于女性, 80岁后有所下降。在城乡地区间,男、女性年龄别发病趋势基本相似,城市地区各年龄段发病率高于农村地区相应年龄段人群,在50岁以上群体中,城市地区发病率上升速度更快(图1)
图1 2016年四川省以医院为基础的肿瘤监测癌症年龄别发病率
2.4 恶性肿瘤发病顺位
以医院为基础的肿瘤发病监测数据显示,2016年四川省恶性肿瘤发病首位为肺癌(44 040例),其次为结直肠癌(24 789例)、食管癌(22 561例)、肝癌(21 430例)、女性乳腺癌(10 104例)、胃癌(18 693例)、子宫颈癌(7 719例)、白血病(15 613例)、前列腺癌(4 879例)和脑肿瘤(9 311例),前10位恶性肿瘤占全部恶性肿瘤发病的74.18%。肺癌(30 403例)位居男性发病顺位首位,其次为食管癌(17 794例)、肝癌(16 461例)、结直肠癌(15 011例)、胃癌(13 719例)、白血病(6 452例)、前列腺癌(4 879例)、淋巴瘤(4 675例)、脑肿瘤(3 969例)和膀胱癌(3 636例),前10位恶性肿瘤占全部恶性肿瘤发病的82.73%。女性人群中,肺癌(13 625例)依然位居发病首位 ,其次是女性乳腺癌(10 104例)、结直肠癌(9 773例)、白血病(9 155例)、子宫颈癌(7 719例)、脑肿瘤(5 340例)、胃癌(4 968例)、肝癌(4 964例)、食管癌(4 761例)和子宫癌(4 249例),前10位恶性肿瘤占全部恶性肿瘤发病的74.88%。
城市地区发病位居前5的恶性肿瘤依次为肺癌(20 281例)、结直肠癌(12 004例)、女性乳腺癌(5 124例)、肝癌(8 611例)和食管癌(8 066例),前10位恶性肿瘤发病占比为72.43%;男性发病前5的恶性肿瘤依次为肺癌(13 870例)、结直肠癌(7 257例)、食管癌(6 743例)、肝癌(6 550例)、胃癌(5 420例),前10位恶性肿瘤发病占比为81.76%;女性发病前5的恶性肿瘤依次为肺癌(6 405例)、女性乳腺癌(5 124例)、结直肠癌(4 745例)、子宫颈癌(3 589例)、白血病(3 143例),前10位恶性肿瘤发病占比为74.03%。
农村地区发病位居前5的恶性肿瘤依次为肺癌(22 488例)、食管癌(13 996例)、肝癌(12 278例)、结直肠癌(12 054例)、胃癌(10 814例),前10位恶性肿瘤发病占比为75.81%;男性发病前5的恶性肿瘤依次为肺癌(15 696例)、食管癌(10 663例)、肝癌(9 533例)、胃癌(7 966例)和结直肠癌(7 315例),前10位恶性肿瘤发病占比为83.59%;女性发病前5的恶性肿瘤依次为肺癌(6 786例)、白血病(5 840例)、结直肠癌(4 736例)、女性乳腺癌(4 705例)和子宫颈癌(3 994例),前10位恶性肿瘤发病占比为76.58%(表2,图2)。
表2 2016年四川省以医院为基础的肿瘤监测前10位癌症发病率
图2 2016年四川省以医院为基础的肿瘤监测前10位癌症发病构成比
3 讨 论
3.1 医院为基础的肿瘤发病监测优势与局限
3.1.1 优势——全省全域覆盖,准确性、时效性高 由于肿瘤性疾病在诊断、治疗、预后等方面的特殊性,疾病的确诊大多需要依赖医疗机构病理诊断,患者规范化治疗需要通过住院实现,疾病治疗结束后亦存在复发转移而再次住院治疗等风险,以医院为基础的肿瘤发病监测数据非抽样数据,其汇聚、整合了省域内各级各类医疗机构病案首页数据(共计6 848家),二级及以上医疗机构覆盖率超过99%,基本涵盖了医疗机构确诊的全部恶性肿瘤个案,摆脱了传统的依靠部分县区人工登记发病个案而出现的人为误差、漏报错报、重复登记等局限,可呈现四川省医院为基础的恶性肿瘤发病情况,全面、实时反映了四川省恶性肿瘤的新发病例情况,具备省级代表性[1,5,10]。同时,病案首页是具备法律效力的医学病案文书资料,诊断确切、争议最小,加之现今医疗机构信息化程度日渐完善,患者身份信息自动化识别,使得患者身份识别、整合具备更高的准确、可靠性。在数据时效性方面,医院为基础的肿瘤发病监测平台对接的病案首页数据可定期(每月/季度/年)自动追加新记录、实时整合、更新数据库,缩短了数据收集和整理的时间周期,年初即可获取上一年度的新发病例数据,解决了肿瘤发病数据滞后问题,有助于提高数据决策支持的时效性[1,10- 11]。
3.1.2 局限性——患者省际间异地就诊信息孤岛有待进一步打通 四川省以医院为基础的肿瘤发病监测大数据汇集了全省肿瘤相关的住院病案首页信息,打破了省内信息孤岛,实现数据高效整合,但依然存在省内户籍患者跨省就医后,信息无法及时采集的局限性,为此,我们拟通过患者治疗结束后返回户籍地住院康复治疗信息倒推随访、促进省级肿瘤登记信息交换两种方式并行并举的方法逐步解决这一局限性。
3.2 四川省癌谱特征分析
以医院为基础的肿瘤发病监测结果显示,四川省2016年恶性肿瘤发病男性高于女性,城市高于农村,调整人口年龄结构差异后其发病趋势不变,男性、女性之间,城市、农村之间发病顺位有所不同。肺癌在各类人群中均位居恶性肿瘤发病第一。除肺癌外,男性以消化道恶性肿瘤为主;女性则以乳腺癌、宫颈癌结直肠恶性肿瘤为主,消化道恶性肿瘤发病整体低于男性;城市地区癌症发病倾向与生活方式相关的癌症,以女性乳腺癌和结直肠癌为常见,农村地区癌症发病则更多与感染相关,以肝癌、食管癌等为常见。
IARC对全世界癌症负担数据进行分析时提出,恶性肿瘤的发病水平存在地区差异,经济发达可能是促使一些恶性肿瘤发病率升高的一大因素。经济发达地区高发癌症(结直肠癌、肺癌、女性乳腺癌、前列腺癌等)多与不良生活方式相关,与感染、落后生活方式相关的癌症(宫颈癌、肝癌、胃癌、食管癌等)更多见于经济欠佳地区[5,12- 13]。以医院为基础的肿瘤监测数据显示,四川省肺癌、结直肠癌、肝癌、胃癌和食管癌及女性乳腺癌发病构成占比较大,尤其男性肺癌发病率处于较高水平,并呈现女性乳腺癌、结直肠癌在城市地区较普遍,肝癌、食管癌在农村地区发病占比更大的特征。我省地处中国西部,近十几年快速城镇化发展,经济快速增长,人们生活水平提高,生活方式改变(烟草消费、辛辣饮食、运动不足、使用雌激素等),同时经济欠发达的农村地域广泛,当地居民依然保留一些落后生活方式、传统习俗、不良卫生习惯等,地域发展不均衡,导致我省癌谱呈现以胃癌、食管癌为代表的“穷癌”、以肺癌、结直肠癌和女性乳腺癌为代表的“富癌”并存格局[14],癌谱复杂性增加,整体防治形势严峻。因此,现阶段我省仍要以加强居民癌症防控知识宣教、优化环境、改善不良生活方式,普及疫苗接种、消除感染因素、提高居民筛查意识的综合策略作为癌症防治重点策略[5]。
3.3 人群为基础的肿瘤登记与医院为基础的肿瘤监测互为补充
根据四川省最新发布的人群肿瘤登记数据显示:2016年四川省人群肿瘤登记预估全年恶性肿瘤粗发病率为255.68/10万(男性306.55/10万、女性202.28/10万)[3];40岁以下人群,肿瘤发病率较低,发病率随年龄增长而增高,55岁及以上人群发病率随年龄呈快速上升趋势[3];45岁以下人群发病率性别差异不明显,50岁及以上人群男性明显高于女性[3];肺癌发病顺位位居第一,其次为肝癌、结直肠癌、胃癌和食管癌,男性发病前5位恶性肿瘤依次是肺癌、肝癌、食管癌、胃癌和结直肠肛门癌,女性发病前5位恶性肿瘤为肺癌、乳腺癌、结直肠癌、肝癌和胃癌[3]。该以医院为基础的肿瘤发病监测结果在总体癌症发病率、发病年龄趋势及分性别发病趋势方面与我省人群肿瘤登记地区抽样数据调查结果整体水平及趋势相似、稳定,但在个别癌种发病顺位上与人群肿瘤监测结果存在差异。具体原因分析如下:
人群肿瘤登记和医院为基础的肿瘤监测在信息覆盖范围、来源渠道、整理方式等方面存在较大差异,各有优劣[5,15]。人群肿瘤登记数据来源于全省19个县区的抽样数据,全省人口覆盖率为10.24%,登记信息来源于医疗机构住院和门诊自主报告发病、基层院外收集和死亡报告补充发病等渠道,多渠道上报信息通过人工整理后统一上报;医院为基础的发病数据来源于全省6 848所医疗机构住院病案资料,覆盖全省183个县区,全省户籍人口覆盖率达到100%,数据囊括了绝大部分精准诊断的恶性肿瘤患者,但仍存在极少数门诊诊断后未经任何治疗的患者漏报,二者存在互补性。再者,2016年医院为基础的监测数据存在极个别癌种发病率与人群监测数据差异较大(女性白血病),考虑到白血病的诊断编码是ICD- 10和ICD-O- 3两套编码系统中存在较大差异的病种,提示在今后监测数据质控方面应重点关注该类病种编码及归类的准确性。
恶性肿瘤的精准监测数据是肿瘤防治和保障人口卫生健康的基石,赫捷院士提出精准监测数据是现阶段乃至未来我国制定肿瘤防控策略、评价癌防工作效果的重要基础[16]。基于长期以来四川省人群肿瘤监测的良好工作基础,在大数据时代下,依托医院为基础的临床诊疗数据资源、融合传统人群为基础的肿瘤登记数据、借力多源数据共享,实现肿瘤监测数据实时、动态监测和精准呈现多维数据是大势所趋[10- 14,16- 19]。在此基础上,平台将进一步与人群肿瘤登记数据、死亡数据、医保数据等充分融合,形成以就医复诊、死亡数据匹配的被动随访为主,社区家庭医生主动随访为辅的“双轮随访模式”,打造基于全省全覆盖的集发病、死亡、生存为一体的精准监测,切实促进四川省肿瘤监测工作[11]。
(致谢:四川省肿瘤医院·四川省癌症防治中心对四川省卫生和计划生育信息中心·四川省健康医疗大数据中心在本项目数据收集、整理及质量控制等过程中所作的贡献表示衷心感谢!同时感谢电子科技大学·数字健康工程技术研究中心对项目设计的大力支持!)
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。