颞下颌关节紊乱病专病数据库的设计与初步构建*
2021-10-17翟孝庭黄东宗李鸿波张政波王家柱刘洪臣
翟孝庭 黄东宗 李鸿波 张政波 王 岩 王家柱 胡 敏 刘洪臣 姜 华
颞下颌关节紊乱病(temporomandibular disorders,TMD)的病因复杂、发病率高,在诊断和治疗方面存在诸多难题,亟待进一步的研究挖掘其潜在的规律。随着信息技术的进步,医疗数据出现爆炸性增长,精准医疗以及智慧医院理念的兴起促进了医学向专科专病研究的方向发展[1,2],海量的医疗数据为复杂疾病的研究提供了新的方向,用真实世界研究为临床实践提供证据及建议。大数据将在颞下颌关节紊乱病的诊治及研究中起到重要作用。但目前大数据的利用过程仍然存在着诸多困难和挑战[3],例如数据标准不一致、不同信息系统间存在着孤岛效应、数据治理和提取依赖人力等。解决信息资源浪费的问题,利用大数据为临床和科研助力,已经迫在眉睫。
1.专病数据库的构建背景
TMD 是口腔疾病的常见病,是具有相关临床症状如关节区及咀嚼肌疼痛、关节杂音、下颌运动异常的一组疾病的总称。TMD 好发于青壮年,不同年龄人群发病率在15%-50%不等,在一定程度上损害了患者正常的咀嚼功能[4,5]。TMD 的诊断主要通过详细病史问诊、口腔检查、影像学辅助诊断如计算机断层扫描(CT)、磁共振成像(MRI)、超声等手段,需综合多元的数据得出诊断。此外TMD 患者的就诊次数较多,每次治疗需一定的时间间隔进行疗效的观察评估,此后再制定后续的治疗方案。为此,患者的病历资料保存显得尤为重要,需要保证病历资料的完善。同时,医疗数据爆发式的增长导致无论是临床还是科研都需要一个数据库进行数据的收集、管理和分析,避免信息资源的浪费[3]。
TMD 早期发现及治疗可以改善疾病的发展、转归和预后[6]。有研究表明,为颞下颌关节紊乱病患者提供正确的宣教和引导,如缓解紧张、认知行为教育和自我管理等方法,可以提高患者的应对能力,有效控制疼痛症状,限制疾病的发展[7,8]。此外,早期进行保守治疗如手法按摩、针灸和咬合板等治疗方法,可以缓解患者的疼痛和关节功能受限等症状,减少髁突骨吸收的风险[8,9]。而人工智能利用大数据进行分析,可以实现疾病诊断分类、病情评估及知识普及等功能,避免患者因延误治疗时机,导致病情恶化[10]。也可以为医生提供诊断的建议并推荐治疗方案,提高TMD的临床诊疗水平。
口腔医学已经进入个性化精准医疗的时代[3]。在这个时代背景下,建立颞下颌关节紊乱病专病数据库一方面可以利用大数据分析等新技术的优势,挖掘潜在的临床规律,为疾病的研究提供方向和助力。另一方面,专病数据库在人工智能和深度学习技术的支持下,可建立临床辅助决策支持系统,不仅便于制定个性化的治疗方案,也为临床诊疗提供强有力的数据支持,从而为临床决策提供参考。目前国内外尚无TMD的专病数据库,建立专病数据库对于提高TMD的认识及研究具有重要意义。为此,本研究建立基于临床病历及影像资料的颞下颌关节紊乱病专病数据库,进行临床病历资料的整理分析,以实现疾病的智能诊断及预测、临床决策辅助等功能,以期提高TMD诊疗和研究的质量与效率。
2.专病数据库的设计与构建过程
颞下颌关节紊乱病数据库是以临床数据中心(clinical data repository, CDR)为基础,通过识别各病历之间的不同特征与类别之间的相关性进行数据集成,并运用数据清洗、标准化及去隐私化等技术进行数据治理后构建而成的。此外,该数据库拟通过语义分析、同义词字典、自然语言处理技术等数据挖掘技术,寻找TMD 患者基本信息、体征、诊断和治疗方式等数据的相关性,形成标准化的大数据信息池,为人工智能进行疾病的诊断、分类、预测和形成临床辅助决策支持系统打下基础。数据库架构如图1所示。
图1 专病数据库的架构
2.1 数据集成TMD 专病数据库的信息主要来源于CDR 中的电子病历和电子数据采集系统(Electronic Data Capture, EDC)所收集的医疗数据。EDC系统主要用于补充外部的信息,其建立过程中最重要的就是电子病例报告表(electronic case report form, eCRF)的设计。eCRF 是收集临床科研数据的载体和工具,如何实现其可复用性和合理性,是EDC 构建过程中的关键性问题[11]。本数据库根据TMD 的发病特点及检查需要进行eCRF设计,主要包括:患者的基本信息、临床信息、照片信息、影像学信息、口腔检查信息、咬合测试信息、生化报告信息、颞下颌关节情况信息、心理测试情况、诊断信息、治疗内容等模块。具体模块如表1所示。
表1 eCRF所包含的11个模块
数据库需导入的医疗数据主要以结构化与非结构化数据的形式存在于医院的HIS、PACS、LIS、RIS 中[12]。其中结构化数据包括患者人口学信息、检验结果、诊断信息、评估得分等,将这些数据进行标准化、归一化后可直接与数据库关联。
非结构化数据包括诊疗记录、影像学报告、检查情况记录等。这些非结构化形式的数据为后续实现检索、统计、分析等功能带来了困难,经过数据识别分析并进行结构化处理后,才能实现非结构化数据的深度利用。医学自然语言处理(natural language processing, NLP)工具可对自由文本这类需要后结构化的内容进行词性标注、指标识别、句子边界识别、句法分析、语义识别等处理[11,13],自由文本进行结构化预处理后即可导入数据库中。
对于图像形式的数据,本数据可拷贝存储并进行分类管理。在查阅患者病历的同时可以直观地看到患者口腔的具体情况,降低诊断的偏倚。数据库中可添加dicom 格式的影像学信息,便于医生从多维度全方位观看患者影像检查,具有较高的准确性和客观性。在观看影像时,医生可以选取几个关键截图进行标注及保存,完成TMD 特征影像图的采集,有利于人工智能对TMD 特征的学习并完成疾病的智能诊断。此外,数据库中可快速查阅该患者此前的影像图片,将影像图片进行前后对比,可评估TMD 治疗效果,也减轻患者携带大量检查资料的烦恼。数据库的信息录入界面如图2
图2 数据录入界面展示:a临床病历信息;b 口腔检查情况;c颞下颌关节相关检查信息;d影像学检查信息
2.2 数据治理 数据标准化是数据库管理规范化、统一化的必要前提,也是数据共享和分析的基础,将数据标准化后有助于提高数据库的数据挖掘能力和整合能力。本数据的标准化采用国际疾病ICD-10分类代码、临床医学术语标准(SNOMEDCT)、颞下颌关节紊乱病的DC/TMD诊断分类标准以及为TMD设计的字典表[14]。电子病历报告表的标准化改造则遵循ISO/IEC11179的方法,为上述11个模块的数据元进行命名、编码[11]。同时我们也定义了研究病历的入库规则,例如,颞下颌关节紊乱病的病种将临床检查、诊断和影像学诊断中包含“颞下颌功能紊乱”、“颞颌关节功能紊乱症”、“颞下颌关节紊乱综合征”、“TMD”、“TMJD”等多种关键词的患者筛选入库进行标准化管理。
数据清理是将数据中出现的异常值、离群值、重复数据和缺失的数据,进行纠正、形式转化、去除冗余和补充修复等处理,避免数据分析错误造成分析结果可能的偏差。目前只能采用人工核对配合统计软件分析进行数据数据质量校验,日后有望通过人工智能实现数据的自动清洗,减少临床工作量,提高数据收集整理的效率和质量。
数据安全是科研及伦理的重要内容,为保障数据的安全,本数据库采用了数据去隐私化的保护措施,进行账号权限的划分和管理[15]。数据库管理员可为每位医师建立独立的账号体系并进行授权和管理,例如使用医师管理中编辑、权限禁用以及患者数据导出等功能。普通医师用户可以使用患者管理、搜索、查看等基本功能。此外,根据健康保险携带和责任(HIPAA)法规,数据库建立了相应的脱敏规则,用3DES 加密算法保护数据的隐私及安全,对患者的姓名、电话、地址等敏感信息进行转换或做删除处理[11],采用加密算法可确保需要通过互联网传输进行多中心协作研究时,防止患者隐私数据泄露。同时普通权限用户进行数据提取与导出需经过申请和审批,加强数据管理,实现数据的集中管理和对数据操作的全流程管控。
图3 患者管理界面
2.3 数据传输及利用 数据的导出功能为数据库管理员才有的使用权限,电子病历报告表或者多位患者的数据可联合导出为Excel和Word的数据格式,方便科研工作者用SPSS、SAS、Python、R等统计分析软件进行医学统计,也方便临床医生进行病例的回顾。医师的普通用户也可以经过授权后导出整理好的数据,实现数据的共享,减少信息资源和人力资源的浪费,为日后搭建多中心专病数据平台作铺垫。
图4 医师管理界面
2.4 专病数据库基本功能 临床原始数据通过数据集成、数据治理之后形成专病数据库,实现了TMD 病历的科学化、规范化管理。可视化CRF 表单的设计实现了患者病历多维度视图的展示,医师可以调阅患者的临床信息统一视图,该视图统一展示了患者的病史、检查、诊断、治疗方案等内容,使临床医生可以通过一个清晰、友好的统一视图对患者的病情进行全面的判断。同时数据库还提供病历信息检索的工具,通过患者ID、姓名、诊断等信息进行检索,可快速定位某一患者或者某一类疾病,减少医生寻找患者信息的时间,为患者提供高效的诊疗服务。借助搜索引擎查找目标患者及病种后,可将搜索的数据导出,用于支持临床回顾性及前瞻性研究。
3.讨论与展望
颞下颌紊乱病专病数据库的价值不仅在于数据本身,更在于充分利用数据所产生的价值。目前尚无国内外TMD 数据库的相关文章。在大多数医院,颞下颌关节紊乱病的病历记录模板依附于修复科或口腔颌面外科的病历中,部分TMD 病历内容不全,检查记录不足[16,17]。李希吉[18]等设计和开发TMD 专科电子病历模板,属于数据库的简单形式,但电子病历模板目的是方便存储及查找患者信息,较难对数据背后的规律进行深度挖掘。随着对TMD 研究的深入,诊断标准及治疗理念都发生了变化,相关的检查越发重要。本数据库借鉴了DC/TMD 诊断标准,纳入了心理健康检查、咀嚼肌检查和咬合分析等项目,更加全面地为TMD 诊断提供信息。同时将病历重要的内容结构化,利于数据的深度利用。
在接收并治理患者的病历数据后,利用人工智能及深度学习技术,可进行多维度的数据分析,为疾病的早期诊断、预测预警、临床决策支持和个体化医疗提供大量真实数据的支持。目前数据库的基本框架已经构建完成,但数据的深度分析利用功能尚未完全实现。
TMD 的病因复杂,正确诊断TMD 并准确分型需要医生将患者的病史、主诉、临床检查及影像学检查等信息综合考虑,此外TMD 还与心理状况密切相关,导致漏诊或误诊较高。因此用人工智能整合患者信息,为TMD 诊断提供参考是非常有必要的。而影像学诊断对TMD 的准确诊断至关重要,正确进行口腔医学影像诊断需要经过不断的系统学习与训练。目前最为突出的问题是颞下颌关节病变CBCT 及MRI 影像的判读,部分医师在判断TMD 影像改变时常带有主观性,易出现误诊的情况[16]。全卷积神经网络(fully convolutional networks, FCN)技术取得重大的突破,使人们可以利用人工智能学习,对各种医学图像进行分割及识别,进而判断TMD 病情的进展,进行疾病的分类诊断[19]。CT 是诊断颞下颌关节骨质改变的金标准,CBCT 经过深度神经网络模型学习并识别分析后,可以有效判断出髁突形态是否正常,骨皮质是否有吸收[10]。本数据库计划对收集到的影像图片用人工标注等方式加工整理,在垂直及平行于髁突长轴斜位的CBCT 截图中,采用自适应灰度值颜色归一化、位置大小归一化等方法分别实现髁突的位置、颜色标准化。之后通过模板匹配方法或深度学习检测方法,如Faster R-CNN、R-FCN 和SSD 等,实现髁突的自动定位。在完成髁突自动化定位后采用全卷积神经网络分析,反复进行经过专家标注的正常与病变的髁突形态对比,分割病灶区域,如髁突皮质轮廓不规则改变、骨缺损和髁突头部扁平等,最终可以实现TMD 骨关节病变的诊断。同理,也在MRI 上对髁突和关节盘的相对位置用坐标轴进行标注,进而通过人工智能深度学习,最终实现自动化诊断关节盘移位[20]。此外,使用自然语言处理技术和决策树进行数据文本挖掘,可利用病史及临床检查进行TMD 症状的鉴别诊断。例如通过主诉中的词语使用频率和定量值来对TMD 与疼痛性疾病鉴别[13]。TMD 患者的病历中使用与“关节弹响”和“颞下颌关节”等相关的词语的频率明显较高,而口腔面部疼痛疾病虽然也使用“张口受限”等相关词语,但开口度明显大于TMD患者[13],以此进行疾病的鉴别诊断,但诊断结果需结合影像学检查,进一步提高诊断的特异性和灵敏性。
个性化多学科的治疗方案一直是TMD 治疗的研究热点与难点,在临床决策中很难全面把握患者的病情进行对因治疗,对不同病因的TMD 患者进行同样手段的治疗可能产生疗效上的差异。本数据库拟建立临床决策支持系统,利用人工智能从临床症状及体征、影像学诊断、咬合情况、心理评估测试和咀嚼习惯等多方面为患者进行全面分析,结合知识图谱,根据患者的病史及症状信息来推荐个性化的治疗方案。临床决策支持系统识别病历数据信息中包含的预设关键词,以知识图谱为参考,完成症状、检查和诊断与治疗方案的匹配。知识图谱是整合临床指南、治疗方案和专家经验等多种资源形成的,将专病临床知识体系进行了系统梳理,有利于进行临床症状和诊断与各治疗方案之间的关联。同时,如果疾病分类诊断完成后,临床决策支持系统可从TMD 专病数据库中筛选出与该疾病症状及诊断相似的既往病史资料。临床医生在多维度病历的视图下参考不同患者的治疗内容,选择效果较好的治疗方案。此外,专病数据库可对筛选出的这类疾病进行疗效、预后、并发症等方面的统计分析,为临床诊治这类疾病提供循证医学的证据支持,从而指导临床实践,提高医疗质量。
4.结论
由于TMD 诊治的复杂性,目前国内尚无TMD专病数据库,甚至部分医院未开展TMD 的诊疗,给TMD 患者带来了极大的不便。颞下颌关节紊乱病专病数据库提供了便捷的病历管理及数据分析平台,有助于医院开展TMD 的诊疗工作。该专病数据库目前已完成了初步的构建,实现了TMD 病历的管理和利用,正逐步积累病历形成大数据信息池。下一步TMD 专病数据库将在现有的专病数据库基础上,通过人工智能深度学习实现疾病的智能诊断功能和临床决策支持系统,满足临床诊疗、科研探索的需求。此外,在完善深度分析功能后希望能扩大数据量及数据收集范围,构建多中心的数据平台,打破数据的孤岛效应,实现数据的互联互通,避免信息资源的浪费。