大数据在中医诊断中应用的可行性及展望
2017-01-13何建成
王 利,何建成
·述 评·
大数据在中医诊断中应用的可行性及展望
王 利,何建成
大数据时代的到来对生物医学研究产生了重大影响。中医诊断是中医理论和临床研究的核心与关键。作者从大数据与中医诊断、大数据在中医诊断中应用的可行性(中医四诊客观化、中医证候标准、证候类型与实验指标关系和指导临床治疗)等方面进行概述,认为中医诊断中计量诊断及多元统计方法量化的各项指标是构成大数据的基本元素,大数据的应用是中医诊断客观化和证候标准化的推动力。
大数据;中医诊断;可行性;展望
大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,称之“巨量资料”,其基本特征为数据规模大、种类繁多、价值密度低、处理速度快[1]。大数据是“互联网时代”诞生的一个新型的技术资源,已被全球各领域熟知和应用。传统中医的认识体系较多从宏观上观察并进行诠释,如望闻问切、整体观念、辨证论治,目前诸多研究者结合现代科技的手段和方法进行中医客观化和标准化的研究。大数据时代已经到来,合理、有效地运用大数据来认识中医诊断的各个环节,是当前研究的主要任务。作者分析大数据在中医诊断中应用的可行性,并进行展望。
1 大数据与中医诊断
1.1 大数据的广泛应用及条件 由于大数据的特点及其可从巨量的数据集中挖掘出有价值的信息,因此受到了各个领域的广泛重视。一方面,指导或者引领着大众的日常生活,如消费、服务行业以及投资等;另一方面,对生命科学的贡献也是有目共睹,如基于生命科学中的基因组、转录组、蛋白质组、代谢组、表观遗传组数据等探索其中蕴含的规律,并建立多个大型国际数据共享平台,为进一步发掘生命科学的奥秘奠定基础。而大数据技术在生命科学领域的应用也给医学的发展带来了机遇[2],它可以将传统医学所提供的“碎片化”知识信息拼凑、联系起来,由此我们才有可能更深入了解生命或是疾病展示给人类的、全面的、完整的真实图景。
至于大数据应用的条件,首先是信息技术的应用和互联网的发展,借助信息化、集成化技术,建立数据共享平台;其次要同时发展交叉学科,充分利用云计算、人工智能技术等来更好地实现大数据的价值。而针对医学领域,医学术语的标准化和集成、融合技术、医学大数据表述搜索与存储访问技术,组成大数据中心和知识库构建及服务技术等[3]。
1.2 中医诊断的发展现状 中医诊断是中医认识和治疗疾病的桥梁与依据,中医诊断的客观化、标准化研究,也是发展中医、使中医走向世界的关键内容。众所周知,传统中医诊断不论是通过四诊(望闻问切)收集的症状或者体征,还是通过整体观念、辨证分析得出的证候特征、证型的诊断等方面信息,主观性较强,可重复性较差。
随着计量诊断、计算机诊断技术的发展,以及交叉学科的充分应用,中医诊断在四诊客观化、证候标准化方面取得了不小的进展。如中医舌诊、脉诊、问诊等方面均进行了计量诊断方面的研究与临床应用[4-5]。大数据时代的到来,无疑是中医诊断客观化和证候标准化发展的春天。
2 大数据在中医诊断中应用的可行性
2.1 中医四诊客观化 中医四诊客观化研究就是对四诊要素的定性和定量化研究,用客观指标量化中医四诊内容,以使得出的诊断尽可能摆脱主观因素的干扰而贴近疾病的本质[6]。随着现代科技的发展和应用,以及生物医学、色度学、计算机技术等在中医领域中的应用,使中医诊断客观化成为可能,而大数据的应用将是其发展进步的强大推动力。
我们课题组[7]通过调研收集了临床各科包括内、外、妇、儿常见病的常见症状,同时结合相关文献及医案,参考临床专家意见,总结出常见症状460个,并分为主要症状、次要症状,且每个症状又分有、无2级。采取人机问答的形式,由测试人员与患者共同进行临床检测,对1 767例临床患者进行测试,通过与专家判读对比分析,发现该系统的符合率达90%,具有良好的稳定性[8],成功建立了数字化中医问诊诊断系统。王祉等[9]运用上海中医药大学自主研发的中医舌、面、脉诊数字化检测仪及Z-box脉诊仪检测符合纳入标准的36例冠心病患者,通过软件分析获取舌、面、脉诊图像参数,包括RGB色彩空间的R(red,红色)、G(green,绿色)、B(blue,蓝色)值,以及HSV颜色空间的H(hue,色调)、S(saturation,饱和度)、V(value,明度)值。经过中药治疗后的舌诊图像参数R、G、B、H、V值呈现下降趋势,说明治疗有效,患者的舌色由深转浅,由暗转明。脉诊参数、主波上1/3高度处的宽度值与脉动周期的比值呈现下降趋势,表示患者的血管壁弹性得到了改善。
中医四诊采集技术和方法的开发以及深入研究,为运用大数据提供了基础数据支撑,经过大数据的处理和分析,反过来更好地指导四诊技术的研发,进而促进中医四诊的客观化发展,这是反复验证和学习的过程。
2.2 中医证候标准 运用现代数理统计分析方法对建立疾病基本证型的辨证标准有很大帮助,每个证候所对应的数值可构成大数据的基础数据,从而打开了中医证候与大数据结合的窗口。探索数据呈现的相关关系,是大数据的优势;对中医证候标准的问题进行定量分析等,是大数据与中医学及计算科学相结合的新的应用。其减少了偏倚,提高了证候标准研究结果的客观性和科学性。
我们课题组[10]制作了充血性心力衰竭(congestive heart failure,CHF)中医证候量表,该证候量表包括9个维度、28个症状变量,收集多中心CHF住院患者450例用于量表的信度(克朗巴赫 α系数、Kappa值)、效度评价(各条目与维度之间的相关系数、因子分析),结果显示该量表很大程度地包含了CHF常见证候的相关临床症状信息,达到临床测量的要求,可以应用到CHF患者中医证候的临床判定或者评价中。同时,我们课题组[11]应用该量表探讨CHF气虚血瘀证的中医诊断标准,多中心采集临床病历750份,综合筛选出该证候相关的条目与主、次症;应用条件概率换算方法为相关条目赋值;结合受试者工作特征曲线确定本病证的临床诊断界值,应用四分位数间距法确定证候轻中重程度;运用均值描述脑钠肽参考范围,完善其临床诊断标准。
李毅等[12]为了探究乙型肝炎后肝硬化常见证候特异性的症状指标,运用主成分分析来综合整理乙型肝炎后肝硬化各证的症状;而运用多元Logistic回归模型判别分析,筛选出乙型肝炎后肝硬化证候的主、次症状:初步得出乙型肝炎后肝硬化5种基本证型的辨证标准。
2.3 证候类型与实验指标关系 应用现代先进的实验方法与仪器,有研究者探索了中医证候类型与实验室指标的关系,通过对大数据的分析,探讨相互之间的关系,进一步探究证候的实质和生物学基础。
陈昌华等[13]临床收集27例肝血虚证患者,对每个患者的15项指标进行抽血检测,运用多因素聚类分析方法,对典型的指标进行筛选,认为血浆去甲肾上腺素、三碘甲状腺原氨酸下降以及血栓烷B2、细胞内环磷酸鸟苷、醛固酮升高可考虑为临床肝血虚证的诊断参考指标。张盛杰等[14]为建立慢性乙型肝炎(chronic hepatitis B,CHB)中医辨证规范,采用多中心、大样本的流行病学调查方法,系统规范化采集CHB患者实验室指标、生存质量量表等信息,并进行 Kappa检验,建立 SPSS数据库,结果显示CHB各证型与实验室指标及生存质量积分之间存在一定的相关性。
迄今为止,探讨中医证候类型与实验室指标关系的研究甚多,但突破性研究成果较少。如何综合、合理运用大数据,应是今后研究者思考的一个问题。2.4 指导临床治疗 通过多元分析的方法,更加客观揭示临床辨证论治的优势和特点,而结合应用大数据能让获得的基础数据更加准确和客观。其为临床治疗提供了有价值的证据。
我们课题组[11]根据CHF中医证候量表、条目赋值表以及百分制换算,确定了气虚血瘀证的临床诊断界值为52分,其中52~58分为轻证、59~70分为中等程度证候、71~100分为重证,脑钠肽参考值为209.33~316.57 pg/mL。临床研究证明该诊断标准灵敏度、特异度、准确度均较高,具有较好的临床适用性。
3 展望
计算机和人工智能技术的广泛应用,给大数据应用于生命领域研究提供了机会。由于信息技术的应用和互联网的发展,生物医学研究所能面对的数据量极度增加,这给大数据的充分应用提供了平台。当然也为医学信息化和医学研究提出了新的要求[15]。基于计量诊断和多元统计方法等在中医诊断发展的速度和潜力,使得大数据在中医诊断中应用的可行性大大提高,尤其体现在中医四诊客观化、中医证候标准、证型与实验指标关系以及指导临床治疗等几个方面。
大数据与多元统计方法的结合能更好地服务于中医诊断学,是实现中医诊断客观化、证候标准化的一种必然趋势,是中医走向世界、被世界认识和理解的途径,也是中医发展和创新的需求。但是大数据在中医诊断中的应用仍存在很多问题,如临床数据共享和标准统一以及要具体到中医术语标准化、诊疗对应体系等一系列的数据化处理。一方面要加强中医诊断相关大数据的整合与共享,包括把问诊、处方以及治疗信息电子化录入,建立大数据的共享平台,实现社区、医院、区域的医疗数据共享系统;另一方面要加强信息技术与中医基础研究的融合,实现科研基础数据、临床诊疗数据的完美连接。有一点需要强调和说明,在应用大数据发展中医诊断的过程中,应以中医理论为指导,否则便失去了应用大数据的真正意义。
[1]董晓婷.大数据的定义特征及其应用分析[J].硅谷,2013,6(11):120,60.
[2]王震寰.计算医学——应对大数据的挑战向临床转化[J].蚌埠医学院学报,2014,39(1):1-2.
[3]张建英,何建成.大数据在中医学中应用的可行性分析与展望[J].中华中医药杂志,2017,32(1):17-20.
[4]周小青,吴正治,刘建新,等.常见舌苔舌上皮细胞化学的定性定量研究[J].中国中医药科技,1994,1(4):3-6.
[5]边振,辛超,臧翠翠,等.浅析中医脉诊客观化的新思路[J].辽宁中医杂志,2015,42(1):70-71.
[6]王常松.对中医“四诊”客观化研究的思考[J].中国中医基础医学杂志,2009,15(2):85-86.
[7]梁建庆,何建成.基于数字化系统的中医问诊诊断客观化研究[J].中华中医药杂志,2014,29(5):1534-1538.
[8]丁宏娟,何建成.计算机中医问诊系统的临床验证研究[J].辽宁中医杂志,2010,37(11):2138-2139.
[9]王祉,董梦青,王忆勤,等.基于舌、面、脉诊图像参数的冠心病中医疗效评价研究[J].中华中医药杂志,2015,30(3):693-695.
[10]李小茜,刘伟,何建成,等.充血性心力衰竭中医证候量表的信度与效度评价[J].中医杂志,2015,56(7):594-597.
[11]李小茜,何建成,黄品贤,等.基于临床流行病学调查的充血性心力衰竭气虚血瘀证诊断标准[J].中国老年学杂志,2016,36(2):308-311.
[12]李毅,刘艳,寇小妮,等.基于多元统计方法对乙肝后肝硬化辨证标准的研究[J].中医药导报,2012,18(7):7-10.
[13]陈昌华,石林阶,舒毅刚,等.肝血虚证15项实验指标同步检测的分析[J].湖南医科大学学报,2001,26(4): 337-339.
[14]张盛杰,孙莲娜,薛建华,等.慢性乙型肝炎中医证型分布规律规范化初探[J].中西医结合肝病杂志,2010,20 (6):324-328.
[15]李国栋.大数据时代背景下的医学信息化发展前景[J].硅谷,2013,6(19):7-8.
The feasibility and prospect of the big data app lication in TCM diagnosis
WANG Li,HE Jiancheng
(Department of Diagnostics of Chinese Medicine,Shanghai University of Traditional Chinese Medicine,Shanghai201203,China)
The arrival of the era of big data has a significant impact on biomedical research. Traditional Chinesemedicine(TCM)diagnosis is the core and key of TCM theory and clinical research.The auther summarizes the big data and TCM diagnosis,feasibility of the application of big date in TCM diagnosis(the objective study of TCM four diagnostic methods,to investigate the syndrome criteria,the relationship between the syndrome type and the experimental index,and clinical treatment of TCM).It is believed that the quantitative diagnosis of TCM syndromes and the quantification ofmultivariate statisticalmethods are the basic elements for the formation of large data.The application of big data is the driving force of objectification and standardization of TCM diagnosis.
Big data;Traditional Chinese Medicine diagnosis;Feasibility;Prospect
R241
A
2095-3097(2017)02-0065-03
10.3969/j.issn.2095-3097.2017.02.001
2017-02-28 本文编辑:徐海琴)
“十二五”国家科技支撑计划项目(2012BAI25B05);上海市卫生系统优秀学科带头人培养计划资助项目(XBR2011070)
201203上海,上海中医药大学中医诊断学教研室(王利,何建成)
何建成,E-mail:hejc8163@163.com