大数据及人工智能时代的医学
2019-01-07郎景和院士
郎景和 院士
《中国妇幼健康研究》杂志名誉主编
数字医学、大数据和人工智能已经越来越多地进入了我们的视野之中。科学家们和哲学家们都在思考,大数据和人工智能会将人类社会引向何方。具体到医学领域或者妇产科领域,我们该如何看待或应对大数据呢?
1 关于数字、医学及数字医学
首先我们谈一谈数字与医学,谈谈中国古代的《易经》。《易经》被梁漱溟先生称为六经之首、大道之源。《易经》虽然始于卜筮,但逐渐丰富、深刻,表达了东方文化对宇宙变化的认识论及方法论,可以说是中华民族传统文化的最高典范。《易经》的基本观点就是世事皆数。易者,数也。数学使哲学摆脱了原始宗教的束缚,把对自然作用力的神秘、玄想和随意性去掉,并把似属混乱的现象归结为一种井然有序的、可以理解的格局。《古今数学思想》也说:“数是事物的本源,世界上一切事物都是由数构成的。一切事物都具有数的属性,只有将自然界的一切属性归结于数, 才能理解事物本身及它与其他事物的相互关系。”很多医学数据,如:发病率、治愈率、复发率、死亡率;末次月经、身体质量指数(BMI)、生育指数、疼痛评分;疾病的分类 、分期、分级、分度;流调、统计、报告等,都是数。数的概念,就是事物的概念,数字蕴含了事物的吉凶祸福,生机危机。世事皆数,万物皆数。计算机语言的核心是0和1,《周易》的核心是阴和阳。
所谓数字医学,就是应用数字化技术,解释医学现象,解决医学问题,探讨医学机制,提供医疗诊治水平,它是信息科学、计算技术、网络技术的综合,目的是使临床工作更加个体化、精准化、微创化、远程化。数字医学可以把人体的某些器官、甚至整个人虚拟出来,可以是三维的,甚至四维的,还可以是运动的。比如肿瘤周围的血管情况,通过数字技术可以把它们之间的关系弄得非常清楚。实际上,数字医学已经应用于现代医学各学科,包括生理解剖、血管重建、骨盆测量、盆底损伤、肿瘤诊治、手术设计、技术培训、损伤风险及预防等等。钟世镇院士率先在我国推动数字医学,并组建了中华医学会数字医学分会。
妇产科从古代就接触数字、接触大数据了!《黄帝内经》说,女子“二七,而天癸至,任脉通,太冲脉盛,月事以时...... 七七 任脉虚,太冲脉衰少,天癸竭,地道不通,故形坏而无侄子也。”古人说,女性14岁该来月经了,49岁会绝经了,一定不是几个人,一定是从一大群人中来的大数据。几千年以后,我们进入了现代,进入了2000年,这些规律基本没有改变,初潮和绝经不过是提前或者延后了一两年而已!这个规律,不是黄帝或者古代某个人说的,一定是一个时代的大数据的结晶。
2 关于大数据及医学大数据
大数据又称巨量资料,它的原始含义是指所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极目的的资讯。大数据概念的原始含义不断拓展,现在已经几乎涵盖了所有领域,而不仅限于企业。 简单地讲,大数据具有这样几个特点,可以概括为“4V”:第一是数据量大(volume)。大数据的起始计量单位至少是P(1 000个T,一个T是1 000个G)、E(100万个T)或Z(10亿个T);第二是类型繁多(variety),包括音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求;第三是价值密度低(value),海量信息涌现的同时,其价值密度相对较低,如何迅速完成数据的价值“提纯”,是大数据时代亟待解决的难题。第四是速度快、时效高(velocity)。这是大数据区分于传统数据挖掘最显著的特征。
生命科学领域和医学领域是大数据最多的区域。但是,众多的信息是纷繁复杂的,我们需要搜索、处理、分析、归纳、总结其深层次的规律。但这些浩瀚的信息通常无法用人脑来推算、估测,必须依托云计算、云存储和虚拟化技术等,才能对大量、动态、可持续的数据进行挖掘,从而获得具有新价值和洞察力的发现。
有人这样形容过,地球上图书馆书籍的信息量和大数据相比,差不多是芝麻和西瓜的关系。有资料显示,2011年,全球数据规模为1.8ZB,可以填满575亿个32GB的iPad,这些iPad可以在中国修建两座长城。到2020年,全球数据将达到40ZB。一个ZB相当于10万亿亿字节,也就是1的后面有21个0。数据和知识进行转化与重组,就形成了巨大的知识、巨大的资源、巨大的财富。数字的医学化,催生了数字医学,或者称为智慧医学,包括人工智能。
3 关于人工智能及医学人工智能
人工智能(artificial intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是计算机科学的一个分支,企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,包括机器人、语言识别、图像识别、自然语言处理和专家系统等。总的说来,人工智能研究的主要目标之一是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”,甚至可以对人的意识、思维的信息过程进行模拟。
或者可以这样说,当知识可以按片段的集成而创新使用,当数据与脑(生)相联,当数据、知识与生物直接联通,将导致新的、强大的智能系统的出现。比如为残疾人提供的腿的智能技术(被称为“刀锋战士”的南非运动员皮斯托瑞斯,2012年伦敦奥运会男子400米银牌得主,可惜他后来犯了罪),比如支撑霍金生存的高科技系统等。
阿尔法狗可以赢人类的棋手,因为它不但集合了很多优秀棋手的智慧,而且它在不断地学习,不停地运算。人类棋手和他下棋,则需要休息,还会疲劳。而阿尔法狗可以不休息,除非断电!但是请注意,包括阿尔法狗之类的人工智能,一定是人脑的集合,最终还是由人脑掌控的。它是人类智慧的整合。
4 大数据和人工智能对未来医学的影响
大数据和人工智能可以让我们能更好地认识事物的本质,认识事物发展的进程,认识生命的现象,认识疾病发生发展的规律。大数据和人工智能在妇产科的应用前景也会很大。以产科为例,十月怀胎,母亲有变化,胎儿在生长。从一个小小的受精卵变成一个3 000kg左右的孩子,这个过程是两个生命在发生变化,其中蕴藏的数字是非常奥妙的。我们说过什么最奥妙?生命最奥妙!这里面自然蕴含很多数据和规律。
妇科内分泌也一样。从下丘脑、垂体到卵巢这样一个生理调控轴里面,有多少数据?肿瘤发生、发展到结局,也是一个包含巨大数据的过程。我们现在强调遗传学,很多癌症都和遗传挂上了钩。遗传的本质是什么?遗传的本质是脱氧核糖核酸DNA,是DNA双螺旋上的4个碱基对,通过碱基键联接,按三联体密码规则组合形成64个密码子。这些都是数据!而且,这些数据不仅是病人一个人的,还包括他的父系和母系。这些数据甚至不是一个人两个人,而是一个种群,一个种族的数据。
然而,数字应该是有灵性的、变化的、不是死板的。如果我们把数字或者数据变成一个死的,就不对了,就违背了数字化的基本思想。数字是事物变化之所得,它本身也是变化的。因此,当我们利用这些数字的时候,我们一定要从变化的、发展的、灵动的角度去认识。具体来讲,也就是诊断和治疗的个体化。数据告诉我们应该如何处理,但是具体到个人,还要结合他个人的情况。我认为这是目前合理利用大数据和人工智能的关键点之一。
关于大数据和人工智能对未来妇产科领域的影响,主要有两方面。一方面,无论是产科、妇科肿瘤、妇科内分泌,都需要通过大数据来积累材料。积累材料的过程,就是我们认识事物的过程。肿瘤的发生也好、产科的变化也好,内分泌的改变也好,这些数字对于我们认识事物的本质非常重要。另一方面,我们要正确利用大数据和人工智能。现在我们有机器人辅助的腹腔镜手术——达芬奇系统,但它实际上还只是一种机械手,而将来完全可以用机器人来做手术。这当然很好,但是人工智能应该是在人的掌控下,通过一个人,通过一个医生来控制它,而不能完全靠机器来完成。我们可以让机器人去修了一个机器,可以让机器人去灭火,可以让机器人去干一些危险的工作。但医学的对象是人,尽管我们可以掌握机械,但我们不能完全把自己变成一个工程师。医生面对的是一个活生生的人,医患之间应该有感情交流,医生应该有关爱之心,不能完全用人工智能来替代。
总之,面对大数据和人工智能的技术进步,第一,我们要清楚,大数据一定是人的智慧、人的工作的整合和集合。如果我们给它提供的基本数据(Data),基本数字若是错误的,它一定不会算正确,一定会算到邪路上去。就像我们做医疗统计和科学研究,如果基本素材和基本数据都不准确,算得再快,算得再好,也只是在错误的道路上跑得更远,发生系统性偏异,背离真实和真理更远而已。第二,我们要明白,大数据就是一个认识论和方法论而已,并不像人们所想象的那么深奥,那么强大,那么无处不在。世界上的很多事物的确可以通过数字来描述:三维、四维、五维,甚至六维。生命的很多内容也可以用数字来表达和诠释,但是,生命的本质不是都可以用数字来表达的。大数据淹没“一切”。但是总有“数据”以外的“什么”在呐喊。人、生命、思想,不是都能通过数字表达的。有的地方是数字所覆盖不了的,够不着的,那才是生命,那才是医学!
最后,我们要记住,无论是数字医学、大数据,或者人工智能,依然是相对的,不是绝对的,更不是万能的!我认为这应该是我们需要表达的基本思想。