高性能计算在中医药领域的应用探讨
2016-02-13刘红杨策邢雁辉张竹绿崔蒙
刘红,杨策,邢雁辉,张竹绿,崔蒙
中国中医科学院中医药信息研究所,北京 100700
·中医药信息研究·
高性能计算在中医药领域的应用探讨
刘红,杨策,邢雁辉,张竹绿,崔蒙*
中国中医科学院中医药信息研究所,北京 100700
高性能计算作为崭新和重要的科研工具,目前已经在众多的领域得到了成功应用。在中医药领域的应用目前还处于探索阶段,未来有可能在中药植物药的基因组学、中药新药的虚拟药物筛选、中医药数据挖掘和大数据分析、模拟与仿真等领域开展具有创新性的高性能计算的应用研究。
高性能计算;应用;中医药
【引文格式】刘红,杨策,邢雁辉,等.高性能计算在中医药领域的应用探讨[J].中国中医药图书情报杂志,2016,40(6):10-12.
高性能计算是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机。高性能计算是世界各国竞相发展的前沿技术,是体现一个国家综合实力和科技竞争力的重要指标。
科学计算作为科研方法变革的产物,已经发展成为与传统的理论、实验并驾齐驱的第三种科研方法,并且日益成为越来越重要的科研方法。科学计算方法的运用,是高性能计算应用的基础和前提条件,而使高性能计算真正发挥作用主要取决于高性能计算的应用研究水平[1]。本文对于促进高性能计算未来在中医药领域的应用、丰富中医药信息学的研究内容及由此产生的中医药科研方法的创新具有推动作用。
1 高性能计算应用概况
1.1 我国在高性能计算应用领域仍处于落后水平
在高性能计算的研发和应用领域美国一直处于世界领先水平,日本和欧洲国家紧随其后长期位居世界先进行列。近年来,我国在高性能计算硬件的研发方面取得了突破性进展,通过自主创新逐步掌握了一批硬件研发的关键技术。中国国防科技大学研制的天河系列超级计算机连续多次在世界超级计算机排行榜中名列首位,标志着我国高性能计算的硬件研究水平目前已经接近国际先进水平。但在应用软件方面的发展严重滞后于硬件的发展水平,自主开发的高性能计算应用软件严重匮乏,需要大量购买和引进国外开发的应用软件,重要和关键部门的应用受制于人[2]。应用软件是高性能计算应用的基础,由于应用软件研发水平的严重落后,目前我国在高性能计算应用领域仍处于落后水平。
1.2 国内外高性能计算主要的应用领域
高性能计算作为崭新和重要的科研工具,目前已经在众多的领域得到了成功应用,各种前沿科学研究、技术开发和工程设计都越来越多地使用了高性能计算,高性能计算已经日益成为科技创新的重要力量。目前主要的应用领域包括气象数值模拟与预报、地震预报、纳米技术、生物医学、环境科学、空间科学、材料科学、计算物理、计算化学、流体力学、地震三维成像、石油勘探、天体星系模拟、大气与海洋模拟、固体地球模拟、工业设计、核武器研究、全球气候模型、湍流分析、飞行动力学、海洋环流、流体力学和超导模型等[1]。在生物医学领域的应用目前主要集中在人类基因组学、蛋白质组学、药物设计、分子动力学模拟等方面。
1.3 高性能计算应用的瓶颈
高性能计算虽然已经在众多领域得到了成功应用,但由于技术难度等的限制,仍然属于高投入高产出的非普及型应用。目前制约高性能计算应用的主要问题包括软件开发的技术难度非常大,系统使用成本过高,不仅体现在软硬件购置费用昂贵,而且系统运行维护成本过高,大型系统的年电费需上千万元[2]。比较高精尖的应用范围、非常高的技术要求和过高的使用成本,这些都限制了高性能计算的广泛应用。
2 高性能计算在中医药领域应用的可行性分析
2.1 高性能计算在领域应用的前提条件
高性能计算在领域应用的条件首先需要应用领域具有较高的科研水平,特别是能够通过科学计算的方法建立相应的数学物理模型和应用软件来解决实际问题,利用高性能计算才有可能促成应用领域研究水平的大幅度提高。通过对高性能计算应用领域的最高学术奖戈登奖获奖项目的分析,这些获奖的应用项目绝大多数都具有多学科交叉融合的背景,这反映了高性能计算的应用需要应用领域与计算机科学、数学等学科的跨学科合作[3]。随着高性能计算的应用,近些年高性能计算与应用学科的交叉学科不断涌现,产生了计算化学、计算物理学、计算生物学等许多新兴学科,这些交叉学科的产生标志着高性能计算在这些领域得到了高水平应用。
2.2 计算生物学的启示
计算生物学是一门以生命科学中的现象和规律作为研究对象,以解决生物学问题为最终目标,通过模拟和仿真的方法对生物学问题进行定量和定性研究的新兴学科。计算生物学与生物信息学比较,最大的不同之处在于生物信息学侧重于生物信息的采集、存储、处理和分析,而计算生物学侧重于对生命现象进行研究、解决生物学问题[4]。目前计算生物学领域的研究主要集中在蛋白质行为的模拟、药物分子的筛选、基因测序等方面。
虽然目前中医药领域还不满足高性能计算的应用条件,但通过借鉴计算生物学的研究方法,未来有可能在中医药领域开展具有创新性的高性能计算的应用研究。
3 高性能计算在中医药领域应用的展望
3.1 中药植物药的基因组学
基因组学是遗传学的一个分支,研究生物基因组和如何利用基因,涉及基因作图、测序和整个基因组功能分析,研究内容包括以全基因组测序为目标的结构基因组学和以基因功能鉴定为目标的功能基因组学。基因组学是高性能计算应用的一个重要方向,没有高性能计算人类的基因组计划就不可能实现,高性能计算已经成为基因组学研究不可或缺的科研工具。随着基因组学研究的深入、技术的成熟和成本的大幅度下降,使得基因组学的研究逐渐由人类的基因组学扩展到动物、植物等多个相近领域。利用高性能计算在基因组学方面成熟的应用软件开展中药植物药的基因组学研究未来有可能是高性能计算在中医药领域的重要应用。
3.2 中药新药的虚拟药物筛选
利用高性能计算进行虚拟药物筛选目前已经成为西药新药开发的一条崭新和重要的途径。新药研发的核心工作之一是从大量的化合物样品库中发现有药理活性的化合物,计算机虚拟筛选辅助新药开发是利用统计学和分子模型化技术来指导新的先导结构的发现或设计,从而减少实验室的工作量,缩短开发周期、降低开发成本。近年来对多靶点药物的研究已经成为国际上新药开发的一个重要的研究热点,中药是天然的多靶点药物,蕴含着巨大的新药创制的潜力[5-6]。应用高性能计算开展中药新药的虚拟药物筛选有可能成为中药新药开发的崭新途径。
3.3 中医药数据挖掘和大数据分析
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。大数据分析是指对规模巨大的数据进行分析,目前世界各国对大数据分析技术高度重视,大数据被视为国家重要的战略资源。数据挖掘和大数据分析是高性能计算应用的重要领域之一。目前中医药领域的数据挖掘和大数据分析主要集中在对方剂配伍规律、中医证治规律等的研究,现有的研究水平还不能构成对高性能计算的迫切需求。随着数据挖掘和大数据分析在中医药领域应用水平的提高,数据研究的内容、方法和结果的日趋丰富,随着数据量的积累和研究方法复杂度的提高,中医药数据挖掘和大数据分析未来有可能成为高性能计算在中医药领域富有潜力的应用。
3.4 模拟与仿真
模拟与仿真是依靠计算机通过数值计算和图像显示的方法,对工程、物理、生物等各类问题进行研究。高性能计算不仅具有强大的计算功能,还可以模拟或代替由于受经济或者其他条件限制不能进行的实验。2013年10月,哈佛大学教授Martin Karplus、斯坦福大学教授Michael Levitt和南加州大学教授Arieh Warshel因“为复杂化学系统创立了多尺度模型”而获得诺贝尔奖,评委会声明中称这一成果意味着对于化学家来说计算机已经成为同试管一样重要的工具[1]。
计算机模拟方法在生命科学中已经得到了迅速的发展和广泛的应用。高性能计算应用领域的最高学术奖戈登奖获奖项目“在20万CPU核和异构体系结构上的千万亿次持续性能血流模拟”,该项目模拟了血液流动状态,可以辅助血栓的早期病理学诊断及抗血栓药物的研究。另一项获奖项目“呼之欲出的猫:包含109规模神经元、1013规模突触的大脑皮质模拟”,对神经元和突触规模与猫大脑相当的大脑皮质功能进行了模拟,并以此为基础开展了认知计算的研究[3]。此外国内外大量的高性能计算被用于分子动力学模拟,分子动力学模拟是一种数值模拟方法,通过将分子抽象为由化学键连接的质点按照基于牛顿力学的数学模型迭代求解分子体系的行为。利用高性能计算进行分子动力学模拟已经成为化学和生物学研究中与实验手段相当的标准研究方式[7-8]。模拟和仿真技术在中医药研究中的应用未来有可能成为高性能计算在中医药领域创新性的应用。
4 小结
高性能计算的应用是使高性能计算真正发挥作用的软实力,是高性能计算领域重要的研究内容。高性能计算的应用需要多学科的交叉与合作,计算生物学的产生标志着高性能计算在生物医学领域得到了成功应用。
高性能计算在中医药领域的应用目前还处于探索阶段,尚不具备大规模应用的条件和基础。未来有可能通过借鉴计算生物学的研究方法在中药植物药的基因组学、中药新药的虚拟药物筛选、中医药数据挖掘和大数据分析、模拟与仿真等领域进行开创性的应用研究。高性能计算在中医药领域的应用将会对中医药科研方法的创新与发展产生深刻的影响。
[1] 顾蓓蓓,武虹,迟学斌,等.国内外高性能计算应用发展概况分析[J].科研信息化技术与应用,2014,5(4):82-91.
[2] 周兴铭.高性能计算技术发展[J].自然杂志,2011,33(5):249-254.
[3] 张理论,邓小刚.戈登奖——分析与思考[J].计算机工程与科学, 2012,34(8):44-52.
[4] 徐书华,金力.计算生物学[J].科学,2009,61(4):34-37.
[5] 朱伟,罗颂平.治疗输卵管阻塞性不孕的中药多靶活性成分计算机虚拟筛选[J].时珍国医国药,2012,23(6):1531-1532.
[6] 刘志华,孙晓波.网络药理学:中医药现代化的新机遇[J].药学学报,2012,47(6):696-703.
[7] 魏彦杰,张慧玲,黄庆生.蛋白质折叠计算机模拟研究进展[J].集成技术,2014,3(4):58-66.
[8] 王涛.计算生物学中的高性能计算(I)一分子动力学[J].计算机工程与科学,2014,36(12):2242-2250.
Discussion on the Application of High Performance Computing in TCM Field
LIU Hong, YANG Ce, XING Yan-hui, ZHANG Zhu-lv, CUI Meng*
(Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China)
High performance computing (HPC), as a new and important research tool, has been applied in many fields successfully. Application of HPC in the TCM field is still in the exploratory stage. HPC in the future may be innovatively applied in the field of genomics Chinese herbal medicine, virtual medicine screening of new TCM, TCM data Mining and big data analytics, modeling and simulation and so on.
high performance computing (HPC); application; TCM
R-3
A
2095-5707(2016)06-0010-03
10.3969/j.issn.2095-5707.2016.06.003
中国中医科学院科技创新团队项目(PY1306)
刘红,副研究员,研究方向为中医药信息学。
E-mail: lh@mai l.cintcm.ac.cn
崔蒙,研究员,研究方向为中医药信息学。
E-mail: cm@mai l.cintcm.ac.cn
(2015-12-01)
(2016-06-08;编辑:魏民)