我国生物医药研究和人工智能技术
2024-04-26陈凯先
陈凯先
生物医药领域是生命科学的重要组成部分,也是关乎国家经济、社会发展的重要产业。我国生物医药领域的发展经历了从跟踪仿制到模仿创新两个阶段,从非常薄弱的基础起步,经过不断努力,取得了快速发展和显著进步。本文分析了生物医药科技创新前沿动向、我国生物医药领域研发创新的态势和新阶段面临的新任务,介绍了AI等新技术对新药研发的重要作用,并对我国生物医药创新研究未来的发展趋势进行了展望。
1 生物医药科技创新前沿动向——机遇和挑战
当今生命科学领域发展总体呈现出5个方面的重要趋势:第一个趋势,是生命科学正在经历第3次革命。生命科学的第1次革命是在二十世纪五六十年代,由于核酸双螺旋结构的发现,生命科学的中心法则确立,开启了一个分子生物学、细胞生物学的时代;第2次革命是20世纪末至21世纪初,人类基因组的测序和对基因组结构功能进行的研究,开启了系统生物学的时代;当今正在经历的第3次革命的突出特点,是众多学科的汇聚(convergence),不仅生物学家,数学、物理学、化学、材料科学、信息科学、工程科学等学科领域专家学者共同参与到生命科学发展中来。第二个趋势,是生命科学进入大数据时代,“生命数字化”将产生广泛而深刻的影响。第三个趋势,是对生命科学的系统性认识,技术革新使人们对生命的认识更加全面、精确、定量,生命科学逐渐走向成熟。以分子生物学、基因组科学为代表,对生命的认识由观察到分析,由分析到系统,由系统到重建;表观遗传学、结构生物学、脑科学等的发现丰富和加深了对生命本质的认识,实现了学科领域拓展;以超高分辨率成像、测序技术、单分子为代表的新技术、新方法有力推动生命科学的新进展。第四个趋势,是在系统性认识的基础上进一步实现工程化的改造,改造、利用的能力进一步提高。比如,基因工程、再生医学、合成生物学、AI、三维(3D)打印等。第五个趋势,是成果转化的进程不断加速。重大疾病的致病机制不断明晰;新型疗法(如免疫疗法)和药物(如个性化药物、基因药物)提供了更多的治疗方式;健康管理(医疗器械、移动医疗、可穿戴设备)的快速发展,催生了“大健康、大产业”的到来;现代育种技术呈现规模化和高通量、工厂化、信息化趋势;生态环境保护在生物多样性、全球气候变化、恢复生态学方面成为主要关注点。这些成果转化对于经济发展、生态文明和民生福祉都产生了非常深刻的影响。
在生命科学快速发展的大背景下,生物医药领域涌现出一批科技创新前沿和研发热点,例如:精准医学和个性化药物开发、基因编辑技术、肿瘤免疫疗法、嵌合抗原受体T细胞(chimeric antigen receptor T-cell, CAR-T)治疗技术、生物大数据与AI、再生医学与干细胞技术、抗体偶联药物开发、新药发现的新策略和新技术,等等。
精准医学和个性化药物开发是基础研究和临床研究都非常关注的要点。据美国的个性化医学联盟(Personalized Medicine Coalition,PMC)统计,美国FDA于2014—2018年共批准了69个个性化药物。其中,个性化药物在新药获批中的比例由2014年的21%快速上升至2018年的42%。同时,美国FDA在这5年间批准的肿瘤个性化药物数量显著增加,占个性化药物总数的比例为46%,涉及18种适应证。截至2019年4月3日,美国FDA已批准了36种体外伴随诊断产品。
2013年,Science杂志将肿瘤免疫疗法评为当年十大科学突破的第1位,肿瘤免疫疗法成为肿瘤治疗颠覆性技术成果,是近年研究最火热的生物技术之一,并持续成为美国两大权威肿瘤学术会议——美国癌症研究协会(American Association for Cancer Research, AACR)年会和美国临床肿瘤学会(American Society of Clinical Oncology,ASCO)年会的关注热点。
以CAR-T为代表的细胞治疗是一种全新的免疫治疗方法,其发展非常快,多种产品已获批上市。20世纪90年代,蛋白激酶靶标的发现开启了肿瘤分子靶向治疗的新篇章。美国科学家Edwin G. Krebs和Edmon H.Fisher因发现蛋白质可逆磷酸化作用,获得1992年度诺贝尔生理学或医学奖。迄今,已有一大批小分子激酶抑制剂类药物获批上市,数百个候选药物正在进行临床评估,蛋白激酶抑制剂构成了当前肿瘤分子靶向治疗的主体。
此外,由于多学科交叉融合,药物发现和开发的新技术、新方法层出不穷、日新月异。例如,基于大数据和AI的精准药物设计和应用,靶向G蛋白偶联受体(GPCR)和离子通道等膜蛋白的新药发现技术,靶向蛋白质-蛋白质相互作用(PPI)和构象变化的创新药物研发关键技术,基于蛋白翻译后修饰调控的新药研究关键技术,共价结合药物研发技术,泛素介导的靶向蛋白降解PROTAC技术及分子胶水(molecular glues)技术,DNA编码集中库的合成及筛选新技术,化合物高效合成技术等。
当代科技发展为新药研发带来更多的新机遇、新挑战。基础研究突破引领创新前沿,社会需求也不断推动研发模式的转变,促进精准医学、转化医学的发展,多种学科的交叉和融合引发药物研究高新技术变革。
2 我国生物医药发展的现状和态势——进展和问题
新中国建立初期,我国生物医药研发和产业发展起点与国际水平相比十分落后,自主创新的能力薄弱。从20世纪90年代中后期开始,中国大力加强生物医药科技自主创新。我国从2008年开始实施了一批重大科技专项,“重大新药创制”是其中之一。这个专项历经3个五年计划,历时10余年,国家中央财政投入200多亿元。在重大专项支持下,我国新药研发成果显著。针对10类重大疾病,共有88个1类创新药(化学药和生物药)和41个中药创新药获得批准,有力推动了我国新药研发的进程。约200个在研品种进入Ⅰ期临床试验,160余个品种进入Ⅱ期临床试验,200余个品种进入或完成Ⅲ期临床试验,其中一批新药将会相继获批上市。共改造200余种临床急需品种,药品质量明显提升。在政策、人才、环境和投资4个方面的推动下,中国开启了创新药时代,新药获批数量呈现加速上升态势。2018年以后,国产新药占比迅速提高,同时临床试验数量也呈现快速上升的趋势。2022年,行业迎来了调整期,新药获批和临床试验数量有所下降(图1)。
图1 新药专项支持上市的创新药数量
国际知名分析咨询机构麦肯锡对于国际新药研发状况进行了分析研究,根据新药研发能力将相关国家分成3个梯队。麦肯锡的研究采用了两个主要指标,第1个指标是研发中(即未上市、未获批准、在临床前,或Ⅰ、Ⅱ、Ⅲ期临床试验)的新药数量及其在全球总数中的占比。第1梯队是美国,其研发中的新药数量约占全世界总数的一半。第2梯队传统上是由日本和西欧发达国家构成,中国经过不懈努力,近年来也步入了第2梯队的行列。2022年中国研发中的新药数量已占全球总数20%,位居第2梯队首位,仅次于第1梯队的美国。第2个指标是每年各国批准上市(包括国内自主研发和国外研发后到该国报批上市)的新药数量及其在全球总数中的占比。美国仍居首位,其批准上市的新药数量占全球总数的2/3;日本在第2梯队里居第1位,中国该项指标在第2梯队里居第2位,但增长速度很快。上述两个指标表明,中国的新药研究和创新在国际上已居于第2梯队的前列,这是一个历史性的成就。
我国的新药研发在数量快速增长的同时,研发水平和药物的临床价值也在国际上得到认可。美国FDA在新药审评中对优质的新药采取4种特别的措施,即:快速通道、突破性疗法(药物)、加速批准和孤儿药认定。近年来,有相当一批中国药企研发的新药在美国申报,获得美国FDA上述特别措施的认定,表明这些药物研发的创新水平、临床价值和意义已得到美国FDA的认可,显示中国的新药研发水平有了显著提升。
我国医药研究和产业的发展正在进入一个创新跨越的新阶段。从新中国成立到90年代中期,我国的研发基础相当薄弱,药物研发处于跟踪仿制(copy)阶段,在这40多年间,我国自行研发的新药数量较少。虽然有青蒿素这样非常优秀的成果,但总体数量很少,绝大部分的药物来源于仿制。90年代中后期以后,随着我国申请加入世界贸易组织(WTO),以及与美、欧、日等签订知识产权保护协定,我国不能无偿仿制国外专利药物,国家开始实施一系列重大举措来推动自主新药研发。经过20多年的努力,到2020年“十三五”规划完成时,在重大专项的推动下,我国的新药研发数量呈现快速增长态势,每年研发新化学实体药物达到20多个,在全球每年研发的新药总数中已占据相当的份额,这是令人自豪的重大成就。但我们也要看到,这些新药的作用机制和靶点并非我国原创。因此,我们把这个阶段称为模仿创新(me too,me better)阶段。今天,中国的新药研发已经有了比较扎实的基础,今后更高的目标是要加强原始的创新,迈向原始创新(first-in-class)阶段。
回顾我国医药研究和产业的发展历程,我们也清醒地看到我国创新药物研发还存在一些突出的薄弱环节,在国际竞争中还有一些瓶颈和短板,主要表现在以下几方面:一是基础研究薄弱,原始创新不足,缺乏“从0到1”的突破;二是在研发链和产业链中,我们在一些方面、一些环节上还依赖国外,存在瓶颈和短板,还没有做到自立自强;三是部分平台的技术服务和开放共享作用尚未充分发挥,协同创新的体制机制尚不健全,技术支撑作用有待进一步增强;四是在进一步营造有利于创新的生态环境方面还存在一些有待解决的问题,需不断加以完善。
3 新阶段、新征程和新任务——关于原始创新的思考
面临新阶段,我们要大力加强新药研究的原始创新,实现“从0到1”的突破。要努力开辟新的赛道,从“跟跑”“并跑”到在一些方面实现“领跑”。原始创新,其内涵包括:新的治疗概念和治疗策略,新靶点、新机制,新的技术,新的结构类型,新的适应证(first in disease),新的剂型,新的药物递送系统,新的药物特性(选择性、安全性)。临床价值和患者需求是原始创新的动力,也是原始创新的根本目标。
目前,我国研究的原创新药和潜在药物靶标的数量远远落后于发达国家。在2012—2022年全世界获批的原创新药中,国外有184种,国内据粗略统计仅有7种(图2)。在2012—2022年全世界潜在药物靶标发现数量上,国外有755个,国内仅34个(图3)。可见,我国的原始创新与国际先进水平还存在较大差距。
图2 2012—2022年first-in-class药物数量
图3 2012—2022年潜在药物靶标发现数量
原创药物不足也影响了我国生物医药产业的发展。以肿瘤免疫治疗药物为例,国际上已经批准的PD-1和PD-L1药物共有7种,而我国批准的药物已达10多种。但在肿瘤免疫治疗药物全球市场份额上,全球首先上市的两种药——帕博利珠单抗(商品名为Keytruda)、纳武利尤单抗(商品名为Opdivo)就占了73%,新的百亿美元药物诞生;而在中国上市的同类药物品种数量虽多,但在全球市场份额上仅占4%。可见,基于已知靶点的模仿创新难以抢占市场先机,产业发展受到很大的制约。
原始创新不足表明我国基础研究还有待加强,但这只是一方面。据统计,2022年我国学者在三大顶刊Cell、Nature、Science上发表的基础研究论文数量的全球占比超过了20%,显示我国基础研究已有快速进步。但另一方面,我国的原创新药数量仍相当少,说明我们不少基础研究成果还停留在论文上,可以转化的研究成果不多,还缺少重大的、颠覆性的技术突破,新靶标确证和原创新药研发的能力远落后于国外,必须大力加强我国基础研究向产业的转化和应用。
目前,我国创新型生物科技企业的研发投入增长较快,部分创新型新药研发生物科技企业的研发投入已超过大型传统综合药企,在研管线种类也逐步丰富,其中仍以Ⅰ、Ⅱ期临床试验的占比为最高。企业已逐渐成为创新的主体,上市医药企业投入的研发资金最高的已超过人民币100亿元/年。
细胞治疗、基因治疗等领域新药研发已取得了重大进展,一批产品已成功上市,但仍有很多问题尚未得到解决,成为前沿研究和竞争的热点。在细胞治疗领域,除CAR-T外,国内企业正在积极探索新的发展方向,实体瘤、通用型细胞疗法是研发热点。在肿瘤浸润淋巴细胞(tumor infiltrating lymphocytes,TIL)疗法、细胞受体基因工程改造的T细胞(T cell receptor-gene engineered T cells,TCR-T)疗法、自然杀伤细胞(natural killer cell,NK)疗法等潜力赛道均有了更均衡的布局。国内细胞疗法领域与国际顶尖水平之间的差距正在不断缩小。在基因治疗领域,早期的大部分成就聚焦于腺相关病毒作为载体方面。一些更新的技术,如基因编辑、表观遗传编辑、碱基编辑、先导基因的编辑等国内药企也在进行新的布局探索。此外,在核酸药物领域,由于递送系统与化学修饰的瓶颈存在,核酸药物发展经历了较大的波折。随着技术进步,脂质纳米颗粒(LNP)和N-乙酰半乳糖胺(GalNAc)修饰介导的出现,部分解决了递送难题,核酸药物有望迎来黄金发展期。从成本和临床需求方面来说,核酸药物符合中国市场的需求。在药物新靶点方面,神经生长因子(NGF)、Claudin 18.2、间质-上皮细胞转化因子(MET)、神经生长因子受体(NGFR)、SOX9等比较新的靶点引起关注,我国多个企业、研究机构正在加强布局。
2018年以来,随着我国创新药研发的崛起,对外许可授权(license-out)数量显著上升,交易额也快速攀升。我国初创新药公司通过许可输出和大型药企合作研发并获得里程碑付款,既获得了支撑研发的现金流,同时也是对公司研发实力的证明。2022年,国外企业从我国药企引入许可授权的最大一笔交易额达到100亿美元;2023年license-out的单笔最大交易额达到84亿美元(首付8亿美元)。
我国药企的研发能力正在快速提升,一些创新药物有望成为全球first-in-class或best-in-class药物,表明国际竞争力逐步增强。例如,康方生物公司研发的依沃西单抗是一个双特异性的抗体,有望成为我国研发的原始创新药物;传奇生物公司自主研发的西达基奥仑赛(商品名为Carvykti)已获美国FDA批准,用于治疗接受过4种或4种以上治疗(包括蛋白酶体抑制剂、免疫调节剂和抗CD38单克隆抗体)的复发或难治性多发性骨髓瘤患者,疗效显著优于国际同类产品,被称为best-in-class药物;百济神州公司研发的泽布替尼于2019年被FDA批准在美国上市,是首个国内自主研发、在海外获批上市的新药,近年来销售额不断增长,2023年销售额突破10亿美元,成为我国研发的第一个“重磅炸弹”式药物。
4 AI技术助力新药研发
4.1 AI助力新药研发的背景 药物研发是一个漫长的系统性工程,其特点为高投入、长周期、高风险、高失败率。AI技术的发展给药物研发带来了新的希望。Google研发的Alpha Fold算法,可以从蛋白质的一级结构,即氨基酸序列来直接预测其3D立体结构,对生命科学研究、药物研发起到了巨大的推动作用。
AI技术(包括监督预测、强化学习、生成模型、可解释器、图算法等)迅猛发展,可望加速新药研发进程,提升新药研发效率,快速、低成本获得新型药物和治疗方法,为攻克新药研发的瓶颈带来了希望的曙光。
2018—2020年AI药物研发不断升温,被称为AI制药2.0阶段。全球顶级制药企业大多选择与AI公司结成战略联盟,布局AI新药研发。2020—2022年,AI制药已进入3.0阶段。AI-Biotech蓬勃发展,大型制药企业布局AI药物智造。据2022 AI药物研发白皮书统计,在28家AI制药公司的管线中,临床前研究有42个,临床研究有25个(其中,Ⅰ期临床试验13个、Ⅱ期临床试验11个、Ⅲ期临床试验1个);在这些研究所针对的靶点中,已有获批药物的靶标占39%,新靶标占28%,未公布靶点的占33%。
4.2 AI药物研发探索与实践 我国一些研究单位围绕新靶标发现与确证、药物发现和药物开发等环节,研发了多种AI的算法和模块,取得了一批优异成果。
中国科学院上海药物研究所(简称中科院上海药物所)郑明月等研究团队联合华为公司,开发iPhord算法(即端到端的蛋白质结构预测算法),从蛋白质一级序列预测3D结构。研究团队还发展了“脸谱识别”的新算法,通过提取化学结构特征、基因变化特征、药物活性特征来关联比对“查明身份”,寻找新的靶点、发现新的药物。该算法已成功应用于药物新靶标和活性分子的发现,例如:奈非那韦是一种抗病毒药物,在抗击新型冠状病毒(简称新冠病毒)感染疫情的研究中发现该药对新冠病毒感染有一定的抑制作用,但其作用靶点不清楚。利用靶标预测算法,发现了奈非那韦抗新冠病毒的宿主靶标Cyp A,解释了其抗新冠病毒感染可能的作用机制。甲氨蝶呤也是一个抗肿瘤的经典老药,近年研究发现其对免疫系统也有调节作用,但作用靶点也不清楚。研究人员利用靶标预测算法,成功找到了新的靶点,这项研究[1]成果发表在Protein&Cell上。研究团队还高效地利用AI技术发现了靶向DDR1肠炎候选药物,其活性非常高, IC50达到10.6 nmol/L;且选择性很好,靶标选择性指数为0.002,半年内就把研究进度推进到候选药物阶段[2],被JournalofMedicinalChemistry作为编辑精选文章进行重点推荐。
中科院上海药物所郑明月团队还率先开展了从蛋白质一级结构信息(即氨基酸序列)出发,跳过蛋白质三级结构,直接预测药物作用靶标和新药分子结构的研究,即利用AI技术实现“从端到端”的靶点和药物发现,取得很有意义的进展,研究成果在2023年发表于NatureCommunications。
4.3 近药化学空间的构建 药物的化学结构应满足多方面的要求,除了要具有良好的活性以外,还要具有足够高的安全性和良好的药物代谢等性质。能符合(或接近符合)这些要求的分子结构其成药性比较高,这样的化学结构集合被称为近药化学空间。很明显,近药化学空间的构建对于新药发现[药物设计、新药(虚拟)筛选]都具有重要意义。华东师范大学李洪林研究团队开发的化学信息重建系统(chemical information reconstruction system,CIRS),把图形、文本、化学结构式等多模态信息融合起来,衍生构建出用于新药发现的近药化学空间。CIRS算法对于结构图像中的原子、键、电荷的识别准确率>98%,对文本信息中的实体识别准确率>97%。应用CIRS算法,成功地从一个专利的11个化合物实例出发,衍生构建出含200万个化合物的近药化学空间[3];他们还应用这一技术,从一个初始结构出发,衍生出10万个分子构成的近药化学空间,很快找到了活性提高3万倍的新药。
4.4 知识库的构建 药物新靶标的发现和确证是原创新药发现的源泉,是创新药物研究的突破口。如他汀类药物靶点的发现、蛋白激酶靶向药物靶点的发现、肿瘤免疫治疗免疫检查点靶点的发现,都大大推动了创新药物的研发。发现这些新靶点的科学家,均获得了诺贝尔奖。
水利水电工程是民生工程,在国家建设和发展进程中发挥重要作用。我国地域幅员辽阔,拥有丰富的水资源,积极开发水利水电工程项目,合理利用水资源为社会经济发展建设服务,对于促进我国经济的可持续发展具有至关重要的影响和作用。水利水电工程项目施工的施工技术管理,是施工安全管理、工程质量管理以及整体工程项目管理的基础,同时也是工程项目管理工作的重点环节。工程项目建设需要进行施工方案设计,施工技术管理能够保证施工技术与施工方案的融合,同时为实现项目建设目标,积极进行施工技术的创新,以实现整体工程项目建设能效的提升,从而促进水利水电工程项目施工技术水平的提高。
目前,全世界新药研发领域共同面临的问题是靶标枯竭。美国FDA批准的1 619种药物(小分子药物1 366种,大分子药物253种)中,针对的靶点总数为893个,其中人体靶点667个,病原体靶点226个。人们曾对人类基因组研究对新靶点发现的作用寄予厚望,但现在看来这方面的作用与当初的期望还有很大距离,仅有3%的基因被确认为可药性靶点,7%的基因为化合物探针触及的基因,55%的基因仅有生物学机制研究,35%的基因仍为黑暗基因[4]。
如何从海量数据中挖掘新知识、找到新靶点尤为重要。李洪林团队基于三方面的海量数据(生物医学基础研究的文献、药物研发文献和专利、药物临床研究数据),运用AI技术,构建疾病-靶标-药物三者之间的关系,着重评价其重要性和新颖性,形成了目前这方面全球最大的知识图谱,对特定疾病新靶点选择、新药设计,以及药物重定位具有较好的指导意义;为数据驱动的靶点临床决策和新药研发立项提供线索和理论依据;为基于AI的药物发现提供有力支撑[5]。
4.5 AI蛋白质生成技术 AI可生成文本内容、图像和视频,其能否生成新的蛋白质,是AI技术发展的另一个重要方向。AI蛋白质生成技术的发展,将成为引领生物医药创新发展的一项关键共性技术,可能带来改变合成生物学、改变医学、改变生物工程、改变研发范式的作用。AI颠覆蛋白质设计,解决传统方法无法解决的难题,激活蛋白技术产业应用潜力。AI蛋白质设计在生物科技时代将推动生物医药、材料、农业、食品、环保等多领域的变革发展。
上海的AI蛋白质设计平台公司分子之心,研发了全球首个融合语言的AI蛋白质生成大模型——NewOrigin(达尔文),提供了更强大的AI蛋白质生成的底层能力,支撑生物医药、合成生物学产业级应用。该模型具备以下特点:百亿参数即可实现多模态定向生成,一个模型满足多场景、多任务蛋白质生成,多指标组合式评估,干湿结合、真实的产业级评估体系,领先的生物多模态数据处理及协同训练能力,万亿级高质量、多层次、多模态数据,能“自助式”快速获取理想候选分子,解决ChatGPT无法完成的蛋白质生成难题。
AI蛋白质生成技术赋能合成生物学,加速了智能、可控、规模化发展的生物“智”造时代的到来,助力完成从酶(优化合成生物学关键要素“酶”)到细胞工厂(改造细胞代谢通路,实现按需生产的细胞工厂),再到合成生物产业智能化(AI赋能生物智造全流程,释放生物经济势能)的发展过程。
4.6 自动化、集成化——AI成为药物研发实验的关键技术 目前,在生命科学、医学领域,众多的实验技术已可做到高通量、自动化、信息化。自动化实验技术能否与AI技术相结合?英国利物浦大学提供了一个探索的例子:他们用自动化实验技术与AI相结合,构建了一个每天工作21.5 h的“AI化学家”,在没有任何研究人员指导下,8 d内进行了688次实验,工作了192 h, 进行319次移动,完成6 500多次仪器操作,并自主发现了活性非常高的催化剂[6]。我国的AI技术研发企业也发展了类似的技术,在苏州建设了自动化实验技术与AI相结合的实验室。
AI技术在药物筛选技术变革方面也展示了诱人的前景。传统的药物高通量筛选,主要基于在分子和细胞水平上对药物活性的检测,如测定药物对酶的抑制活性等。能否另辟蹊径,建立基于表型的筛选体系?例如,一个细胞在基因或化学扰动下可能发生细胞形态、颜色的变化,这个变化过程反映了化学药物或者基因扰动对细胞的作用,我们可以用显微镜成像来记录和呈现这种变化,但研究人员无法解读图像变化背后的作用。AI技术的发展提供了对图像变化进行深入解析的可能。同样,模式动物斑马鱼在受到化学物质或基因的扰动时,其体内器官形态、颜色的图像也会发生变化。由此可见,在AI技术的助力下,通过图像(形状和颜色)等表型变化的分析,可能开辟药物筛选的新路径。
4.7 生成式AI(AIGC)大模型推动药物研发迎来新机遇 AI发展有相当长的历史,近年来一个重大发展,即全球AIGC大模型引起了高度关注。模型的参数数量明显增加,可以达到1 000亿以上;模型的应用场景得以扩展,可以完成多个任务。ChatGPT可以助力百业千行,尤其是生物医药领域。利用ChatGPT生成代码的能力,为医药数据库或软件生成操作命令,用户可通过直白的自然语言操作数据库或软件,大大增强了各个软件和数据库的易用性。利用ChatGPT辅助专利和注册文件写作,挖掘生物医药数据,推荐实验操作流程,进行医药专利法规咨询。除了自然语言以外,还可通过生物语言进行蛋白质结构预测和功能蛋白设计,通过化学语言进行分子性质预测和从头药物设计。自然语言、生物语言、化学语言的深度融合将不断推进,对生物医药领域产生巨大影响。
AIGC在药物研发上的应用价值已经逐渐被释放。在药物研发上,AIGC可以显著提高药物研发效率,缩短研发周期,减少人力资源投入。例如,研究人员使用AlphaFold预测晶体结构并开展新药发现研究,仅用30 d就发现了CDK20小分子抑制剂;通过AIGC发现新型抗癌分子A2受体拮抗剂,仅用了8个月就使之进入了Ⅰ期临床试验。在个性化医疗方面,AIGC能将患者的医疗影像、电子健康记录、实验室检查结果和基因组学数据等融合,进行数据分析、预测建模,从而支持医师的决策,有助于促进药物个体化和精准治疗。AIGC还能拓宽创新空间,经过多年发展,AI辅助药物设计在小分子先导化合物发现到候选药物开发流程中的应用已较为成熟;AIGC模型为药物研发提供更多可能性,推动各种新型药物和治疗方法出现,如从头设计新型抗体、辅助靶向蛋白降解药物等。
当前,AIGC大模型虽然发展迅猛,仍存在一些有待解决的问题。一是数据问题。表现在数据质量、多模态融合、可访问性和隐私保护等方面都面临挑战;AIGC模型可实现更快、更好的创新,但其在药物研发中的局限性亟待解决。二是可解释性和可信性问题。AIGC模型的解释能力和可信性对于确保模型正确预测至关重要,这方面存在的问题需要认真研究解决。三是法规和伦理问题。AIGC给社会带来的潜在风险不可忽视,由于数据样本收集存在局限和偏见,导致数据驱动的AI 系统产生偏见。
AI助力生物医药创新正方兴未艾。展望未来,AI技术将与自动化技术结合,实现药物分子的高效、精准合成与连续制造;构建包含自动化基因编辑、高通量筛选、类器官和免疫学实验全自动化的综合自动化生物实验室;应用于临床环节模拟和数字药物研发,探索更广义的新药设计,成为给生物医药创新发展带来颠覆性变革的一种新技术。
5 总 结
中国的生物医药领域发展经历了不平凡的历程。经过长期坚持不懈的努力,已取得了重大的进展,跃居国际第2梯队的前列。现正大力加强原始创新,向创新强国的目标迈进。习近平总书记在二十大的报告中指出:“基础研究和原始创新不断加强,一些关键核心技术实现突破,战略性新兴产业发展壮大,载人航天、探月探火、深海深地探测、超级计算机、卫星导航、量子信息、核电技术、新能源技术、大飞机制造、生物医药等取得重大成果,进入创新型国家行列。”习近平总书记把生物医药列入我国取得重大成就的科技领域,这是对我国生物医药领域取得成就的高度肯定,也是对生物医药领域的鼓励和鞭策。当前,我国生物医药领域正面临着新的发展阶段,如何不断加强科技创新,实现更多从“0到1”的原始创新突破,研发更多原创新药,这是我们面临新阶段的奋斗目标。