APP下载

基于SWOT-PEST模型的中医古籍知识库建设策略分析*

2023-11-07李筱颖李鸿涛张伟娜张磊王程佟琳

世界科学技术-中医药现代化 2023年6期
关键词:知识库古籍中医药

李筱颖,李鸿涛,张伟娜,张磊,王程,佟琳

(中国中医科学院中医药信息研究所 北京 100700)

中医古籍是中医药传承精华的源头活水。由于中医古籍具有文物与应用价值的双重属性,传统保存与利用方式阻碍中医古籍知识的有效利用。中医古籍知识库通过分析海量数据、深度开发内容资源,帮助用户短时高效地获取知识,能够解决保存与检索利用之间的矛盾,是实现中医古籍保护与利用的重要途径。

中医古籍知识库的建设尚处于初级阶段,现有中医古籍知识服务大多处于理论探讨和初步实践阶段。进入21世纪,以大数据、云计算、数据挖掘、虚拟现实等为主要特征的新一代信息技术蓬勃发展,多元化、知识化成为人们获取信息新的主要特点,推动古籍数字化研究迈进以“古籍知识化”为研究重点的新阶段。习近平总书记强调:“要运用现代科技手段加强古代典籍的保护修复和综合利用,深入挖掘古籍蕴含的哲学思想、人文精神、价值理念、道德规范,推动中华优秀传统文化创造性转化、创新性发展。”本文采用SWOT-PEST模型,深入分析中医古籍知识库建设的自身优势和劣势,并从政治、经济、社会和技术等维度梳理其发展的外部机遇与威胁,针对性提出应对策略,为中医古籍知识库建设提供决策参考。

1 中医古籍知识库建设的SWOT-PEST模型(表1)

表1 中医古籍知识库建设的SWOT-PEST模型

SWOT-PEST是现代战略分析与决策制定的系统分析模型。SWOT分析从优势(Strength)、劣势(Weakness)、机遇(Opportunity)和威胁(Threat)四个层面,客观公正地评价组织“内部”综合情况。PEST分析从政策(Politics)、经济(Economy)、社会(Society)和技术(Technique)四个宏观因素,对“外部”环境因素错综复杂进行全面深入地剖析。本研究基于SWOT-PEST模型综合调查了中医古籍知识库建设的内部和外部环境,有效识别了自身的优势与劣势,判断外部的机会与威胁,以达到利用优势把握机会、克服劣势、应对威胁并借助威胁克服劣势的目的,为提高中医古籍知识库的应用性、解决实际问题提供借鉴[1-2]。

1.1 优势(Strengths)

1.1.1 政策优势

文化、中医行业内颁发了关于中医古籍保护的系列政策。《中医药发展战略规划纲要》提出了中医药服务体系、特色人才队伍、传承创新、产业和健康服务业、开放发展、治理水平等方面的具体发展目标与提出了15项主要发展指标,强调提升中医药对公共卫生事件的应急处理能力。《中医药传承创新发展建议》提及完善卫生服务体系,提高对公众健康问题的关注,提高规范化诊疗能力。《关于推进新时代古籍工作的意见》系统规划新时代古籍工作,从总体要求、完善古籍工作体系、提升古籍工作质量、加快古籍资源转化利用、强化古籍工作保障五方面进行论述,强调了提高研究水平、推进古籍数字化、普及传播、完善法治保障和政策支持等,为中医古籍保护、整理、研究、利用提供了根本遵循。

1.1.2 经济因素

中医药文化与经济相互融合,形成了新型的经济形态,为经济发展注入新鲜活力,优化了中医药健康服务理念,成为新的经济增长点和重要支柱[3]。中医药结合现代科学方法,探索中医药文化产业新业态,如中医智能诊断系统,利用信息化衔接远程诊疗,实现“点对点”的精确合作,实现医疗模式标准化、全过程数字化,提升基层医疗的临床能力及质量管控。

1.1.3 社会因素

知识库利用人工智能与数据库技术高速处理、准确运算,用户既可以短时高效地检索精确信息,又可深入挖掘,实现全方位、专业化的关联检索。遵循中医药发展规律,传承精华,守正创新,深入发掘中医药宝库中的精华,充分发挥中医药的独特优势,切实把祖先留下的宝贵财富继承好、发展好、利用好,让中医古籍薪火相传,焕发新的光彩。人们对健康服务的需求呈现出多层次、多样化的特点,促使中医药服务机构依托技术进步和优化升级服务来满足人民需求。中医药学包含着丰富的健康养生理念和实践经验,是中华文明的瑰宝,要坚持古为今用,加强古典医籍精华的梳理和挖掘,让中医古籍“活起来”,与现代健康理念相融相通,更好地护佑人民健康。

1.1.4 技术因素

中医古籍知识库的辅助功能提升了系统的实用性,如统计(频数统计、聚类分析、关联规则、因子分析)、历史年表、古今纪年换算、干支/公元纪年换算、六十四卦表[4]。数字化展现古籍原版原貌或将转换为结构化文档,利于重版印刷,通过对原书进行深度标引,发现知识点间的内在关联,实现对知识点的检索。用户行为智能分析与知识需求预测,能够针对用户实际或潜在的信息需求进行推荐,通过个性化推送(电子邮件、系统消息发布),向其主动提供可能需要但难以获取的资源,提高知识的利用率,预判研究趋势[5]。计算机辅助分词技术将人工智能与医疗行业相结合,将含有大量术语的古籍内容,精确分割成有明显边界的词序列,为处理自然语言提供精确的语义,有助于医疗信息系统的搭建与发展,实现从多样化、异构化、碎片化、价值密度低的海量文本中高效抽取有价值的信息[6]。

1.2 劣势(Weaknesses)

1.2.1 政策因素

目前,我国知识库政策研究发展相对滞后。宏观层面多为非强制性政策,倡导学者在维护自身及他人合法权益的基础上,共享知识劳动成果;机构层面政策相似度高,而识别度与灵活性低,涉及因素众多、关系复杂,各机构间的政策存在矛盾和抵触的现象[7]。由于历史原因、古籍保护难度大,我国中医古籍保护形势严峻,存在着认知、资金、研究队伍、技术能力不足与保护条件差等问题,需要政策的支持与推进。

1.2.2 经济因素

持续的资金投入是知识库稳定运营的保障。软硬件配置、数据管理、系统维护、服务提供、平台开发升级、员工培训等方面均需资金支持。知识库建库资金来源单一,主要由图书馆经费、国家项目支持,仅满足前期建设,无法保证其可持续发展。

1.2.3 社会因素

中医古籍知识库是中医学、统计学、文献学、目录学、版本学、语义学、计算机与信息科学等多学科协作与交融的知识生态,能够实现知识共享、交流与创新的平台。若各知识库闭门造车,将形成“信息孤岛”,造成知识库可持续性差、资源浪费、后期维护成本增高的问题。

1.2.4 技术因素

信息化是中医古籍知识库建设的基础,即将自然语言转化为计算机可识别与理解的结构化语言。中医古籍由于病名、药名、度量衡、字体(繁简字、异体字、古今字、通假字)未统一,非结构化的知识制约了信息化的效率与质量,文本数据加工很大程度上受限于基础语料库与术语词表的质量及中医药知识关系的复杂性,通常必须采用人工审校的方式。当前信息化手段以OCR识别为主、人工校读辅助。OCR识别技术已相对成熟,但仍存在识别度低、标注样本少、错字漏字、识别竖排繁体字效果不佳、成本高等问题[8]。知识发现、关联、推理、组织机制进一步开发、落地、应用、推广有助于在知识共享的背景下,提高组织乃至行业的整体绩效[9]。中医药领域缺乏业界统一认可的语义本体,术语规范化、术语分类研究方法、概念间关系定义、同义词处理等问题亟待解决[10]。

1.3 机遇(Opportunity)

1.3.1 政策因素

国家政策保障了中医药信息化平稳健康发展,从宏观层面弥补了知识库发展短板。“中华古籍保护计划”在古籍普查、修复保护、数字化、整理研究、人才培养、推广普及等方面取得了一系列重要成果。《关于进一步加强古籍保护工作的意见》采用数字化、缩微等技术推进古籍整理、出版与利用工作,加强古籍宣传、开发特色文献,传承发展中华优秀传统文化。《“十四五”中医药信息化发展规划》强调持续推进中医药业务与信息技术深度融合,促进中医药信息化、体系化、集约化、精细化发展,完成数字化、网络化、智能化的行业转型升级,推进中医古籍的保护、管理、研究与利用工作。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议》强调了中医药传承保护,实施中医药古籍文献和特色技术传承专项,编纂出版中华医藏,建立国家中医药古籍和传统知识数据图书馆,加强对名老中医学术经验的活态传承,建立中医药传统知识数据库、保护名录和制度。

1.3.2 经济因素

用户是知识的使用主体,Luca等[11]基于用户对知识库的体验和评价研究,重新设计、改善了平台界面,既满足用户便捷获取资源的需求,又控制了资源质量,提升了知识利用率。中医古籍是传承发展中医药学术的主要载体,但由于其稀少性、珍贵性、难懂性,多是半结构化或非结构化的数据,不能满足现代社会对信息获取的需求,难以充分发挥其价值[12]。

1.3.3 社会因素

各异构数据库如“孤岛”分布,数据重复、失真、冗余,无法提供全面综合的信息,降低了用户获取知识的效率。大多数信息系统可实现共享,需要考虑异构数据库之间的数据转换、数据添加、数据同步更新与共享等问题[13]。中医古籍承载着中医各家学术传承与临床经验的历史源流,凝聚了古代先贤的智慧和经验,是现代中医防治疾病、临床、科研、新药研发的重要依据,其中的治法、方药沿用至今,当代依然发挥实用价值,知识库能够连接中医古籍信息孤岛,促进中医药学术的活化。

当前,中医药优质医疗服务资源总体不足,基层中医药服务能力较薄弱。中医古籍是中医学术传承的重要知识载体,是中医学继承、发展、创新的源头、底气和信心。中医药提倡“治未病”,满足人民群众全方位、多层次、多样化的健康需求,提升疾病预防、治疗、特色康复能力,建设优质高效服务体系,带动特色发展。

名医传承是中医学术传承的重要途径,但多是个体传授,周期较长、难以大规模培养人才、效率较低。名老中医的临床经验、诊疗能力及技巧无法完全通过语言、文字、图像、符号等方式表达,多是难以表达、不易传授的隐性知识。通过知识库系统,使名老中医知识变成组织知识、隐性知识转化为显性知识,通过融合与创新,使显性知识成体系,解决了名医学术传承中的知识偏移、遗漏甚至失真等问题,为进一步研究提供准确依据。

中医药治疗新型冠状病毒肺炎的三方三药,疗效显著,其中清肺排毒汤,取自《伤寒论》中的麻杏石甘汤、五苓散、小柴胡汤和《金匮要略》中的射干麻黄汤,中医古籍知识仍为现代新药研发提供思路。

1.3.4 技术因素

中医古籍数字化是挖掘古医籍精华的关键,对中医古籍知识库建库的发展探究具有重要现实意义,我国古籍数字化研究始于20世纪70年代末,历经了缓慢增长期、加速开拓期、平稳发展期三个主要发展阶段,从最初的键盘文字录入、图形扫描、索引编制到大规模的古籍文献全文数据库建设,从简单的古籍题录信息揭示到应用文本挖掘,已取得了阶段性成果,为中医药文化传承和传播提供了资源保障。

信息技术有助于深化中医古籍的内容揭示。数据挖掘、信息处理、人工智能等技术,智能化变革助推中医古籍数字化的深度与广度,既有对大数据高效管理能力,又有人工智能的知识演绎推理能力,激发海量数据中蕴含的潜在价值挖掘,提升中医古籍内容创造性转化利用的深度与层次。可视化形象地表达领域概念间关联,联通分散的知识资源,由“知识点”变为“知识体”展示,支持交互式浏览和概念间跳转[14]。将隐性知识按照一定规则编码,实现知识体系的有序化,最大限度地解决知识孤岛问题。将知识仓库与诊断治疗系统集成,在不同的诊断阶段推送参考方案,提高基层诊疗水平。

1.4 威胁(Threats)

1.4.1 政策因素

资源发展规划是在一定时段内发展诸要素、推动高质量发展、从而达到理想效果的综合规划和战略布局。当前,中医古籍知识库资源发展规划尚不完善,发展远景模糊,缺乏统一的建库标准与实施方案,兼容性和集成性差,各自为政、资源封闭,缺乏讨论和意见征集,难以得到科研工作者的广泛认同、理解和支持。

1.4.2 经济因素

经费问题是知识库开展缓慢甚至处于停滞状态的重要原因。知识库的社会公益属性决定了投入产出比较低、市场投入低、营利性不足。中医古籍知识库建设多依靠项目经费,对政府资金依赖性强、资金链易断裂。一旦项目结题,资助随之停止,知识库建库则进入半停滞状态,服务更新迭代无法完成。

1.4.3 社会因素

独立、专业、公正的知识库评价有助于调整与改革知识库工作。国内中医古籍知识库建设质量参差不齐,缺乏专业的技术指导、可操作性强且适用的评价指标体系、客观专业的第三方评价组织,评价体系通用性、灵活性和智能化不足,难以保障知识库的科学性与良好的社会评价导向[15]。

1.4.4 技术因素

中医古籍知识服务研究多属于理论探讨,缺乏基于调研与实证的量化研究。量化研究是一种理论检验式的研究,客观揭示知识库内在运行规律、预测发展趋势、评价影响因素,不仅能够得出“有影响”,更能表示“影响有多大”,有效提升证据强度。高性能信息处理模型的缺乏也阻碍了中医古籍知识库的发展。

2 中医古籍知识库建设策略

当前中医古籍知识库建设工作机遇与威胁并存,必须结合具体情况,提出明确的发展思路与可操作的建设策略。

2.1 优势—机会策略:利用外部机会,发挥自身优势

2.1.1 借鉴成功经验

参考优秀的知识库实践,借鉴其组织架构、服务体系、运行模式等,并结合自身优势和特点,精准定位,建立适合自身的发展模式。中医养生数据库已实现对110种养生古籍的多角度检索,可浏览全文图片;温病大成数据库能够对《温病大成》45种古籍进行全文检索、条文阅读,实现对病、症、方、药的关联检索;中医药古代文献知识库经过专家解析标注,形成以知识元为关联的知识网络,实现对知识库中知识的有效查询和发现[16]。丁侃等[17]将中医古籍专题数据库建设分为定制加工、简单协作、深度合作三种模式。

2.1.2 促进学科共建

中医古籍知识与古代哲学、文学以及现代科学技术紧密相连,古籍知识库的构建旨在借助新技术、新理念来实现传统学科拓展和深化,以继承、跨界、创新为出发点,聚焦同一核心目标,降低成本投入,实现降本增效、资源整合、共享与经验交流[18],推动现代技术与传统知识资源的融合,打造集成集约、互联互通、深度融合、共建共享的知识生态[19],为知识发现、知识生产提供新思路。

2.1.3 加强宣传力度

用户逐渐对知识库有了正向认知,但服务功能有限、资源利用率低等问题仍制约知识库发展。首先,必须优化基础服务,如交互界面应简洁美观易操作;多种终端无差别访问;用户可便捷交流与勘误反馈;加强系统安全性,增强用户使用意愿,提升用户信任感。其次,需加强宣传,以新媒体为媒介,以热点话题式营销与“名人效应”为方法,以优秀学者或具有丰富知识库使用经验的用户为切入点,加强知识库宣传力度,扩大影响力。

2.1.4 开展精准服务

中医古籍知识库的构建应突破中医古籍文献本身的内容,面向临床实践和科学研究的需求,模拟多场景应用,针对专科、专题古籍文献进行深度的知识挖掘,多场景应用驱动中医古籍知识深度利用,构建多应用场景、特色专题的知识库。简单的文献信息服务难以满足用户深层次的信息需求,海量的中医药数据亟待挖掘利用。在环境威胁且自身存在劣势的情况下,中医古籍知识库需要明确自身定位,应用新技术和新理念来实现古籍蕴涵的原创知识的提炼、展示与活化利用,开展精准服务,让中医古籍在“增进人民健康福祉”中发挥更大的作用。专题知识库可满足用户关联主题导航、垂直检索信息、便捷了解最新动态等需求,实现知识应用与创新的良性循环。中医临床辅助决策系统实现了病案数据化、分析自动化和应用智能化[20],为诊疗决策提供参考与优化,也为名老中医经验传承提供了可行路径。知识库问答系统接收用户的自然语言提问,使其快速、精确地得到知识或答案。

2.2 优势—威胁策略:抓住外部机会,弥补内部劣势

2.2.1 发挥政策作用

政策对中医古籍知识库建设起到重要引导作用,需要综合考虑我国知识库发展情况,制定长远而具体的政策,确保其标准规范化与正常运行,提高用户参与古籍知识库建设的积极性。首先,应健全标准规范化体系,统筹中医古籍数字化建设,便于科研工作者对古籍数据库的应用,实现中医古籍创造性转化、创新性发展,推动集成与创新,丰富和发展中医药理论与实践。其次,应宣传中医古籍分级保护的理念,提高古籍整理研究能力,提升古籍整理出版水平,带动重要古籍文献系统性保护、整理、研究和出版,推广经典古籍。

2.2.2 多方筹集资金

知识管理须以大规模投资为基础,维护其稳定运行、优化知识生产[21]。应鼓励知识库拓宽应用场景,降低服务成本,实现持续优化经营。同时,鼓励科研单位将知识服务纳入项目经费规划,提高机构或个人的工作效率[22]。通过多方筹集资金,如公开招标,联合商业公司承接中医古籍知识库建库工作,或多机构联合建设,整合多方资源,制定长期计划、激励机制与资金支持计划,保障知识库透明有效地运转。

2.2.3 改革人才培养

工作人员是知识库具体工作的承担者,如组织资源、提供服务、教育培训、维护系统、升级软硬件等,作为桥梁,还需沟通联盟成员与用户的意见。由于知识库的工作重点在服务而非研究,工作人员无法介入具体研究、准确感知用户需求,从而造成知识库与用户间的隔膜[23]。知识库应积极与具体研究合作,及时更新职能人员的类型及对应职责,要求其具备信息技术、知识产权、数据治理、数字人文等方面的素养与知识储备[24],加强知识与业务的宣传,提高工作人员的认知度和认可度,培养工作人员与用户间的合作伙伴关系。

2.3 劣势—机会策略:借助自身优势,化解外部威胁

2.3.1 建立统一标准

本体、语义网等技术使得概念更明晰、术语间关系更明确,符合中医药知识体系的形式化表达、知识资源语义互联与共享应用,有助于中医知识资源的关联与集成。以顶层本体为指引,以真实语料为底层依据,结合基于语义关联度的主题聚类方法,完成中医知识的收集、抽取、融合,将其文本化、数据化、知识化,通过统一规范的知识表达促进共享和重用,提高知识质量。此外,注重扩充知识库信息,提供多个异构数据源整合的关联访问,实现整合的资源发现服务[25]。由权威组织或机构牵头,大力发展中医药领域本体研究与落地应用,实现语义标准化。2014年国际标准化组织(ISO)已发布《中医药文献元数据》国际标准,为中医药文献提供了通用的元数据技术标准规范。

2.3.2 完善更新机制

知识内容更新是为了融入最新知识、排除错误信息,更好地发挥知识效能,对知识进行补充,实现实时更新,使得内容更全面准确。深度学习技术能够实现中医古籍知识库快速更新,如卷积神经模型、循环神经网络、长短时记忆网络等技术。

2.3.3 补充质量评价

知识质量评价是碎片知识融合与知识库构建等应用的重要环节[26]。科学的评价指标体系能够充分发挥评价功能,从体系化的高度理解知识库运作,促进政策落实、保证建设与管理工作科学化,实现知识库的长效发展[27]。构建评价指标体系应遵循科学性、系统性、可操作性、面向用户的原则[28]。邹金汇等[29]认为从服务效能、业务建设、保障条件三方面评价知识库建设;李兵等[28]从内容、检索、支持功能和服务功能四方面评价中医古籍数字化成果;郭翊等[27]提出知识库可从知识获取效率、自身价值、教育功能、知识组织能力、资源、虚拟空间、管理、人员、内外部关系九部分评价;尤瑞芳等[30]将知识库分为检索功能与成果管理两个维度,以政策指南、系统平台、存储内容、检索功能、成果管理、成果评价为一级指标进行评价。

中医古籍知识库的服务对象是中医古籍与文献研究人员、中医临床与科研人员、中医专业学生,评价主体应由以上人员组成,加强评价结果反馈,提高知识库建设质量。

2.4 劣势—威胁策略:减少内部劣势,规避外部威胁

2.4.1 改进基础架构

知识库服务体系必须基于用户的信息需求,整合优化现有资源,为用户提供技术、工具和方法支持[18]。知识库的基础架构包括指导思想、落实规范与日常运行。“指导思想”,即确定“建设什么样的知识库”、“如何建设”及“为谁服务”的根本问题,整体推进建库工作,加强各领域各环节的协同配合;“落实规范”保障知识库持续健康发展,分为支持政策与运行政策,包括开放获取、绩效评价、经费、技术、人员支持及知识产权保护六方面;日常运行包括学术研究、员工培训、资源提供、学术交流等基础活动。基础架构的充实与改进,将会带给用户更好的使用体验。

2.4.2 优化性能模型

知识库自下而上分别为数据获取层、数据存储层、数据处理层、分析应用层、服务接口层。数据获取层负责数据采集、筛选与整理;存储层根据业务特点与应用范围,分层存储数据;数据处理层将非结构化、半结构化的杂乱数据清洗转化为结构化数据,使其操作性、针对性、系统性更强;分析应用层根据用户需求进行数据运算,创建可视化图表;服务接口层提供完善的检索系统,对分析层导出的数据进行一站式的查询调用,为用户提供有差别的数据服务。此外,引入负反馈机制,可对性能低、输出结果匹配度低等相关问题进行反馈与改善,从而检查文本信息、图像信息,或调试程序、修饰数据,以达到推进模型优化的目的,推进知识库准确、高效工作[31-32]。创新利用信息处理技术、语义本体、知识图谱等方法在中医古籍知识发现与知识服务中的应用,研发高性能古籍信息处理模型,实现内容深度加工与整合,基于概念类型、语义关系等对知识进行关联,立体呈现“理、法、方、药”知识内容。

2.4.3 加强技术创新

“知识”是知识库建设的核心,涵盖核心知识界定、知识组织、知识发现以及知识创新应用等。加强知识聚合、挖掘、转化的技术创新,活化中医古籍知识。①来源于不同机构、不同专题的资源如同“孤岛”分布,难以被有效地利用,需研制符合中医古籍资源特点的知识组织方法,将组织松散、异地分布的异构资源进行有序化再组织,优化知识表示和知识组织方式,建立不同专题相通概念的关联,实现一体化获取和利用,提高知识重用和共享能力。②中医古籍文献在文字、语言、检索、开发等方面存在信息利用障碍,而其中蕴含的理、法、方、药及辨证诊治等知识表示则更为复杂,针对中医药传承发展特点构建中医知识库,创新知识表示与挖掘利用方法,突破知识表示与组织、信息处理、应用功能局限等障碍,发掘历代医家经验等隐性知识,辅助服务临床与科学研究。③知识库作为运用知识的工具,应结合自身特点、适应用户需求、改进现有技术,提高技术与自身的契合度,实现科技与古籍的碰撞与融合。促进中医古籍知识“四位一体”转化,即隐性知识向显性转化、传统经验知识向现代知识转化、医学专业知识向普适性知识转化、疾病知识向健康知识转化。

3 结语

基于SWOT-PEST模型,分析了中医古籍知识库建设的内部与外部环境,针对性提出政策引导、优化模型、借鉴经验、促进共建、扩大宣传、精准服务、培养人才、技术创新、补充评价等策略,为中医古籍知识库建设提供参考。随着知识经济的发展,中医药研究呈现出多学科、行业共建、古今知识互融的研究趋势。推进中医古籍的知识服务是中医药文献领域研究的重要目标和方向,如何有效开发、利用中医古籍知识库,还需深入的理论探讨与实践。

猜你喜欢

知识库古籍中医药
中医古籍“疒”部俗字考辨举隅
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
关于版本学的问答——《古籍善本》修订重版说明
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
关于古籍保护人才培养的若干思考
从《中医药法》看直销
我是古籍修复师
中医药立法:不是“管”而是“促”
高速公路信息系统维护知识库的建立和应用