APP下载

巴蜀中医古籍知识库建设思路的探讨

2024-12-31张肖瑾林英赵琼

文化创新比较研究 2024年32期

摘要:巴蜀中医药古籍是极具地方特色的珍贵民族文化遗产和精神财富,为我国中医药事业的发展增添了光辉篇章。目前,巴蜀中医古籍存在存藏状况不清、整理研究欠缺、古籍所蕴含的知识传承推广艰难等问题。巴蜀中医古籍知识库集书目、全文数据、深度挖掘利用为一体,以建设综合性数据集成知识库、构建可开展深层次知识挖掘的中医古籍数据平台为目标,以巴蜀中医古籍原始文献库、巴蜀中医温病特色专题库、巴蜀中医手稿文献库、巴蜀中医名家处方脉案库等为建设内容,以期为巴蜀中医药研究提供便捷、高效、多样的检索与知识发现路径,促进巴蜀中医药学术的传承和创新发展,同时为同类中医古籍知识库建设提供参考。

关键词:巴蜀;中医;古籍;知识库;建设思路;设计

中图分类号:G255.1;G250.74;R2 文献标识码:A 文章编号:2096-4110(2024)11(b)-0098-05

Discussion on the Construction of the Knowledge Base of Traditional Chinese Medicine Ancient Books in Bashu

ZHANG Xiaojin1, LIN Ying1, ZHAO Qiong1,2

(1. The Library, Chengdu University of Traditional Chinese Medicine, Chengdu Sichuan, 611137, China; 2. Hospital of Chengdu University of Traditional Chinese Medicine / School of Clinical Medicine,Chengdu Sichuan, 610075, China)

Abstract: The ancient books of traditional Chinese medicine in Bashu are precious cultural heritage and spiritual wealth with local characteristics, adding a glorious chapter to the development of China's traditional Chinese medicine industry. At present, the storage status of ancient Chinese medicine books in Bashu is unclear, and there is a lack of sorting and research. The knowledge contained in ancient books is difficult to inherit and promote. The Bashu Traditional Chinese Medicine Ancient Book Knowledge Base integrates bibliographic data, full-text data, and deep mining and utilization, with the goal of building a comprehensive data integration knowledge base and constructing a traditional Chinese medicine ancient book data platform that can carry out deep level knowledge mining. The construction includes the original literature library of Bashu traditional Chinese medicine ancient books, the special topic library of Bashu traditional Chinese medicine warm diseases, the manuscript literature library of Bashu traditional Chinese medicine, and the prescription book library of Bashu traditional Chinese medicine masters, in order to provide convenient, efficient, and diversified retrieval and knowledge discovery paths for the research of traditional Chinese medicine in Bashu, and promote the inheritance and innovative development of Bashu traditional Chinese medicine academia. At the same time, it provides reference for the construction of similar traditional Chinese medicine ancient book knowledge bases.

Key words: Bashu; Traditional Chinese Medicine; Ancient books; Knowledge base; Construction ideas; Design

巴蜀中医药源远流长,《山海经》中就有先秦巫医在巴蜀的活动轨迹记载。此后,在巴蜀地区独特的地域环境下,孕育出众多巴蜀医家,其独特的临床辨证施治、鲜明的用药特色、丰富的医学著作等,促进了我国中医药学术理论的创新发展,是独具特色的宝贵民族文化遗产和精神财富。

2019年,《中共中央 国务院关于促进中医药传承创新发展的意见》提出,要“挖掘和传承中医药宝库中的精华精髓,加强典籍研究利用”,要“建立国家中医药古籍和传统知识数字图书馆”等。2023年,《“十四五”中医药文化弘扬工程实施方案》提出“推动中医古籍的数字化挖掘”等。在当前国家大力弘扬中华传统中医文化的背景下,紧跟巴蜀中医药研究发展趋势,加快推进中医典籍传承、文献的收集整理及数字化信息处理,加大巴蜀中医药研究数据支撑平台建设势在必行。

1 中医古籍知识库研究现状

信息化和大数据时代的到来,为古籍文献资源智能处理开启了崭新篇章。古籍数字化是指采用计算机技术,将语言文字、图形,转化为计算机可识别的数字符号,其目的在于保护和利用古籍,是未来古籍进一步开发、利用和保护的关键。随着信息技术的发展,古籍数字化的内涵不断丰富,包括对古籍内容的断句、标点、实体识别及内容分析等[1-3],逐渐从单一的古籍目录、图像库转为古籍数智库[4]。

在对古籍的研究中,中医古籍是最早被关注与研究的对象。目前,中医古籍数据库按照内容不同,可以分为医家专题、地域专题、学科专题等专题数据库和《黄帝内经》《针灸大成》等专书数据库,按照数字化深度可以分为书目数据库、全文数据库和知识库。其中,知识库结合了数据库与人工智能的特点,可提供专业化、精准化、特性化的古籍文献的检索、阅读及深层次挖掘服务,在信息的高效获取、知识挖掘、学术传承等方面具有优势[5]。近年来,研究者针对中医古籍知识库开展了许多有益探索,如邹晓岚[6]通过对温病学派古籍知识多角度描述,构建温病学派古籍知识检索系统。卢克治[7]提出基于深度神经网络对中医古籍命名实体识别及抽取,构架中医古籍知识图谱库。汤伟平[8]等将本体引入岭南温病古籍知识库的构建,挖掘岭南地域古籍隐含知识,实现古籍文献知识提取、推理及发现。李贺等[9]基于本体,对简帛医药抽取实体概念及实体关系,并构建简帛医药文献知识图谱。目前,我国中医古籍数字化资源建设已取得一些可喜成绩,部分实现隐性知识的挖掘,但存在中医古籍知识库建设标准制定不统一,知识库资源不足、数据量少及挖掘结果存在局限性等问题。

巴蜀中医作为中国独具特色的地域医学流派,在中国悠久的医学发展史中占据了举足轻重的地位。历经数千年的传承与发展,巴蜀中医古籍所承载的学术思想和丰富的临床经验,是巴蜀中医实践的真实写照,形成了巴蜀中医独特的诊疗体系和风格,是巴蜀中医学术传承与进步的宝贵财富。四川振兴中医工作开展以来,巴蜀中医药及其文献研究都取得了长足进步,但目前巴蜀中医古籍存藏状况不清,存在重藏轻用、整理研究欠缺、古籍文献资源未被深度发掘整理和利用、古籍知识传承推广艰难等诸多问题。

2 巴蜀中医古籍知识库建设的意义

2.1 促进巴蜀中医药文献深入研究、挖掘利用

信息时代为中医学术传承提供了新的路径。利用现代信息技术将巴蜀中医古籍文献中的文字或图像转化为可被计算机系统识别的信息数据,建立巴蜀中医古籍书目数据库、全文数据库及知识库,进而实现海量文献的整理、存储、检索、阅读、传输等,最终达到保护、利用和挖掘文献知识的目的。巴蜀中医古籍知识库平台的探索构建,不仅是巴蜀特色中医古籍再生性保护工作的重要内容,更是在中华传统中医文献知识载体改变的前提下,为深入研究、挖掘利用巴蜀中医文献开辟了更广阔的学术研究空间。

2.2 助力中医古籍知识开放协作、共建共享

目前,中医古籍文献数字化已经取得显著成效,并建立了不同类型的数据库,很大程度上实现了保护和利用中医古籍文献的目的。近年来,在数字人文思想影响下,将语义技术、数据库技术与特色文献相结合,开启了古籍文献资源智能处理的新篇章,实现共建共享。知识库作为高效保管知识的工具,在解决海量信息无法得到充分利用的情况下有着现实的意义,是未来中医古籍研究的发展趋势。基于地域性流派的综合性古籍文献知识库建设还处于起步状态,“巴蜀中医古籍知识库平台”将进行积极有益的探索和实践,注重数据平台的可持续扩展,为技术的更新升级及文献的渐次深度挖掘奠定良好基础。

2.3 推动巴蜀中医药的传承与发展

巴蜀中医药在促进中国医学的学术发展中具有举足轻重的作用。汉代的涪翁、程高、郭玉,晋代的李常在、李八百,唐代昝殷,宋代本草学家唐慎微等医家学术著作颇丰,如《玉函经》《经效产宝》《经史证类备急本草》《史载之方》《韩氏医通》等对后世医学产生了深远的影响,形成了独具特色的巴蜀医学。在川渝两省市强势联动发展的当下,系统全面收集各个时期巴蜀地区中医药文献资源,建立巴蜀中医古籍数字平台,将古籍的特点与现代信息技术的优势相结合,实现多功能、多层次、多维度的资源服务模式,对发挥巴蜀中医药优势与特色、促进巴蜀中医药文化传承十分重要,对我国传统古籍文献的现代化整理与利用具有积极的示范引领作用。

3 巴蜀中医古籍知识库的构建

3.1 建设思路

巴蜀中医古籍知识库核心内容是依据多层次、细粒度的数字化巴蜀中医文献知识点,构建多层级知识标注的文献知识库,并围绕该知识库挖掘巴蜀中医文献的知识传承和演化脉络。建设过程主要遵循巴蜀中医文献及相关信息资源的数字化、中国古代医学文献的多层级语义标注及知识库构建,基于多层标注中医古籍知识库的知识挖掘这一主线展开,以提供综合性巴蜀中医研究的数据支撑。

3.2 建设内容

根据内容侧重不同,巴蜀中医古籍知识库以巴蜀中医古籍原始文献库为主题,涵盖巴蜀中医温病特色专题库、巴蜀中医手稿文献库、巴蜀中医古籍修复档案库,并拓展延伸建设巴蜀中医名家处方脉案库、巴蜀中医文献展厅等。

3.2.1 巴蜀中医古籍原始文献库

巴蜀中医古籍原始文献库存储数字化扫描的原始图像及其元数据。巴蜀地区名医辈出,留存了大量的中医古籍,记载了丰富的中医知识,具有重要的文献价值。古籍数字化后,读者可通过数据库进行相关文献的查阅,避免翻动造成古籍损坏,是保护和传承巴蜀中医古籍的重要途径。

3.2.2 巴蜀中医温病特色专题库

温病是感受温邪引起的一类外感急性热病的总称。现代医学中许多急性传染性疾病均属于瘟病的范畴,如麻疹、伤寒等。温病学的发展经历了漫长的过程,有效防治了对人类健康带来极大危险的感染性疾病。巴蜀中医温病特色专题库的建立,对于“传承精华,守正创新”,发挥中医药防病治病的优势与作用,增强中医自信,造福社会,皆有重要意义。

3.2.3 巴蜀中医手稿文献库

稿本是一部书的原始形态,包含作者的早期思维轨迹、思想发展脉络,是传承至今未经修改的作者思想呈现载体,具有重要的文献价值。作为古籍文献流通的重要补充形式,稿本相较于印刷刻印版本的古籍而言,具有稀缺性、原真性的特点,从而具有重要的学术研究价值。许多中医书法造诣颇深,其手写的文献同时兼具书法价值。巴蜀中医手稿库的建立,旨在将“束之高阁”的珍贵原始文献资料以数字资源方式化身千百,嘉惠杏林,促进中医药文化资源的整理及挖掘利用。

3.2.4 巴蜀中医名家处方脉案库

医家手写的处方、医案反映了医家的辩证思路、临床用药风格等,是研究巴蜀中医的重要资源,极具文献和临床研究价值。巴蜀中医名家处方脉案库的建立,为系统研究巴蜀中医的学术思想、用药特色及近现代巴蜀中医的发展提供文献支撑,为中医药文化提供新的理论依据,推动中医药事业的发展。

3.2.5 巴蜀中医古籍修复档案库

受自然条件、保存条件等影响,传世古籍经历了战火、离乱,其中有大量的古籍存在糟朽、絮化、粘连等情况,而当前古籍修复人员严重不足,出现古籍传承保护与利用的矛盾与危机。巴蜀中医古籍修复档案库的建立旨在为古籍修复与保护提供优秀的修复案例和修复档案,为古籍修复提供优秀的成果借鉴,延续古籍寿命,促进中医古籍的传承与发扬。

3.2.6 巴蜀中医文献展厅

巴蜀地区名医辈出,或悬壶巴蜀或外地游历或收徒传授或著书立说,为中医传承及发展作出了重要贡献。巴蜀地区中药资源丰富,中药种类及道地药材数量居全国前列。巴蜀中医文献展厅旨在通过图片、音视频等资料线上展示巴蜀中医名家风采、信函往来及巴蜀特色中药材等,以彰显前贤、鼓励后学。

3.3 结构设计

对数据进行探索性分析,包括空缺值比例统计、特征分布统计、特征拓展及变量相关性分析等,根据数据探索性分析的结果,对巴蜀中医古籍数据进行预处理及合理的特征选择构建知识库。对主题数据进行管理和维护,以支持后期可能会进行的数据修正和数据更新操作;数据挖掘处理,通过采用传统数据挖掘方法,如关联规则、贝叶斯分类等进行关联、分类知识的发现;统计用数据导出,通过条件筛选,导出指定统计用数据子集等。数据库平台设计核心包括数据管理层(资源中心)、数据承载层(平台支撑)和用户层。

3.4 技术应用

开发系统中所有应用都是基于JavaEE,拟采用B/S模式的基于网络的Web应用程序架构。服务器采用Linux操作系统,后台数据库使用mysql,使用JAVA语言的MVC开发模式,辅以html语言进行页面展示,开发工具使用IDEA、Navicat for MySQL、JavaScript等。各用户通过使用浏览器访问系统服务器,采用用户身份证实名认证机制和用户密码加密等技术,保证数据信息的传输安全。前端开发技术采用成熟的Bootstrap、Layui、Viewer实现,json格式实现数据的交换。

3.5 设计特色

目前,各高校图书馆、公共图书馆建设的中医古籍数字资源库仍以书目数据库、全文影像数据库为主,少数商用数据库能实现全文检索,但检索方式单一,缺乏对古籍内容的深度挖掘,主要侧重点还是资源型服务。某些高校图书馆自建的古籍数据库,“还只能实现单一词条检索,虽然查全率有保证,但是查准率太低”[10]。在信息技术飞速发展的今天,从建设资源型服务数据库转向提供知识型服务的知识库是古籍数字化发展的趋势,也是未来主流技术的发展方向。

3.5.1 知识性服务特色

巴蜀中医古籍知识库立足于丰富的巴蜀中医古籍资源,在做好基本资源型服务的基础上,通过对中医古籍进行多层次、细粒度的知识标注,实现知识点的提取,并将各知识点关联与整合,能够进行多个维度的关联检索。在此基础上,通过对古籍内容知识的数据分析及预处理,构建知识仓库,为研究者提供较为深入的知识型服务。这不仅是适应古籍数字化工作的新要求,同时也是落实国家“十四五”规划提出的“构建智慧图书馆”目标的积极尝试。

3.5.2 系统功能设计特点

长期以来,各高校图书馆、公共图书馆各自为政,缺乏统一的建设标准,在一定程度上造成了数据资源的重复和浪费[11]。巴蜀中医古籍知识库的系统功能模块在开放共享、资源集成、用户体验等方面进行多方有益尝试。巴蜀中医古籍知识库在建设之初,需充分考虑资源共享的需求。系统中预留了OAI-PMH标准元数据共享收割接口、RDF管理接口,以拓展升级古籍元数据共享、大数据整理、知识图谱展示等功能,为后期实现馆际共享、扩充资源库内容做好准备。在资源建设方面,系统需支持图片、文字、音频、视频等多种资源格式,最大限度地保留了巴蜀中医古籍资源的完整性、有效性,实现巴蜀中医古籍资源收集、展示、利用的多样性特色。此外,针对自学难以领会中医药知识内涵的情况,加入音频、视频资源,帮助初学者理解中医药基础知识,提升知识库服务效能。同时,将线上资源延伸到线下,通过线下展厅的数字终端将巴蜀中医古籍知识库的资源内容面向公众进行展示展览,拓宽服务路径。

巴蜀中医古籍知识库采用本地化部署OCR文字识别软件,可以较好地保障用户自身资源和数据的安全。同时,OCR软件可根据用户使用情况进行人工智能训练,自动提升准确率。此外,后台管理系统增加多个个性化功能,可设置多级管理权限,嵌入古籍著录、古籍修复等多种管理工具,针对实际需求设计工作流程、定制功能模块、优化业务流程、提升优化用户的体验和观感,实现古籍内容的增值利用、可视化展示及知识挖掘。巴蜀中医古籍知识库的系统设计构想以此为基础,在实际的操作和运行中,坚持以用户需求为导向,根据用户使用体验及古籍资源分类整理情况不断做出调整,持续优化和完善相关功能,更好地发挥自身效能。

4 对中医古籍知识库构建的建议

4.1 加快中医古籍知识库建设标准制定

中医古籍知识库作为存储和利用中医文献的数据平台,对中医药的传承研究工作具有重要价值。构建多层次、多系统认可的,从元数据著录、数据格式、图像处理、平台搭建等方面设立标准的中医知识库,有助于更大范围的资源共建共享,并避免重复和资源浪费,同时为各单位的古籍知识库建设工作提供规范化指导。

4.2 丰富中医古籍知识库建设资源

海量的资源是中医古籍数据库建设的基础,决定数据库价值的重要因素。目前,中医古籍主要存于省市各级公共图书馆、高校图书馆,单一馆的存储量有限,且多数善本秘藏易于被“庋藏深闺”。针对这一难题,在数据库建设时,通过多方合作,扩充数据库资源,同时探索基于中医药文献本体的知识组织与知识检索理论、方法,构建实现知识的相关性与智能检索的综合性知识库平台,是解决上述问题的重要途径。

5 结束语

巴蜀中医药文化作为巴蜀文化的重要组成部分,在中医的发展和学术研究中具有举足轻重的作用,孕育了众多名垂青史的医药大家,其临床经验及治学方法是极其宝贵的民族文化遗产和精神财富。巴蜀中医古籍知识平台的建设,有效解决了长期以来古籍“藏”与“用”的矛盾,用户足不出户即可检索、阅读、整理、分析所需资源,将有效降低用户对传统纸质文献和藏书馆的依赖、大大节省科研成本、提高科研效率、推动巴蜀中医学的发展和研究,对巴蜀中医文化的宣传、普及具有重要意义。同时,基于地域性流派的综合性文献知识库建设的积极有益探索和实践,极具现实应用价值和指导意义。

参考文献

[1] 李明杰,杨璐嘉.基于GIS的明代古籍版刻地理信息系统的设计与实现[J].信息资源管理学报,2020,10(3):125-133.

[2] 欧阳剑,梁珠芳,任树怀.大规模中国历代存世典籍知识图谱构建研究[J].图书情报工作,2021,65(5):126-135.

[3] RUSSO G,AIOSA L,ALFANO G,et al.MAGIC:Manuscripts of Girolamini in Cloud[J].IOP Conference Series Materials Science and Engineering, 2020,949:12081.

[4] 陈涛,杨鑫,夏焱,等.古籍知识库互联互通框架研究与设计[J].大学图书馆学报,2023,41(4):58-64.

[5] 李筱颖,李鸿涛,张伟娜,等.基于SWOT-PEST模型的中医古籍知识库建设策略分析[J].世界科学技术-中医药现代化,2023,25(6):1927-1934.

[6] 邹晓岚.温病学派古籍的知识图谱构建与应用[D].长春:长春中医药大学,2023.

[7] 卢克治.基于中医古籍的知识图谱构建与应用[D].北京:北京交通大学,2021.

[8] 汤伟平,许坚,李兵,等.岭南温病古籍知识库构建的思路探讨[J].中国医药导报,2020,17(11):136-139.

[9] 李贺,祝琳琳,刘嘉宇,等.基于本体的简帛医药知识组织研究[J].图书情报工作,2022,66(22):16-27.

[10]曹霞,李君.我国高校中医古籍数字化建设的再思考[J].中文科技期刊数据库(全文版)图书情报,2021(6):164-166.

[11]王咏梅,高宇,任书俊,等.安徽中医药古籍书目提要数字化建设探析[J].合肥师范学院学报,2023,41(3):5-9.

基金项目:四川省社科联项目“巴蜀中医古籍知识库平台构建”(项目编号:SC22A025);四川省社科联项目“苏轼医学思想整理研究及知识图谱构建”(项目编号:SCJJ23ND263);四川学术成果分析与应用研究中心项目“数字人文视野下川派名医处方笺的整理研究”(项目编号:SCAA24-B07);成都市社科联项目“成都名中医处方笺整理及知识图谱构建研究”(项目编号:2024CS088)。

作者简介:张肖瑾(1990-),女,山西运城人,硕士,副研究馆员。研究方向:馆藏文献资源建设,中医古籍数字化建设及文献研究。

通信作者:赵琼(1972-),女,四川乐山人,博士,教授。研究方向:中医学临床及文献研究。通信邮箱:823691452@qq.com。