APP下载

专题导语: 中医疫病古籍组织整理与知识发现

2025-02-16李贺

现代情报 2025年2期
关键词:分词古籍规律

历代中国医学家在探索瘟疫防治理论与技术的实践中遗存了宝贵的疫病古籍, 它们是中医古籍的重要组成部分。中医药全面介入新冠肺炎疫情等重大突发公共卫生事件并发挥出传统医学的独特优势, 再次表明, 中医古籍特别是疫病古籍是新时代护佑人民健康、建设健康中国战略的文化瑰宝。国务院办公厅印发的《“十四五” 中医药发展规划》提出: “实施中医药古籍文献和特色技术传承专项”, 为中医古籍焕发新光彩提供了行动指南。以此为契机, 在广泛搜集组织整理中医疫病古籍数字资源基础上, 综合利用知识组织、知识管理和知识挖掘等技术, 发现疫病古籍中蕴含的防病治病经验和用药规律, 进而利用自然语言处理、语义网、信息可视化等技术, 构造文化传承驱动下可提供疫病知识服务、技术发展驱动下可发挥疫病知识宣传和科研需求驱动下可满足疫病知识挖掘的智慧化中医疫病知识服务平台, 实现疫病古籍的活化再现与智能计算, 是促进中医文明创造性转化和创新性发展的重要路径。

在推动中医古籍传承与保护的政策驱动下, 立足于新文科建设背景, 专题围绕着中医古籍中的疫病古籍整理、知识组织与智慧化建设的长期研究方向, 旨在从学科交叉视野出发, 结合信息资源管理一级学科知识管理与服务专长, 为中医疫病古籍传承和活化提供新的工具与方法, 在深化学科交流合作的同时, 形成一套标准化、语义化、可视化的, 面向中医疫病古籍数字资源的智慧化知识服务平台和整体解决方案。为此, 本专题包含以下3 篇文章:

在中医文本相关研究中, 命名实体识别(NER)作为一种重要的自然语言处理技术, 能够有效提取出文本中的药物、疾病、症状等实关键信息, 进而为中医知识的整理与挖掘提供支持。《中医文本命名实体识别研究综述》聚焦于中医文本中命名实体识别技术的创新与应用。通过系统性综述中医文本的特征与NER 挑战, 研究梳理了中医文本NER 在语料构建、技术算法及评估指标等方面的研究现状, 指出了目前存在的问题, 并提出未来的研究方向。在语料层面, 建议制定标注规范并构建高质量数据集; 在算法层面, 探索针对小样本问题的数据优化和复杂实体的识别模型, 以提高模型的准确性和解释性。这一综述旨在推动中医NER 技术的发展, 为后续中医知识抽取与知识组织研究提供参考。

先前基于知识图谱的中医知识演化研究忽视了疫病知识的动态发展变化规律, 降低了中医疫病学发展过程中的知识完整性以及知识动态演变规律的系统研究。融合动态元素实现疫病知识组织基础上的隐性疫病知识发现为中医疫病古籍利用提供了新视角。鉴于此, 《基于动态知识图谱的中医疫病古籍知识演化研究》以温病学派古籍为例, 通过构建融合动态元素的知识元语义描述模型, 对温病学派古籍进行了涵盖时间和属性特征的全面知识组织。在构建并可视化展示温病学派疫病知识动态演变过程的动态知识图谱基础上, 借助知识计算方法对该学派各发展阶段的知识内容进行了深层次的演化分析, 通过挖掘用药偏好、方剂演变和辨证理论发展等隐性知识的动态变化规律, 一定程度上厘清了中医疫病的知识发展脉络、中医知识创造规律, 为据此更新中医用药诊疗创新思路提供了支持。

中医疫病古籍文本拥有疫病术语的专业性和古籍表达的特殊性, 导致通用分词模型工具无法实现疫病古籍文本的精确分割, 阻碍了疫病古籍中蕴含的用药规律和防病治病经验的挖掘利用。因此,《基于中医疫病古籍文本自动分词的药物规律挖掘研究》提出了一个包含数据获取层、序列标注层、自动分词层和应用服务层的中医疫病古籍文本自动分词及药物规律挖掘框架, 通过将提出的框架应用于疫病古籍语料库, 实验结果表明, 深度学习算法在中医疫病古籍文本自动分词任务中性能良好。分词提供了准确的数据基础, 而深入分析这些数据则进一步揭示了中医药物使用的内在规律和治疗原则, 二者相辅相成, 共同推动着中医学的传承和发展。在分词基础上, 通过方剂中的各类剂型统计、部分常用中药统计和部分常用药对统计, 文章实现了中医疫病领域古籍文本词汇级药物规律挖掘初步应用, 这为日后疫情防控、诊疗决策辅助和人文计算工具的智慧化开发提供了参考。

李 贺吉林大学商学与管理学院教授、博士生导师

猜你喜欢

分词古籍规律
中医古籍“疒”部俗字考辨举隅
规律睡眠中医有妙招
关于版本学的问答——《古籍善本》修订重版说明
找规律 画一画 填一填
找排列规律
结巴分词在词云中的应用
关于古籍保护人才培养的若干思考
我是古籍修复师
值得重视的分词的特殊用法
巧解规律