药品属性分类知识库的构建及其在我院药事管理数据分析中的应用
2019-09-10徐帆曾苏
徐帆 曾苏
中圖分类号 R917 文献标志码 A 文章编号 1001-0408(2019)20-2737-05
DOI 10.6039/j.issn.1001-0408.2019.20.01
摘 要 目的:为实践数据驱动的药事管理模式提供参考。方法:梳理药品属性分类信息及网络获取途径,并应用网络爬虫技术实现药品属性分类知识库的构建。在此基础上,应用自然语言处理技术及正则表达式匹配技术,对我院医院信息系统(HIS)中药品字典表与药品属性分类知识库的药品名称、规格、厂家等信息进行逐条比对,以实现HIS数据库和药品属性分类知识库两库药品编码的对应,并应用药品属性分类知识库进行医院药品使用数据分析。结果:应用所构建的药品属性分类知识库可快速而准确地分析医院抗菌药物使用情况、评价药品采购合规性并快速筛查出不合理用药案例。应用药品属性分类知识库及对照技术自主研发的“医疗机构药事管理分析与决策系统”,我院实现了医疗机构全处方点评,并能迅速聚焦并聚力解决如超剂量、超疗程、同种功能主治药物联合应用、超适应证用药等主要临床不合理用药问题。通过该处方点评模式的实践与应用,我院处方点评中上述问题已几乎不存在,抗菌药物使用等各项指标也均符合国家要求。结论:以医疗机构用药实际情况作为分析对象,通过现代信息技术使其与药品相关知识库形成关联,有利于药事管理的信息化建设。今后还需基于药事管理需求,应用现代信息技术构建不同用途和类型的知识库,为实践药事管理的数据驱动奠定基础。
关键词 药品属性;分类;知识库;药事管理;数据
ABSTRACT OBJECTIVE: To provide technical and practical basis for data-driven pharmaceutical management model. METHODS: The information of drug attribute classification and the way of network acquisition were studied, and the construction of drug attribute classification knowledge base was realized by using network crawler technology. On this basis, by using NLP technology and regular expression matching technology, the information of the dictionary table of medicines in HIS and the drug name, specifications and manufacturers in the drug attribute classification knowledge base were compared one by one. The correspondence of drug codes between “HIS database” and “drug attribute classification knowledge base” was realized. Finally, drug attribute classification knowledge base can be used to practice drug use analysis in medical institutions. RESULTS: Established drug attribute classification knowledge base can rapidly and accurately analyze the use of antibiotics, evaluate the reasonability of drug procurement and screen unreasonable drug use case rapidly. “Medical Institution Pharmaceutical Management Analysis and Decision-Making System” was established by using knowledge base of drug attribute classification and control technology. All prescription reviews had been realized with this system, and the main problems of irrational drug use in clinic, such as over-dose, over-course of treatment, combined use of main drugs with the same function and over-indication drug use could be solved. Through the practice and application of the prescription comment model, the above problems in our hospital’s prescription comment were almost nonexistent. Antibacterial use indicators were also in line with national requirements. CONCLUSIONS: It is beneficial to the information construction of pharmacy administration by linking actual use of drugs in medical institutions with drug-related knowledge base through modern information technology and taking the actual use of drugs in medical institutions as the object of analysis. In the future, it is necessary to build knowledge bases for different purposes and types based on the requirements of pharmaceutical administration. It lays a foundation for the practice of data-driven pharmaceutical administration.
KEYWORDS Drug attribute; Classification; Knowledge base; Pharmaceutical administration; Data
当前信息化技术在医疗领域中的应用已异军突起,各级医疗机构基本配备了自己的信息化平台,患者信息、临床诊疗及病程记录等管理大多数实现了电子化存储,使得医疗机构大数据应用成为可能[1]。然而,由于医疗机构系统(HIS)对于用药数据管理仍停留于采购、入库、出库、付款等普通物品管理模式[2],阻碍了以药品使用为中心的合理用药数据分析技术的应用与发展。为突破医疗机构药品信息不全、无法分类细化的瓶颈,实现医疗机构用药数据的深度分析,中国人民解放军联勤保障部队第920医院(以下简称“我院”)建立了药品属性分类扩展库并通过自动化药品对照技术拓展了医疗机构用药数据分析的深度与广度,并实现了药品信息的持续更新,为下一步实践药事管理的数据驱动奠定了技术基础,现报道如下。
1 药品的属性与分类
药品是特殊的商品,其具有物质属性、社会属性、治疗属性和商品属性[3]。物质属性按照药品的功能主治和功效划分,是医师根据病情选择用药的依据。其中,化学药品的功能主治属性分类多参照药品的解剖学、治疗学及化学分类系统(Anatomical therapeutic chemical,ATC)[4]。ATC分类法根据药物作用器官或系统以及药物特性将药物分为5个不同的级别,其分类依据参考药物解剖学、治疗学、药理学及化学特征。中成药的分类则有多种方法,如功效分类、病证分类、剂型分类和混合分类等[5]。其中,混合分类模式是将功效分类、病证分类等方法混合起来使用的一种分类模式,是目前中成药常用的分类模式。药品的社会属性根据其社会价值可分为国家基本药物和基本医疗保险药品;根据药品的安全性可分为普通药品、高危药品和特殊管理药品;根据不同时期药品的药政管理政策可分为抗菌药物、重点监控药物、短缺药物等。药品的治疗属性包括药品的适应证、用法、用量、不良反应及禁忌证等。药品的商品属性按照其注册类别可分为化学药品、进口药品、中成药、生物制品、保健药品,药品的生产厂家、规格及剂型均属于商品属性范畴[3]。
2 药品属性分类知识库的建立
以往我院HIS系统中仅存储了药品的名称、规格、厂家、生产批号、价格、剂型等有限的基础信息,仅通过这些信息开展医疗机构合理用药数据分析与应用是显然不够的。如果将前文所述药品属性应用信息技术与HIS系统中药品使用记录进行关联,则可实现从药品的不同属性多纬度对药物的应用情况进行透视分析,这将极大地拓展医疗机构用药数据分析的能力。
2.1 药品属性分类信息的获取途径
药品属性分类信息可通过药品说明书、工具书、互联网及专业信息系统及数据库获得。药品说明书是指导医师和患者安全用药的依据,在药品说明书中包含了药品的物质属性、社会属性、治疗属性和商品属性的绝大多数信息,但由于我国药品说明书并不通过网络公开,因此无法获得全样本药品说明书信息。要获取药品说明书,在国内目前只能通过联系生产厂家或是通过医疗机构人工收集。工具书属于二次文献,出版有一定的滞后性,且由于出版机构层次不同,其质量及所涵盖内容也存在差异。工具书对于查找某药品的相关信息比较方便,但要从工具书中整理全样本药品属性却只能通过人工整理,耗时耗力,且由于不同工具书侧重点也不同,故不能通过一种工具书获得全样本药品的所有属性分类信息。通过专业信息系统及数据库获取药品全样本属性同样存在工具书的上述弊端。互联网是目前最为简便、快捷获取药品属性的途径,利用互联网搜索引擎是获得药品属性相关信息的首选途径。
2.2 应用网络爬虫技术构建药品属性分类知识库
2.2.1 网络爬虫技术 网络爬虫,又被称为“网页蜘蛛”“网络机器人”,是一种按照一定的规则,自动抓取万维网(亦被称作“Web”“WWW”“W3”)信息的程序或者脚本[6]。在程序运行过程中,爬虫会从一个或者多个初始的统一资源定位符(Uniform resource location,URL)开始下载网页内容,之后通过搜索或者内容匹配的方法,从网页中“抓取”需要的内容,在“抓取”的同时,爬虫还会持续地从网页中获取新的URL[7]。
网络爬虫从一个或若干初始网页的URL开始,获得网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。所有被网络爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后查询和检索;对于网络爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。
网络爬虫架构主要由3个部分组成:网络爬虫调度端(负责开启网络爬虫主程序);网络爬虫主程序(负责访问目标网页);目标数据(负责抓取有价值的数据)[7]。其中,网络爬虫主程序分为5个部分:①爬虫调度程序(程序的入口,用于启动整个程序);②URL管理器(用于管理未抓取的URL及已经抓取过的URL);③网页下载器(用于下载网页内容);④网页解析器(用于解析下載的网页,以获取新的URL和所需内容);⑤网页输出器(用于把获取到的内容以文件的形式输出)。
2.2.2 基于Scrapy库的爬虫方法 Python是一种计算机程序设计语言,它的Requests库、Urllib库、Scrapy库和Pyquery库等均可用于爬虫[6-7],其中Scrapy库的使用最为广泛。Scrapy库是使用Python语言开发的、为抓取万维网上的网站数据而设计的开源应用型框架,可以应用在数据挖掘以及信息处理等方面,借助Scrapy库可以方便快速地按照需求保存网页关键数据为任意数据格式。
应用Scrapy库时,首先从爬虫中拿到第1个要请求的网址,通过调度器调度下载器进行页面下载,下载下来的页面信息由爬虫进行处理;爬虫从页面中提取数据信息并交给项目管道,而提取的网址信息则通过Scrapy engine交由调度器处理;项目管道接收到爬虫数据后对数据开始处理,处理之后保存为指定的数据格式;调度器获取到网址之后,重复以上操作,直至调度器里网址队列为空时,结束爬虫运行[8]。基于Scrapy库的网络数据爬虫方法如图1所示。
笔者应用自行编制的爬虫按前述药品属性分类获取方法实现了自动获取药品属性全量信息。存在多个获取途径的数据将通过数据比对并结合网站权威性确定最终录用数据。最终构建的药品属性分类知识库应用结构如图2所示。定期运行爬虫获取药品属性更新信息便可实现药品属性全量信息的实时更新。
3 药品属性分类知识库在我院药事管理数据分析中的应用
笔者应用自然语言处理(Natural language processing,NLP)技术及正则表达式匹配技术,对我院HIS系统中药品字典表与药品属性分类知识库的药品名称、规格、厂家等信息进行逐条比对,实现了HIS数据库和药品属性分类知识库两库药品编码的对应,为拓展HIS数据库中的药品属性作好了准备。在此基础上,笔者在HIS数据库中创建了药品属性分类信息表,将HIS数据库和药品属性分类知识库两库中药品编码能对应上的药品属性相关信息(如药品的商品信息分类、治疗属性信息分类、物质属性分类等)写入该表,用于对處方按药品属性从药理学分类、医保用药分类、药物经济学分类、药品商品属性分类等方面进行关联分析。通过该项操作实现了对药品相关数据分析能力的拓展,分析人员可以使用药品属性分类信息表中的任意分类项进行聚合查询,实现以药品属性为分析源的医院药品使用相关数据的分析。
3.1 在医院抗菌药物使用情况分析中的应用
《全国抗菌药物临床应用专项整治活动方案》[9]中明确了各级医疗机构抗菌药物品种数量、各类抗菌药物品规数量、Ⅰ类切口抗菌药物使用率等一系列管控指标。通过将药品属性分类信息库与HIS数据库中抗菌药物属性相关项进行关联,分析人员可先从HIS数据库中通过联合查询调取一定时期内医院用药医嘱信息,并将药品属性相关信息一并查出,再通过药品属性中对每种药物的抗菌药物分级分类标识进行聚合查询,即可实现通过医疗机构实际运行医疗数据分析其抗菌药物品规是否符合管理要求。同样,通过对药品属性中抗菌药物分级及限定日剂量标识的聚合查询就可精确计算医疗机构抗菌药物使用强度;通过科室分类的聚合查询就可分析抗菌药物使用分布等。下一步,笔者将持续优化药品属性分类信息库,进而深度评价医院其他类型药品使用情况的经济性与合理性。
3.2 在药品采购合规性分析中的应用
我国《处方管理办法》[10]第16条规定:“医疗机构购进药品时,同一通用名称药品的注射剂型和口服剂型各不得超过2种”。针对医院是否存在超品规问题,分析人员可先从HIS中调取一定时期内医疗机构药品采购记录,并将药品通用名及剂型标识一并查出,再通过药品属性中药品通用名及剂型标识进行聚合查询,就能通过该院实际药品采购数据分析其药品品规是否符合管理要求。下一步,笔者将重点研究如何通过药品属性中重点监控及短缺药品标识,对医院在用重点监控品种及短缺药物品种进行采购分析与限量、备量管理。
3.3 在不合理用药案例快速筛查中的应用
我国《医院处方点评管理规范》[11]中明确了不合理处方的定义、分类及范围。按照该分类及范围,我院将药品属性分类信息库与HIS数据库关联,通过药品治疗属性中标准用药剂量、用药疗程及治疗疾病分类信息的比对,可实现如超剂量用药、超疗程用药、无适应证用药等临床不合理用药的全面筛查,避免人工抽样点评有可能出现的遗漏。分析人员可从HIS数据库中调取一定时期内医疗机构药品使用记录并将药品属性相关信息一并查出,通过实际药品用量与药品治疗属性中的标准用量进行对比就能筛选出全部超剂量用药情况;以患者、住院次数、药品药理学分类属性进行聚类查询,就能筛选出同种功能主治药物联合应用;以患者用药疗程与该药标准治疗疗程对比就能筛选出超疗程用药行为;以患者用药功能主治与患者入院疾病对比就能筛选出无适应证用药行为。下一步,笔者将持续优化药品属性分类信息库进而对联合用药的合理性进行评价。
3.4 在数据驱动的处方点评模式中的应用
我院应用药品属性分类知识库及对照技术自主研发了“医疗机构药事管理分析与决策系统”,并早在2014年就构建了数据驱动的处方点评模式[12]。该模式一改传统临床药师仅凭个人经验人工审核临床用药问题的工作方法,而将处方点评分为4个步骤进行:(1)临床药师提出目前医疗机构处方点评问题模型;(2)信息药师将提出的点评模型实例化为系统查询功能;(3)临床药师应用该系统全量提取问题处方并进行问题纠治;(4)临床药师应用该系统监控药品动态变化,若发现异常,则提出新的问题模型。该模式在临床药师严重不足的情况下实现了全处方点评并聚力解决临床不合理用药的主要问题,如超剂量、超疗程、同种功能主治药物联合应用、超适应证用药等。通过该处方点评模式的实践,我院处方点评中上述问题已几乎不存在。我院全量处方不合理率自2015年起至2018年一直保持在0.05%以下,医嘱不合理率长期控制在0.24%以下。从宏观数据来看,我院在治愈及好转率保持不变(95%以上)的情况下,抗菌药物管控指标自2015年来持续达到国家要求,2018年门诊抗菌药物使用率为6.78%(国家要求:≤20%[9]),急诊抗菌药物使用率为24.03%(国家要求:≤40%[9]),抗菌药物使用强度为35.08(国家要求:≤40[9]),住院抗菌药物使用率为46.3%(国家要求:≤60%[9]),Ⅰ类切口抗菌药物预防使用率为24.4%(国家要求:≤30%[9]),微生物样本送检率(限制级抗菌药物)为54.97%(国家要求:≥50%[9]),微生物样本送检率(特殊级抗菌药物)为82.17%(国家要求:≥80%[9]);药占比从2013年的45.4%下降到2018年的29.1%(国家要求:≤30%[13]),重点监控药品使用金额占比从2013年的21%降至2018年的1.2%。下一步,笔者将不断拓宽该系统的分析功能,从个体患者用药分析评价出发,通过HIS系统辅助评价临床用药的安全性、经济性及合理性。
4 讨论
医疗数据的分析与应用是医疗机构合理用药管控的必由之路[14]。笔者尝试构建了药品属性分类知识库,并通过与HIS数据库进行关联的方法实现了对医疗机构真实用药情况的分析和干预,效果显著。本研究仅从药品属性角度实践了数据分析在医疗机构药事管理中的应用,患者分类、疾病分类及药品信息标准化等角度的知识库相关应用也可能成为未来知识库建立的方向和目标。因此,如何构建不同用途和类型的药事管理相关知识库、如何实现知识库的自动积累与更新,将成为药事管理数据分析必须解决的技术问题;如何实现HIS药品字典库与药品相关知识库的无缝融合(精准匹配)同样是知识库得以正确应用的技术关键。目前,我国基于不同疾病的用药知识库智能化管理系统的研究正不断涌现,例如张丽等[15]构建了消化系统用药知识库智能化管理系统,金蕾等[16]研发了抗菌药物知识库智能化管理系统等。但这些研究多集中于阐述知识规则的建立,如果将这些规则统一用于知识库中,将从疾病治疗领域开拓数据驱动合理用药管理模式的新途径。
综上所述,笔者通过建立药品属性分类知识库,并应用该知识库对医疗机构用药数据进行分析,初步验证了知识库及其分析技术应用于药事管理的可行性及优势。以医疗机构用药实际情况作为分析对象,通过现代信息技术使其与药品相关知识库形成关联,有利于药事管理的信息化建设。今后还需基于药事管理需求,应用现代信息技术去构建不同用途和类型的知识库,为实践药事管理的数据驱动奠定基础。
参考文献
[ 1 ] 王云云.大数据技术在医疗领域的应用[J].电脑知识与技术,2015,11(13):18-19.
[ 2 ] 冯晓燕.医院HIS系统在药品管理中存在的问题及改进[J].通讯世界,2015,12(6):227-228.
[ 3 ] 刘兰茹,兰恭赞.谈药品的属性和分类[J].中国药事,2008,22(2):96-98.
[ 4 ] 陈红斗,蒋进广,朱秀银.ATC分类编码和中成药分类编码比较分析[J].南京中医药大学学报,2013,29(6):510-513.
[ 5 ] 孟菲,王宏贤,唐进法,等.中成药不同分类模式的分析及科学分类模式的探讨[J].中医研究,2015,28(3):70-72.
[ 6 ] MIHĂILĂ P,BĂLAN T,CURPEN R,et al. Network automation and abstraction using python programming me- thods[J]. MACRo,2017,2(1):53-56.
[ 7 ] 魏冬梅,何忠秀,唐建梅.基于Python的Web信息獲取方法研究[J].软件导刊,2018,17(1):41-43.
[ 8 ] TAN Q,MITRA P. Clustering-based incremental web craw- ling[J]. ACM T Inform Syst,2010,28(4):1-27.
[ 9 ] 卫生部.全国抗菌药物临床应用专项整治活动方案[S].2011-04-18.
[10] 卫生部.处方管理办法[S].2007-05-01.
[11] 卫生部.医院处方点评管理规范:试行[S].2010-02-10.
[12] 徐帆,曾苏.数据驱动的医疗机构处方点评模式实践[J].华西药学杂志,2019,34(2):197-200.
[13] 国务院.关于城市公立医院综合改革试点的指导意见[S].2015-05-17.
[14] 孟威宏,史国兵,赵庆春,等.促进医疗机构合理用药的对策[J].中国药房,2011,22(5):385-387.
[15] 张丽,杨耀芳,朱建萍,等.消化系统用药知识库智能化管理系统的应用[J].中国药师,2019,22(2):378-380.
[16] 金蕾,杨耀芳,汤春红,等.社区医院用不同分级管理抗菌药物知识库智能化管理系统开发[J].中国全科医学,2018,21(11):1382-1386.
(收稿日期:2019-01-08 修回日期:2019-09-04)
(编辑:余庆华)