中药种质资源信息系统的设计与实现
2017-05-11刘伟丁长松梁杨
刘伟+丁长松+梁杨
摘要:中药种质资源信息系统是为了提高中药种质资源的管理效率,整合并分析中药种质资源数据,实现中药种质资源的信息化管理,更好地为科研机构、政府、企业以及药农等服务,系统包含信息库、文献库、基因库3个数据库,13个功能模块。该系统既有助于对中药种质资源相关数据的管理,又便于数据的集成、分析和统计,进而挖掘数据中潜在的规律和模式,并提供灵活的数据比对和可视化等功能,具有重要的实用价值和研究价值。
关键词:中药;种质资源;信息系统;数据库
DOI:10.3969/j.issn.1005-5304.2017.05.002
中图分类号:R2-05 文献标识码:A 文章编号:1005-5304(2017)05-0005-03
Design and Implementation of Germplasm Resources Information System for Chinese Medicines LIU Wei, DING Chang-song, LIANG Yang (School of Management and Information Engineering, Hunan University of Chinese Medicine, Changsha 410208, China)
Abstract: Germplasm Resources Information System for Chinese Medicines (GRIS-CM) is designed and realized for improving the management efficiency of the germplasm resources for Chinese materia medica. The system integrates and analyzes the germplasm resources data, realizes information management of the germplasm resources for Chinese materia medica, and provides better services for scientific research institutions, governments, enterprises and medicinal herb growers. It contains 3 databases and 13 function modules, including the basic information base, literature library and gene bank. GRIS-CM can help manage the related data of germplasm resources for Chinese materia medica, and is better for data integration, analysis and statistics to find the rules and patterns. GRIS-CM provides flexible data comparison and visualization functions, and has significant practical value and research value.
Key words: Chinese materia medica; germplasm resources; information system; database
種质资源又称遗传资源或基因资源,是生物资源的重要组成部分。中药种质资源是中药材引种栽培和资源保护的基础,是实施“中药材生产质量管理规范”(GAP)的保证,也是确保下游产品等效性与安全性以及促进中药行业可持续发展的基石。中药种质资源的基础数据、文献资料及基因数据等对于中药行业的可持续发展具有重要意义。
由于中药种质资源数据规模较为庞大,采用传统人工管理方法查询和处理信息的效率较低,难以实现对种质资源实体库中数据的实时调查、统计分析和相关查询,不能科学、高效、直观地提取和呈现数据中存在的信息,也无法全面、真实地记录中药种质资源的生态环境及地理分布等信息;此外,文献库、信息库和基因库相互独立,不利于信息的整合和关联分析,也无法提供数据的可视化、数据比对、数据挖掘等功能。因此,建设功能完善、设计合理、操作简便的中药种质资源信息系统及相应的文献库、信息库和基因库的意义重大,一方面有利于中药种质资源的管理,另一方面有利于相关数据的集成、分析和统计,进而挖掘潜在的规律和模式,并提供灵活的数据比对和可视化等功能。
中药种质资源信息系统的建设,可实现对中药种质资源信息的集中管理和资源数据的共享,为研究者和生产者全面了解中药种质的特性、拓宽优质资源和遗传基因的使用范围、培育优质高产的中药材提供新的手段,对中药行业的发展大有裨益。作为第三批湖南省高等学校“2011协同创新中心”——湖湘中药资源保护与利用协同创新中心之中药种质资源实体库相配套的信息系统,是由湖南中医药大学药学院中药鉴定与资源实验室和湖南中医药大学管理与信息工程学院信息系联合开发的一套中药种质资源信息系统(Germplasm Resources Information System for Chinese Medicines,GRIS-CM),该系统集中药种质资源基础信息、地理分布信息、数量与质量信息、专家信息、市场信息、商业信息、文献数据、基因数据于一体,可为中药种质资源提供专业、全面的信息服务,具有重要的科研价值和社会价值。兹就GRIS-CM相关情况介绍如下。
1 系统分析与设计endprint
1.1 系统核心功能分析
GRIS-CM主要用户包括相关政府部门工作人员、种质资源研究人员、药农和药企。系统管理员可以为注册用户分配相应的功能权限,在默认情况下,所有用户都能够实现对中药种质资源数据的查询、浏览、统计和比较等操作。
GRIS-CM提供了包括中药种质资源基础数据查询比对模块(提供数据查询、对比分析、照片及视频显示等功能)、中药种质资源基础数据统计分析模块(提供数据统计分析、可视化显示统计结果、种质资源地图、种质资源Web GIS等功能)、中药种质资源基础数据管理模块、中药种质资源市场及商业信息应用模块等13个基础功能模块。详见图1。
1.2 系统架构设计
GRIS-CM采用多层B/S(Browser/Server,浏览器/服务器)架构,系统整体架构包括5层,分别是数据层(包含3个具有关联性的中药种质资源数据库,分别用于存储中药种质资源基础数据、文献数据及基因数据)、数据访问层(实现对数据库进行增、删、改、查等基本操作)、数据处理层(基于数据挖掘、机器学习、统计分析等技术,提供数据分析和应用研究功能)、业务逻辑层(实现信息系统的业务功能)和用户接口层(为用户提供数据查询、显示、分析、统计等操作界面)。详见图2。
另以图2中的分层架构作为基础,对每一层进行详细设计。数据库设计中每一个关系均满足第三范式的要求,尽量减少冗余的数据。由于不同的中药需使用不同属性描述其种质资源,因此,在设计中药种质资源基础数据库时,针对每一种中药都创建了相应的关系表,不同中药种质资源基础数据表中的字段有所异同,用于完整地保存每一种中药的种质资源数据。
2 系统实现
2.1 技术实现方案
GRIS-CM基于Oracle公司的主流软件开发平台Java EE,以及Microsoft公司的主流数据库管理系统Microsoft SQL Server。采用主流面向对象编程语言Java实现系统功能,以JSP+Servlet+JavaBean实现系统的表示层(View)、控制层(Controller)和模型层(Model);Web应用的服务器端部署在Linux操作系统上,服务器中间件采用Apache Tomcat;数据库部署在Windows操作系统;Web应用系统通过JDBC与数据库互联;用户界面层主要采用JSP、HTML、CSS实现,部分富客户端功能使用了HTML5&CSS3及JavaScript(jQuery+JSON)等技術。详见图3。
2.2 系统物理结构
GRIS-CM物理架构(部署结构)分为3层:数据库服务器负责数据的存储和管理,独立数据库服务器可提高系统整体运行性能、安全性和可靠性,数据库服务器需要较大的物理存储空间,配备较大存储容量硬盘;应用服务器负责业务功能程序的执行、数据分析及挖掘相关程序,应用服务器需要具有较强的计算能力,需要配备较大的内存和主频高的处理器;客户端浏览器负责数据的输入和呈现,浏览器端负责Web页面的显示和JavaScript程序的执行,在实现过程中需要考虑客户端浏览器的兼容性和客户端PC机的分辨率,表示层支持常用浏览器的各个版本。
2.3 功能界面示例
GRIS-CM集中药种质资源数据管理、查询、分析、挖掘等功能于一体,为中药种质资源提供全面的、专业的信息服务,并整合Web GIS、文献库、基因库,更好地为各类用户提供服务,系统操作简单,使用方便,界面人性化程度高。GRIS-CM为用户提供了功能强大、内容丰富的种质资源查询功能,如图4所示杜仲种质资源查询界面。
3 小结
GRIS-CM整合了中药种质资源基础信息库、文献库和基因库,提供中药种质资源基础信息、地理分布信息、数量与质量信息、专家信息、市场信息、商业信息、文献数据、基因数据等的研究与应用平台。该系统目前尚处于中药种质资源整理和数据收集录入阶段,主要用户为中药种质资源研究人员,待数据量达到一定规模后,即可面向药企、药农等相关单位和个人用户开放。该系统现有湖南省中药种质资源数据共600多条,包括山银花、杜仲、夏枯草、鱼腥草、茯苓、玉竹、丹参、枸杞子8种中药的种质资源数据。
在后续工作中,将进一步对中药种质资源数据进行数据分析和挖掘研究,对中药种质资源数据进行聚类、分类、关联分析和异常数据检测,进而挖掘潜在的规律和模式,建立相应的种质资源的评价及性状筛选等模型,为中药种质资源提供更加完整有效的信息支撑服务。此外,还将进一步对系统中的数据进行扩充,增加新种类的中药以及相关种质资源数据,拟在5年内,配合在建的中药种质资源实体库,存储中药种质资源数据10 000份以上。同时,将针对不同类型的中药,制定相应的种质资源数字化标准,为中药种质资源信息提供更为形象的富媒体形式的存储和呈现,充分利用图片、视频等格式来形象、直观地表达和描述种质资源信息。
总之,功能完善、设计合理、易于使用的GRIS-CM将有助于提升中药种质资源管理和研究的效率,进而实现中药种质资源数据存储的标准化、管理的数字化和分析的智能化。endprint