海洋规划信息查询系统的设计与实践
2011-11-06李双建王江涛孙瑞杰
赵 鹏,李双建,王江涛,孙瑞杰
(国家海洋信息中心 天津 300171)
海洋规划信息查询系统的设计与实践
赵 鹏,李双建,王江涛,孙瑞杰
(国家海洋信息中心 天津 300171)
文章在研究海洋规划信息查询系统用户工作特点和需求的基础上,系统论述了使用内嵌TRS全文数据库的新科光盘出版系统开发海洋规划信息查询系统的过程,包括数据字段的定义、查询系统和数据库的结构设计和查询界面的设计;介绍了该查询系统的功能和未来的发展方向。
海洋;规划;查询系统
海洋规划是国家和沿海各地发展海洋事业,促进经济社会可持续发展的指导性文件。“十一五”以来国家和各地方出台了大量海洋事业、海洋经济等方面的规划,这些规划的出台和实施为“十一五”期间我国海洋事业健康有序地发展提供了必要的保证。我国在2011年启动第十二个五年计划,国家和沿海各地方开始了新一轮海洋规划的编制和实施工作。在编制海洋规划的过程中,快速查阅和参考其他领域和地区已有相关规划的内容,对协调海洋规划与其他领域规划,科学合理地编制规划有着重要的意义。因此,有必要设计和开发海洋规划信息查询系统,以满足海洋规划编制工作的需要。该系统还可服务于各级政府的电子政务公开工作,方便人民群众了解和掌握当地海洋事业的发展趋势。
1 开发系统的选择及特点
在电子信息发布中,互联网已成为信息发布的重要途径,而以光盘或其他便携式介质为载体发布信息则是互联网信息发布的重要补充。光盘在收费方式、保密、方便携带、可移动、使用简单和特殊环境等方面有不可替代的作用和优势。基于用户工作环境和实际需要,海洋规划信息查询系统采用新科光盘出版系统进行开发。
新科光盘出版系统是一个以光盘等便携式介质为载体的信息发布系统。它基于text retrieval system(TRS)信息发布检索系统,集成了数据管理、界面设计和光盘制作等功能。TRS系统的功能包括信息采集、发布、分类导航和查询等,广泛地用于各种信息数据库和信息门户的建设[1]。
内嵌TRS全文检索数据库的新科光盘出版系统在系统稳定性、查询速度、数据压缩、数据和软件加密、信息检索和排序等方面具有明显优势。此外,该系统可提供W indow版、单机Web版和局域网Web版检索界面;提供多种检索方式、显示风格,无需编程即可实现,大大降低了开发成本。该系统已广泛应用于出版社、图书馆、网站、信息中心、研究所和档案室等部门。
2 信息查询系统结构功能设计
2.1 用户需求分析
海洋规划信息查询系统面对的用户主要包括各级海洋行政主管部门、海洋规划编制和研究机构,以及其他海洋规划相关机构的管理和研究人员。他们从事的工作既具有很强的专业性和行业特点,又涉及海洋领域的方方面面。然而,由于海洋领域已有的规划成果较少,在编制规划时往往要借鉴和参考其他领域的规划成果。因此,设计和选取数据时,既要注重信息的广泛性和多样性,也要保证信息的针对性和有效性。要在对各类已有规划数据进行分析、筛选的基础上,对规划数据进行分类,使无序的数据有序化、繁杂的数据专业化和分散的数据集中化[2]。
海洋规划信息查询系统选取的规划数据包括海洋规划和涉海规划。其中,涉海规划被限定为国家规划、地区规划和沿海11个省级行政单位及沿海地市制定的规划。海洋规划的编制过程往往面临时间紧、任务重的局面,为了快速、准确地查询规划信息,不但要检索规划数据的全文,还需要提取规划数据的关键信息,并对规划数据进行分类。因此,本查询系统按照规划的级别、行政区域、所属领域及是否为海洋规划等进行分类,并能检索规划题目、时效和发布单位等关键信息。
2.2 数据加工与维护
海洋规划原始数据主要来自于各级政府部门、研究机构和行业组织网站上发布的规划文本,以及国家海洋信息中心海洋规划研究部保存的规划文本。规划文本的格式主要为Word和PDF格式。
海洋规划信息主要由三部分组成:第一部分是海洋规划信息的外部特征,包括规划标题、生效日期、失效日期和发布单位等;第二部分是依据规划的级别、区域(国家、地区、省、市)、涉及领域和是否为海洋规划对规划信息进行的分类及分类代码;第三部分是规划信息的全文。这些信息的主要内容和字段见表1。
表1 规划信息字段
其中,级别分为国家级、地区级、省级和市级。为便于用户查阅,简化数据库结构,县一级规划入所在市的规划中。区域一项中,省及省级以下的规划按照所属区域进行划分,如东北、华北、华东和华南等;对于涉及多个省的规划,按照规划标题中出现的区域进行划分,如环渤海、长江三角洲、珠江三角洲和长江流域等。
领域一项中,区分海洋规划和涉海规划。用阿拉伯数字0~9标注海洋规划,用英文字母A~Z标注涉海规划,将海洋规划划分为11个领域,涉海规划分为13领域。具体划分方法见表2。
表2 规划所属领域的划分方法
本系统装库一般采用批量模式,即需要先准备好装库数据格式文件,然后一次性导入系统,也可使用系统提供的“导入”功能,将规划文本批量导入。TRS装库文件通常使用标准格式:
<REC>
<字段名1>=字段值1……
<字段名2>=字段值2……
<字段名n>=字段值n……
……
<REC>
<字段名1>=字段值1……
<字段名2>=字段值2……
<字段名n>=字段值n……
……
2.3 查询系统的结构设计
海洋规划信息查询系统主要由管理端、数据库和用户端3部分构成。管理端作为规划信息查询系统的提供方和维护方,设计查询系统的结构和功能,对原始数据进行搜集和整理,并将数据导入到数据库中。同时,在查询系统运行的过程中,负责对查询系统进行维护,及时更新数据库,搜集用户反馈以完善查询系统。基于TRS全文检索数据库的海洋规划信息数据库存储经加工的海洋规划数据,并对用户端的请求进行应答。用户端通过浏览界面、查询界面和输出功能为用户提供查询和保存海洋规划信息的服务。用户端与数据库之间通过加密和设置访问权限等方式对用户及其使用查询系统的方式加以限制。查询系统的结构见图1。
图1 海洋规划信息查询系统结构
海洋规划信息数据库中,国家级、区域级和省级作为数据库的第一级结构。国家级和区域级规划的第二级结构均分为海洋规划和涉海规划;省级规划下的第二级结构以省级行政单位划分,顺序按照从北至南海岸线的走向编排。为避免数据库的结构过于繁冗,将沿海各市规划编排为各省规划下的第三级结构。数据库结构的第三级为各省的省级海洋规划、涉海规划和地市级规划。第四级结构为各沿海地市规划,顺序按照从北至南海岸线的走向编排。第五级结构为沿海各地级市及所辖县的海洋规划和涉海规划。数据库的结构见图2。
图2 海洋规划信息数据库结构
2.4 用户端界面和功能设计
根据海洋规划编制工作的实际需要,用户端界面采用出版系统提供的W indow s单机版界面。该界面具有设计简单、界面统一、结构固定及使用方便的优点。Window s单机版采用了流行的3-frame结构,界面与Outlook exp ress等大众化软件一致,因此用户操作会比较熟悉。用户端浏览界面包括导航栏、概览栏和细览栏。
导航窗口的数据库分类以导航树方式显示,导航树中的每一个结点记录了检索条件及固定赋值选项等信息,选中一个结点将根据检索条件重新进行检索,并在概览窗口中显示检索结果。概览窗口中显示所有满足条件的记录,显示记录的那些字段,字段排列的先后次序。细览窗口显示某条记录的详细内容,点击细览窗口中Wo rd图标可在查询系统中打开相应的Word原文件(其他文件类型对应其他图标)。用户可通过检索栏对检索字段,筛选出符合条件的数据。
3 查询系统的应用
3.1 信息检索、排序和输出
查询系统提供“搜索”和“高级检索”两种信息检索方式。使用搜索功能可检索所有字段信息;而高级检索功能可根据对特定字段进行检索,并能按检索表达式、在上次结果中进行检索。
用户可根据需要对命中的信息进行排序,其中数值型和字符串型字段可进行升降序排序,而短语型和文档型字段仅支持相关性排序。此外用户还可使用排序命令对多个字段进行组合排序。用户还可保存和打印指定记录。
3.2 安全和数据更新
光盘制作者指定最终发布的光盘进行注册码验证,最终用户进行光盘安装时会出现“输入注册码”的提示信息,如果用户没有取得合法的注册码,则安装失败。查询系统的制作方,定期向用户提供“增补数据包”,对数据库进行更新。
4 展望
海洋领域在国民经济和社会发展中扮演越来越重要的角色。海洋规划对沿海地区科学规划海洋和沿海产业布局、合理利用海洋和海岸带资源等方面发挥着重要的作用。建设海洋规划信息查询系统为海洋规划编制和研究工作提供了必要的技术支持和保障。然而,限于技术水平和开发条件,现有的查询系统存在着功能尚显单一,数据库规模略小等缺陷,这需要在未来的工作中加以完善。
在未来的工作中,我们将进一步增加规划信息的数量,调查研究用户的需求,提高技术水平。未来的海洋规划信息查询系统在检索规划文本的基础上,还将纳入自然、经济和社会数据,国家和地方的法律、法规等信息;增加用户反馈、用户交流协作平台等功能;增加网络版、电子政务查询系统等。
[1] 马建玲.基于TRS系统构建网上专题阅览室[J].图书馆理论与实践,2005(6):121-122.
[2] 黄长.利用TRS全文检索系统建设专题数据库的研究和实践[J].图书馆论坛,2005,25(3):213-214,210.
一项中,以《沿海行政区域分类与代码(HY/T094-2006)》中各省、市的6位数字代码作为分类代码的前6位;海洋规划在6位数字代码后标注Y,涉海规划在6位数字代码后标注N。如,辽宁省的海洋规划标注为210000Y,北海市的涉海规划标注为450500N。国家级规划前6位数字代码统一为000000,区域级规划前6位数字代码统一为111111,海洋规划和涉海规划仍分别标注为Y和N。如,国家级海洋规划标注为000000Y,区域级涉海规划标注为111111N。正文是文档型字段(文本),支持自动分词,允许按词检索,支持相关性排序。