桌面式文献数据信息共享系统设计实现
2013-10-17杨瑞华张建华廖明强
杨瑞华,张建华,余 艳,向 导,刘 建,廖明强
(中国工程物理研究院核物理与化学研究所,四川绵阳 621900)
针对特殊专业研究中的设想和实施阶段产生的大量科技文献资料,如何将文献安全并科学有效地管理,以便随时查找和利用,成为需要解决的问题。早在1992年埃斯特雷亚山社区学院建立了最初的信息共享空间,共享专业性的学生进行学习研究[1]。
科研工作中经常会利用已知信息,并因此取得事半功倍的效果。当前管理科研信息的软件系统有“档案管理系统[2]”和某些单位建立的信息港模式。档案管理系统中通常只能存储单位内部的定型成果信息,信息港管理则是一定程度上可公开的信息。而科研人员所需的中间过程数据、讨论的纪录、处理数据采用的工具及一些虽未在正式刊物发表,却对科研极具参考价值的信息却无法查找,更无法利用。为此,开发了文献资料数据成果共享平台管理软件。
软件系统采用Delphi+SQL Server架构,采用网络化C/S/S三层构架的模式实现了不限制类型的各类文件文献数据资料的统一管理,使多年累积的技术成果和文献资料得以长期保存,方便检索,并更好地应用在日常的科研课题文献资料获取中。通过这种受控的信息资源网络交流共享软件平台,使日常科研工作中的文献和文件资料数据得到更充分有效的利用。
1 信息共享模式优化
文献共享方式大致可分为纸质“借阅式”、对面“询问式”、推送“邮件式”、浏览“网页式”。文中介绍及时“桌面式”共享方式[3]。
图1 系统主要界面
(1)借阅式共享。在计算机未出现前,文献信息是以纸张形式存在的,纸张式信息共享的方式就是借阅。而在当今信息化程度较高的情况下,借阅式共享的效率已无法满足要求,但出于某种原因该方式仍将长期存在。
(2)询问式共享。询问方式的主要缺点是信息交流不充分。也是最普通的信息共享方式。
(3)邮件式共享。有文献信息时,利用网络邮件进行发布,采用一对一或一对多的方式。其缺点是导致无用信息增多。
(4)网页式共享。网页式共享也可称为信息港模式,均是经过整理后公开发表、发布的信息,通常可反映精髓,而大多对于科研更有帮助的原始信息和过程信息则无法出现。不能为日后的参考提供充分信息资源。
(5)桌面式共享。采用内部网络使用的共享软件进行桌面交互式共享,改变了借阅式和询问式的缺点,同时又集中其优点。采用多对多方式共享文献,多个用户可同时或错时上传、下载文献。也就是所用用户均可向信息池中添加信息,而又可根据权限和积分等共享信息。
提供主动式、非面对面的信息共享方式,使得系统参与人员可利用非整块的空闲时间,主动上传文献资料,克服资料面对面交接的时间和空间局限,实现桌面共享。在节约时间的同时,主动提供共享信息。获取信息也是主动进入系统进行搜索所需的信息。
通过这种方式将以往的面对面询问式、纸张借阅式、邮件对点式和网页搜索被动式,用非实时、多对多、无限借阅、拖放式上传和桌面检索等方式所替代。
2 软件突破技术
2.1 文献安全
软件只在授权的网络和计算机中使用,未通过该软件获取的信息无法读取。软件限制使用范围,文献采用二进制形式拆分加密存放于数据库中。如此,软件离开规定的环境便不可使用,而数据库被非法获取后只能看到一些“加密”后的二进制码,其破译难度较高,上传文献的安全性得到了保障。
2.2 便捷使用
(1)身份认证。本软件集成采用“域控”方式的网络中用户身份信息,登录系统时直接获取域中身份信息,无需验证,操作简单。同时软件系统具有一定安全性保障。在异地计算机上则采用页面登录方式,输入用户名和密码也可以方便进入系统。这里输入的用户名和密码在数据库中是经过加密存放的,也有一定强度的安全性。
(2)浏览上传。进入上传页面后,一种方式是点击“浏览文献”按钮,选定要上传文献后,系统自动获取文献的大小、修改日期等基本信息,并形成系统所需的部分属性信息。仅需少量输入即可实现文献上传。另一种更为方便的方式是将需要共享的文件直接拖放至该页面,即可实现文件基本信息获取。
2.3 文献共享
在文献数据共享时采用文件流分割上传和下载技术,提高了速度,同时突破文件大小限制。同时采用多线程技术,避免巨大文献上传时造成的计算机“假死”现象[4]。
(1)文献类型。共享的文献类型无限制,由此信息库中不仅包括发表文章、总结报告和数码照片等,还包括经典软件工具等丰富的共享资源。
(2)分割上传技术。利用“文件流”进行文件分割,再将分割后的“文件流”转换为“内存流”,利用内存流进行文件的网络传送。设计好其之间的逻辑关系,大幅提高文件上传速度,尤其针对较大文件的处理效果更为明显。
数据库字段最大限制为4 GB,要确保上传文件为保证安全保存在数据库中,需采用文件分割技术来突破上传限制,满足较大文件上传需求。
(3)多线程技术。采用多线程的应用程序允许同一程序的多部分同时执行,为程序赋予并行特性,因而可执行某些实时性和随机性强的操作,提高CPU的利用率,加快文献数据信息处理速度。在本软件系统中,启动一个或多个线程读取并分割文件,同时启动其他线程上传内存流并保存至数据库中。
该流分割技术不仅支持大文件的传送,还增强了文件安全性。分割存放的单个文件则是一堆二进制码,若不采用本系统专用技术合并,后台数据被窃取后将无较大用途。
2.4 远程管理技术
文献上传后,可能发现文献错误,需要删除。该删除过程将导致数据库占用多余的空间。尤其是几GB文件的删除,其日志文件及其他残留信息会空占服务器硬盘空间,并严重影响数据库性能。网络服务器存放位置不便于经常出入管理。因此软件采用远程控制技术,使得具有相应权限的用户可远程清理数据库,保证数据库的清洁。
3 结束语
通过该系统,克服了以往优势资源无法得到充分利用的情况,实现了主动式文献资料数据成果的需求。在该软件平台的数据库中可积累大量原始的文献数据资源,而非档案管理中单一模式的总结报告。
通常一项新技术的产生或一种新模式的变化,在开始阶段均无法被完全接受,需要时间的积累来提高认识。而有序积累和原始积累对一个单位的长远发展有着重要意义。
[1]李越,唐小利,陈晨.国内外信息共享空间(IC)研究及其启示[J].医学信息学杂志,2011(8):65-68.
[2]莫雪妹.档案信息资源共建共享的思考[J].China's Foreign Trade,2011(14):152-156.
[3]李君,蒋志东.信息资源共享研究综述[J].现代商贸工业,2011(11):240-241.
[4]罗峰.基于P2P和网络编码的远程桌面共享[J].重庆邮电大学学报:自然科学版,2007(4):454-457.