APP下载

一种基于大数据的案件信息智能分析系统

2018-09-26

计算机应用与软件 2018年9期
关键词:收藏夹文书调研

陆 万 万

(上海计算机软件技术开发中心 上海 201100)

0 引 言

目前随着计算机科学技术的快速发展,云计算和大数据计算也在飞速地发展,并且在各种行业中都得到了充分的应用。大数据技术主要表现在大数据分析及挖掘技术两个方面,应用这两种技术可以解决一些复杂的应用场景。本文以上海市第一中级人民法院为例,提出并自主设计了一套完整的基于大数据的案件信息智能分析系统[1]。这种案件信息智能分析系统作为辅助法院判决的参考系统,基于“统一整合,智能分析”的原则进行设计和开发。智能分析系统需要采集和充分整合法院内所有相关的裁判文书,以及部分大城市的法院裁判文书和最高法院、最高检察院的精选案例、指导性案例数据,对文本数据进行相应的分析和处理,对文本内容信息进行结构化的处理,并且构建出整套的搜索引擎及文本数据分析体系,供法院用户通过不同的查询条件检索文书、分析文书,大幅度地提高法院的办事效率,积累办案经验,有助于达到高效协同调研的目的[2]。与此同时,智能分析系统还将不断地吸收法院内所有用户的调研经验,为将来推进法院裁判文书进一步智能化解析体系的建设打下坚实基础。

1 项目总体背景和意义

本文建立的案件信息智能分析系统以上海第一中级人民法院为例,通过收集现有的裁判文书信息、电子卷宗信息、庭审录像信息等数据作为基础的数据[3]。首先,对收集整合各类信息资源进行数据信息采集工作。其次,对数据信息进行存储操作,包括基本的物理存储和分布式存储操作,这样可以保障数据的基本安全性。最后,采用流处理和批处理的方式对数据进行处理,充分地保障数据处理的效率,使得数据使用效率也得到进一步的提高。当法院相关管理部门需要数据时,服务器会反馈基本的原始数据和系统通过大数据处理计算得到的相关联的推荐案例数据,保证相关管理部门可以参考这些处理数据和基本数据[4],再作出相关的判断,提升案例的评判效率。通过本系统,法院中的联络员、研究室、综合部门、审管办等不同级别的用户及部门都可以检阅到自己权限能够见到的相关数据,进行合作协作,借以提高系统整体的办案效率。

另外,本文设计的案件信息智能分析系统总体架构由基础设施层、数据源层、数据服务层、数据存储层、应用支撑层、应用层、门户层共七个部分组成[5]。其中,案件信息智能分析系统在针对数据源进行处理时,采用了大数据技术对数据进行存储、处理和维护。整个系统的软硬件平台统一采用了大数据处理技术,实现不同的终端都可以在基于大数据处理平台的基础之上,进行一系列的数据管理、查询和维护等操作。

2 系统模块架构与设计

2.1 基本硬件模块

硬件系统主要包括数据库双机系统、文件备份系统和虚拟化系统。其中:数据库双机系统的硬件环境搭建主要包括搭建双冗余的数据库双机系统和部署案件智能分析数据库;文件备份系统主要包括搭建文件备份系统,主要备份Oracle T4-4的数据库文件和RAC文件;虚拟化系统主要包括该系统安装配置完成后,实现部分虚拟机系统通过VMware VCenter集群管理和Rose HA双机,部署智能分析分发系统、FTP等应用。智能分析系统的总体硬件拓扑图如图1所示。

智能分析系统硬件集成活动及技术保障需要充分考虑到中间件、数据库的安装和数据备份保障工作。数据库中的数据需要及时地备份并灵活地进行数据迁移工作。此外,还需进一步完善系统的集成方案、配置报告和应急预案等文档。对硬件的基本保障工作还需要保障数据库双机系统的基本安装配置如下:硬件有2台Oracle T4-4主机、2台Oracle 2540磁盘阵列和2台博科300光纤存储交换机[6],软件有Oracle 11g R2数据库、Oracle RAC双机软件和Oracle Solaris 10操作系统等。文件备份系统的基本安装配置包括硬件有1台Oracle X3-2服务器和Oracle L150磁带库[7],软件有操作系统Oracle ole 5.9、备份软件OSB 10.4、数据库Oracle Database 11g等。虚拟化系统的基本安装配置包括硬件有HP C7000刀片系统含10套刀片服务器BL460c、Oracle zfs 7320磁盘阵列和Dell S5000 IP SAN交换机,软件有VMware ESXi 5.5虚拟机系统、VMware VCenter 5.5 虚拟机管理中心、RHEL 6.4红帽系统和Rose HA双机软件等。

2.2 基本软件模块

软件系统主要架构采用了SpringMVC+Spring3+Hibernate4技术框架来设计和编码[9]。数据库采用MySql数据库,项目中采用MVVC设计模型来实现和控制项目中显示、控制和模型的分离。案件智能分析系统中,软件系统的前端设计主要采用了jsp、html、css、javascript、jquery和React等[8]基本技术来实现界面响应式的布局设计,动态地响应用户的操作事件。前端界面布局和展示采用组件化的设计思想,提高后期代码的可维护性和健壮性。另外,系统的控制层采用Spring注解扫描等技术灵活配置客户端请求的处理servlet,避免了在web.xml中进行servlet的配置[11],并且可以灵活配置修改servlet的实现;使用hibernate注解实现实体类和关系数据库的映射,避免了繁琐的配置文件,简化了数据存储操作[12]。系统软件功能架构图如图2所示。

图2 系统软件功能架构图

3 具体功能和研究成果

3.1 便捷检索功能

系统中首页查询的建设旨在向用户提供最快捷、对工作场景最适用的查询方式。通过“主题+文书范围+全文搜索”的模式,用户可在进行最少操作的前提下,快速查询调研所需文书。另外,系统还可以通过添加查询条件,为用户提供最为丰富的文书查询途径。院外文书可根据城市名称查询,文书查询信息项约60个,支持信息项间的并且、或者、不包含关系,查询条件支持保存与导入,显示内容支持配置。对于已查询出来的文书,系统还支持收藏与分享等操作。系统便捷检索功能界面如图3所示。

图3 系统便捷检索功能图

3.2 全文查阅功能

系统使用解析模板对裁判文书进行意义段划分后,将每篇文书各自的意义段展示在查看全文界面的左侧,并支持点击意义段后迅速定位到对应文书内容。在文书解析意义段列表下方,分别添加电子卷宗、庭审录像及原审文书链接。对于调研有价值的自然段或任意字句,用户可对其进行打标签等操作。同时,用户还可将调研心得写入个人归纳栏中。系统全文查阅功能如图4所示。

图4 系统全文查阅功能图

3.3 收藏功能

系统收藏功能模块用于统一管理用户自己收藏的文书及相关收藏夹。界面左侧需提供树结构,主要用于展示收藏夹的层级关系,其余主界面用于展示当前收藏夹下收藏的文书(不包含该收藏夹下子收藏夹的文书)。点击左侧树结构中的收藏夹名称,则可打开该收藏夹,如果该收藏夹下包含子收藏夹,则此时树结构中展示该收藏夹的子收藏夹,主界面展示收藏夹下的文书[10]。“我的收藏”下的所有收藏夹(未分组收藏除外)都支持新增子节点、修改名称、删除收藏夹、查询收藏夹、移动收藏夹以及分享收藏夹等功能。同时,与“我的收藏”类似,“我收到的收藏”主要存放收到的分享收藏,即他人给当前用户分享收藏夹或收藏的文书时,这些分享内容会保存于“收到的分享收藏”下,并且分享收藏夹的收藏夹名称后面会显示分享人名称,如“分享收藏[张三]”。该功能下的收藏夹仅支持删除、移动和分享功能。系统收藏功能如图5所示。

图5 系统收藏功能图

3.4 管理功能

系统分享模块可以帮助用户在该模块下管理分享出去的或收到的分享信息,包括文书、查询条件、个人归纳等。详情见图6。

图6 系统分享功能图

系统协同工作模块可以协同调研模块为多个用户共同进行协同调研工作提供支持。用户可在该模块下创建调研小组,定义调研标签,与小组成员共同完成调研任务,并通过导出功能完成对调研成果的统计。详情见图7。

图7 系统协同工作功能图

系统消息模块将实现对用户最新消息的准实时推送,同时,用户可以在该模块下查看发给自己的通知,也可以查看在特定事件(如其他人分享给自己某个消息时)造成平台自动生成的通知消息。例如新发布的主题、新分享的信息等。用户可以在这里看到关于自己的所有系统发送的消息。详情见图8。

图8 系统消息模块功能图

3.5 研究成果

通过本系统高级查询中各类查询条件的有效集成,用户可进行不同查询条件的搭配,以适应不同调研课题的查询需求。与此同时,通过对展示内容的动态配置,用户可根据自己在调研过程中的关注点的需求,对查询结果的展示内容进行个性化配置[13],从而无须再像以往那样打开文书逐篇查找,很大程度上提高了文书查询的效率。另外通过查看全文中的段落快速定位功能,可帮助调研人员快速定位相关文书意义段,以节省全文通读的无效工作时间。系统的标签、个人归纳功能,结合分享与协同调研模块,为用户提供了更大的共享与合作空间,用户之间可以分享彼此的调研成果,消除信息孤岛,从而形成经验共享、无纸化办公的高效工作环境[14]。最后,法官在审理案件时,会遇到无法确定案件判决程度的情况。本系统的高级检索能帮助他们根据当前审理案件快速查询类案,通过对类案判决方式的参考,法官对案件的审判能够更加明确,从而整体提高一中院的审判水平。

4 结 语

本文以上海市第一中级人民法院为例提出的案件信息智能分析系统,通过对各类案件的非结构化裁判文书进行结构化处理,可使文书中各项信息的粒度更细、更明确。配合打标签以及个人归纳功能,一中院的调研成果能够得到持续性的沉淀,为法院进行案件调研打下了扎实的信息化基础。

在信息化的将来,案件信息智能分析系统将朝着更智能的方向发展。结合打标签的文书段落以及标签名称、标签内容形成标签库,通过语法语义解析以及强大的搜索引擎,将实现系统自学习以及自动标签等智能化功能,从而进一步提升文书检索能力和定位能力,使法院内用户的调研、查询更为简便快捷,将信息化、智能化建设推向更高的水平。

猜你喜欢

收藏夹文书调研
资源管理器导航项目“请出请进”
徐谓礼文书——南宋官制百科全书
“三注重”扎实做好调研工作
几个关于浏览器收藏夹的技巧
人大到基层调研应做到“三不”
加强事业单位文书档案管理的措施
调研“四贴近” 履职增实效
我的小天地
我的宝贝收藏夹
Personal Statement