APP下载

专利纠纷案件数据库统计分析模块的设计研究

2015-06-07苏文成

图书情报研究 2015年1期
关键词:检索

苏文成

(江苏大学科技信息研究所 镇江 212013)

专利纠纷案件数据库统计分析模块的设计研究

苏文成

(江苏大学科技信息研究所 镇江 212013)

为应对我国数量繁多、类型复杂的专利案件,弥补国内在专利纠纷应对决策辅助与相关数据库统计分析功能模块构建上的缺陷,采用SQL Server 2005作为数据库管理系统,设计了一套专利纠纷案件数据库。利用SQL Server提供的Reporting Services、Analysis Services等统计分析服务及各种组件,完成了对数据库的主体统计分析功能模块的构建,并就部分预测算法与表内字段设置进行了优化完善。

SQL Server 2005 专利纠纷案件 数据库 统计分析 设计

自2001年我国加入WTO以来,随着全球化的步伐日益加快,我国的专利事业不可避免产生了数量繁多、类型复杂的纠纷案件,而面对这种情况,国内却鲜有面向社会提供专利纠纷案例检索的专业数据库以及录入量大、覆盖面广、分析精准到位的专利纠纷案例检索服务,该领域也没有专属资源库供研究者分析专利纠纷成因、趋势、预防机制等相关课题。在此背景之下,构建一个功能完备、操作简便、分析专业的专利纠纷案件数据库已势在必行。

1 概述

1.1 研究意义

有关专利纠纷案例数据设计的研究对于法官、律师等法律从业者来说,在裁决或者参与纠纷诉讼的过程中,面对纷繁复杂的专利纠纷案件时急需一款同时具有专业性、丰富性并集自动统计分析功能于一身的决策工具进行辅助。而政府部门如能在制定相关行业政策法规之前,先行参考专利纠纷数据库的统计分析结果,则对弥补行业法规漏洞、杜绝专利纠纷产生的根源极有益处。再者,对于准备申请专利或已然陷于专利纠纷之中的企业来言,上述数据库的使用,可以在一定程度上预防专利纠纷产生、规避专利陷阱、引导辅助纠纷中企业走出困境。

1.2 相关数据库现状与缺陷分析

国外相关网络数据库数量、质量较之国内都有很大程度上的优势,目前使用较为广泛,且适用于专利纠纷案件检索的数据库有Thomson Reuters集团的Westlaw International数据库①Westlaw International.[2013-04-02].http://www.westlawinternational.com.和LexisNexis数据库②LexisNexis.[2013-04-02].http://www.lawyers.com.。国内用于专利案例检索的数据库,诸如北大法宝③北大法宝.[2013-04-02].http://vip.chinalawinfo.com.、北大法意④北大法意.[2013-04-02].http://www.lawyee.net.、上海市知识产权(专利信息)公共服务平台⑤上海市知识产权(专利信息)公共服务平台.[2013-04-02].http://www.shanghaiip.cn/wasWeb/index.jsp.,仅提供专利纠纷案例的检索服务,没有为用户提供专业的专利纠纷案例统计分析服务。这其中虽然上海市知识产权(专利信息)公共服务平台表现得更为专业化,但上述涉及到的问题仍没有得到解决。

1.3 可行性分析

本数据库拟使用SQL Sever 2005作为数据库管理系统软件,因其安全、稳定、可靠的特性,使得该专利纠纷数据库更易于创建、部署和管理。同时Analysis Services多维数据集、报表服务器等工具的集成简化了本数据库中统计分析模块功能的实现过程。[1]

2总体设计

2.1 系统功能结构剖析

见图1。

图1 系统功能结构图

2.2 系统设计

2.2.1 设计目标(1)实现专利纠纷案件信息的规范化录入、修改和保存。

(2)灵活、快速、高效、准确的使用不同检索字段对数据库内的案件数据进行关键词检索,并能实现检索结果的导出、保存和专业分析。

(3)能够按照用户需求,从IPC分类号、案件类型、区域信息、代理律所几方面对数据库内信息进行条件性统计分析,并生成统计图表(扇形图、条形图、折线图)。同时能对专利纠纷案件发生的数量进行科学预测。

2.2.2 数据源 本专利纠纷案例数据库信息源主要来自上海市知识产权(专利信息)公共服务平台⑤,最高人民法院公报案例库⑥最高人民法院公报案例库.[2013-04-02].http://vip.chinalawinfo.com/newlaw2002/cas/.,《中华人民共和国最高人民法院判案大系》(肖扬总主编,人民法院出版社2003年出版),《中国审判案例要览》(国家法官学院,中国人民大学法学院编,人民法院出版社2006年出版),《人民法院裁判文书选》(石家庄市中级人民法院编,人民法院出版社,2004年出版),《知识产权裁判文书集》(程永顺主编,科学出版社2003年出版),北大法宝②知识产权与竞争纠纷案由分支下的案件信息。

3统计分析模块设计

本数据库共有5张数据表,分别是案件基本信息表、涉案专利信息表、审理过程信息表、原被告信息表、法律决策辅助信息表。

3.1 主要数据表结构设计

(1)案件基本信息表

本表包含案号、案由、审理法院、审理法官、案件标题、审判结果、纠纷类型、涉案赔偿金额等字段。其中,案件标题包括原告、被告、案由(有纠纷类型和专利类型构成)。纠纷类型可显示下拉菜单包括专利权属纠纷(内分为:专利申请权纠纷、专利权归属纠纷)、专利交易纠纷(内分为:专利转让纠纷、专利实施许可纠纷)、专利侵权纠纷、其他纠纷(内分为:奖励报酬纠纷、临时保护使用费纠纷、其他)。审判结果分为胜诉、败诉、调解、不予受理、驳回起诉、准予撤诉、发回重审、移送。裁判文书中并未明确告知胜诉或是败诉,需根据赔偿金额由哪方负担及其他一些判决结果判断以后再添加,因为审判结果的胜败无论是对法官、律师还是企业、专利所有人都有很大的借鉴与指导作用。

(2)涉案专利信息表

本表包含案号、涉案专利号、IPC分类号、涉案专利名称、涉案专利类型。其中,裁判文书标题包括制作法院名称和法律文书名称。制作法院名称能说明审理案件的法院以及法院级别(最高法院、高级法院、中级法院,根据《最高人民法院关于审理专利纠纷案件适用法律问题的若干规定》第二条规定:专利侵权纠纷的第一审案件,由各省、自治区、直辖市人民政府所在地的中级人民法院和最高人民法院指定的中级人民法院管辖);法律文书名称代表裁判文书的性质(判决书、裁定书、调解书)。

而涉案专利号包含专利申请的年份以及专利申请的种类(“1”表示发明,“2”表示实用新型,“3”表示外观设计,“8”为PCT发明专利申请,“9” PCT实用新型专利申请)信息,值得注意的是2004年以前跟2004年以后专利号稍有变化,2004年以前的专利号前两位是申请年份,第三位是专利申请种类,2004年以后的专利号前四位是申请年份,第五位代表专利申请种类。

(3)审理过程信息表

本表共包括案号、立案日期、结案日期、审理周期四个字段。立案日期与结案日期:可以检索某一时间段专利案件立案与结案的情况,甚至可以计算案件审理周期,作为评估法院效率的一个因素。

(4)原被告信息表

本表包括案号、原告名称、原告委托代理人、原告代理律所、被告委托代理人、被告代理律所、审理结果几个字段。原告与被告的姓名或公司单位名称前设国别选项加以限制,若是中国则加后续选项选择省份和地级市,用以检索国内各地区和涉外专利纠纷的情况。

(5)法律决策辅助信息表

本表包括了案号、裁决文书标题、裁决文书原文、设计相关法律问题、专家评析五个字段。表中涉及相关法律问题需由专家评析,待用户上传案例信息经核实之后由数据库管理员联合相关法律学专家就案例进行分析与评述[3],评述要求从公正、专业、科学的角度对该案例涉及到的相关法律条款给予罗列,并就该案中涉及到的具体案情予以分析,以给日后数据库用户提供借鉴参考的标杆。

3.2 统计分析功能设计

3.2.1 功能概述 数据库统计分析模块功能的实现关键在于:当用户提交统计分析关键字段时,系统能够自动从3.2节中涉及的5张主数据表中抽取数据,并创建本地临时表。其后使用前端程序或者网页浏览器调用SQL Server数据库内保存的特定存储过程,完成对于SQL Server 2005报表功能的自动调用与各式统计图表的生成,达到满足用户统计分析需求的目的。

案件数据统计条件由统计条件一和统计条件二共同组成,均为:IPC分类号、区域、审理周期、立案日期、案由、代理律所、专利类型、审判结果。显示结果可以按照10条、25条、全部、顺序、倒序进行显示。统计之前对上述8种统计条件赋值,不赋值则默认为Where条件为空,其效果等同于Select*。利用上述的几种统计条件,可以实现对于专利纠纷案件数据的全面统计分析,同时富有实际意义。例如,选择“IPC分类号”和“区域”=“江苏省”,“显示前10条记录”,则意味着用户想查看江苏省涉案数量最多的10种专利IPC号。

图2 统计分析模块界面

3.2.2 统计分析临时表的设计与创建 为满足数据库操作简便、查询快捷可靠且低系统资源占用的设计需求,本功能模块的实现主要使用本地临时表来作为统计数据的来源。相较于一般用户自定义表,本地临时数据库表会在用户发出统计分析功能需求指令之时自动创建,并会在对话完成或数据库断开之后自动删除,在临时表生成阶段,表仅为用户可见。既降低了数据库对于系统内存和硬盘的占用率,同时保证了用户在统计分析模块使用时的数据安全性。其中,“区域”字段为案件基本信息表“审理法院”字段的简化字段,后将上表中包含的字段导入统计分析临时表Statistic_temptable(见表1)。“区域”字段关键代码如下。

表1 统计分析临时表Statistic_temptable

3.2.3 SQL Server 2005报表服务功能的调用SQL Server 2005 Reporting Services是一种基于服务器的新型报表平台,可用于创建和管理包含来自关系数据源和多维数据源的数据的表格报表、矩阵报表、图形报表和自由格式报表。[2]同时“web服务URL”功能选项,借用浏览器使用报表管理器,不仅放宽了数据库报表功能操作的空间局限性,同时更有利于Web前端软件的开发。

3.2.4 统计分析功能示例 利用“代理律所”与“审判结果”两项统计字段来统计“xxx律师事务所”以往代理情况,并生成饼状图。

图3 统计分析示例饼状图

3.3 预测分析功能原理与设计

3.3.1 原理及相关算法概述 数理统计中的一系列预测方法与工具,诸如回归分析法、时间序列分析、指数平滑法等均可在一定的条件下实现对于客观现实世界中相关数据的科学预测。针对专利纠纷案件信息的预测行为,其目的正是通过相关预测值的获取,为政府决策部门对于特定专利纠纷预防政策的制定提供客观的依据,预测的结果有助于纠纷案件减控指标的合理设立,满足相关部门对监测专利纠纷案件预防政策实施效果与科学性的需求。

SQL Server 2005 Analysis Services为用户提供了时间序列算法和线性回归算法,通过用户自定义数据表相关字段数据的导入,SQL Server系统便能自动为用户提供科学准确的预测信息。

预测条件有两条,时间年份Year(立案日期)为默认条件,另一条件为区域、涉案专利类型、IPC分类号三选一,并在条件后输入条件值,可以实现特定区域内专利纠纷案件数量的预测,特定IPC分类号的专利发生纠纷案件的数量预测,以及特定类型专利发生纠纷的数量预测。

图4 预测分析界面

3.3.2 预测分析临时表的设计

表2 预测分析临时表Expec_Temptable

3.3.3 预测分析功能示例 利用模块实现IPC分类号属A01大类下的专利在2013年发生纠纷案件的数量预测值。

其后SQL Server 2005 Analysis Services利用年份、专利纠纷案件数量两项数据,调用时间序列算法实现折线预测图生成。

图5 专利纠纷案件数量预测折线图

4问题与优化

4.1 关于预测算法的优化

相较于第三章中提及的SQL Server 2005 Analysis Services时间序列分析法,平滑分析预测方法可能更为适合专利纠纷案件数量的预测,原因如下:

(1)指数平滑法对于近期数据更为重视,作为我国改革开放伴随的产物,我国的专利事业从起步至今,刚刚走过三十多个年头,专利纠纷数据的时间跨度较短,且初始阶段极低的专利数量也并不利于数据的预测,不具有代表性。因此选择对不同时期数据赋不同权重、更为重视近期数据的指数平滑分析来进行预测工作更为合理科学。

(2)指数平滑法只要有预测对象的时间序列统计数据,即可建立预测模型,应用灵活。

(3)较之回归分析、时序分析等预测方法,指数平滑法无疑具有更小的计算量,这对于节约系统资源,提升数据库可用性、高效性大有裨益。

式中:M(1)′t——加权一次移动平均值

ai——权重数,i=1,2,··,n,a1>a2>1>an,a1+a2+1+an=1

S(1)t——第t时期的一次指数平滑值

yt——第t时期研究对象数值

a———加权系数,且0<a<1

但是,从上式也可以看出,一次指数平滑分析仍存在着一些问题,对于不同时期权重的赋值难以确定,S(1)t的初始值也没有准确的标准参考,而这两个数值的选择最终将决定指数平滑预测的效果。

4.2 审判结果字段数值的自动判断

在统计分析功能模块中,审判结果字段本应录入裁决文书上记录的纠纷案件处理结果,但“胜诉”、“败诉”、“不予受理”等数据对于统计功能的实现毫无帮助。如何实现语义层次上对于审判结果的机器自动判定,消除无意义冗余信息,节省人力输入数据成本,使得统计功能得以完善,将成为未来该课题研究的一个重心。

5结语

本文在结合专利案例检索经验和国内外案例检索数据库的基础上,对专利纠纷案件数据库的系统主题构架和用户界面功能模块的设计等问题进行了初步探讨,主要着手设计构建了统计分析模块的部分核心概念及功能。对如何解决国内相关数据库少,相关专业分析数据库更少这一现状有一定的参考价值,便利了该领域科研人员的进一步深入开发与研究,更好地使相关领域的人员顺应目前专利纠纷案件数量繁多、类型复杂的总体趋势。

[1]杭 志,黄 斌,刘明波,等.SQL Server 2005应用开发技术与典型实例[M].北京:清华大学出版社,2009:362-389.

[2]赵 斌.SQL Server 2008应用开发案例解析[M].北京:科学出版社,2009:479-501.

(责任编校 田丽丽)

Design of the Statistical Analysis Module in Database of Patent Dispute Cases

Su Wencheng
Institute of Science and Technology Information of Jiangsu University,Zhenjiang 212013,China

In order to respond to China’s large number and complex types of patent cases and to compensate for the inadequacy in the decision assistance in domestic patent disputes and the construction of the related database statistical analysis function modules,the present study designed a set of patent dispute database by using SQL Server 2005 as the database management system.Making use of Reporting Services,Analysis Services and various components provided by SQL Server 2005,it built the main statistical analyzing function module of the database and optimized the part of the prediction algorithm and the table field set.

SQL Server 2005;patent dispute case;database;statistical analysis;design

G306

苏文成,男,1990年生,2012级情报学硕士研究生。

猜你喜欢

检索
《石油天然气学报》在CNKI中的检索方法
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
《石油天然气学报》在CNKI中的检索方法
一种基于Python的音乐检索方法的研究
《石油天然气学报》在CNKI中的检索方法
基于多尺度投影的相似颅骨检索
护理科研中的文献检索概述测试题(单选题)
浅议专利检索质量的提升
供求速递