国家知识产权文献及信息资料库建设实证调研分析
2012-09-21郑璇玉
郑璇玉,王 进
(中国政法大学 民商经济法学院,北京 100088)
一 数据调查基础
社会科学研究最重要的特点之一就是通过收集和运用系统的调查数据,将科学知识编码化,进而阐释具有理论或实践意义的议题。国家哲学社会科学基金重大项目“国家知识产权文献及信息资料库建设研究”的数据调研的目的正在于此,不仅为解决知识产权信息利用和需求之间的问题,也为未来的国家层面的知识产权资料库的建设提供便利。
围绕“国家知识产权文献及信息资料库建设研究”(以下简称“知文资库”)的必要性、可行性和建设目标等问题,本课题组针对当下知识产权信息使用现状、存在问题、“知文资库”的建设目标、建设方式和本研究应当发挥的作用等五个方面设计了问卷,并精简为二十个问题进行了数据统计。项目课题组自2010年开始,分别于北京、上海、广东、贵州、黑龙江、湖南、山东、台湾等地的一、二线城市和三线城市,针对高校学生、非知识产权专业的实务工作者、知识产权专业人士和社会公众展开调研。共发放问卷11 300份,收回有效问卷10 018份,其中学生版3 035份、专业版1 673份、实务版2 420份、社会公众版2 890份。
根据知识产权信息的使用主体不同,本次报告的数据重点放在对前三个群体上即高校学生、非知识产权专业的实务工作者和知识产权专业人士。希望通过这三类人群的分析,寻找其在同一问题上的共性,以及掩盖在表面共性下的差异性。基于调查数据,本文对知识产权信息的获取和利用现状、知识产权信息利用中存在的问题,“知文资库”的建设目标、建设手段和建设效果等方面进行了详细分析,以期对“国家知识产权文献及信息资料库”的建设有所帮助。其他相关调研分析文章也将陆续整理发表。
二 知识产权信息的获取和利用现状
在调查中,我们发现无论哪种社会主体,对知识产权的信息需求都很大,因此知识产权的资料库存在着庞大的需求群体。同时,受众对现有的知识产权资料库不满意,部分受众对现有资料库和信息需求存在认知上的误解。
(一)知识产权信息的网络需求很大
当下,知识产权信息需求广泛,即使是非知识产权领域的实务工作者和高校学生也非常需要。调查数据显示,85%的实务工作者和72%的高校学生遇到过知识产权问题,其中26.3%的非知识产权专业的实务工作者经常面临知识产权问题,如图1所示。
充分掌握知识产权文献信息是解决知识产权问题的基础,在获取知识产权信息的过程中,绝大多数的知识产权专业人士、大多数的学生和实务工作者会通过网络来寻找答案,如图2、图3所示。可见,网络已经成为人们获取知识产权文献信息的主要渠道。
(二)“免费”网站更受青睐
目前,网站数量浩如烟海。根据是否收费,可将网站分为收费型网站和免费型网站。高校、科研机构网站,政府部门网站是典型的免费网站;专业性商业网站是典型的收费网站。收费网站也包括商业购买,如德伦特的WPI数据库。根据调查,在高校学生和实务工作者中,使用收费网站者还是少数,学生中只有17.7%的人使用收费网站,实务工作者中23%的人使用收费网站;即使是以知识产权为业的专业人士,使用收费网站的比例也只有42.6%,没有过半。可见免费网站为大多数人使用,见图4。人们使用政府部门的网站是因为消息权威,数字和文献索引可靠。但是,并非如人们想象的只要是免费就是最受欢迎的。在具体分析问卷时我们发现,如果收费信息更有针对性,具有独一无二性,能高效地解决问题,专业人士也很愿意使用收费网站。另外,学生认为他们使用的网站是免费的,这也是一种误解。因为高校和科研院所的网站实际是付费的,只是费用由高校和科研院所来支付或者解决了。
(三)信息渠道不愿拓展
无论是收费网站还是免费网站,都是开放的市场,相关市场上的竞争者很多。人们通常认为信息越多越好,自己可以在数以万计的网站上检索来获取所需的知识产权文献信息。调查显示,这是一种想当然地误解。人们在应用网络信息时大多数人并不喜欢去探索新的信息渠道,往往偏好一两个熟悉或者用惯的网站,即使是每天都要运用知识产权信息的专业人员也是如此,他们中对知识产权文献信息渠道都较熟悉的人也只占到了11.5%,见图 5。
总结以上数据可以发现,人们对知识产权信息的需求很大,对通过网络获取知识产权文献信息的依赖性很强。普通人群倾向于使用免费的网站,但是对于免费的理解有偏差,同时绝大多数人获取知识产权信息的渠道仍限于少数常用的几种。
三 知识产权信息利用中存在的主要问题
(一)信息零散,缺乏系统整理
据调查数据显示,当前知识产权文献信息利用中存在的问题是:信息零散、缺乏系统整理。在本课题组“关于当下文献利用中存在的问题”的大类调查中,我们设置了“您认为目前我国知识产权信息方面的主要问题是什么”的问题,列举了四个问题:第一,信息太散,加重利用困难;第二,缺乏规范管理,利用不便;第三,信息公开不够,许多信息找不到;第四,公众的信息利用能力不强。在调查者中,共有45.1%的实务工作者、41.6%的高校学生和41.2的知识产权专业人士对此进行了选择(见图6),同时,68.7%的知识产权专业人士、61.8%的高校学生和70.7%的实务工作者认为众多知识产权信息“缺乏规范、系统的整理,利用不便”是我国知识产权信息方面存在的主要问题。可见,当前最缺乏的是一个将知识产权文献信息进行规范化、系统化整理,较为完备并及时更新的数据库,供信息需求者快速、准确地找到其所需的信息。
(二)信息渠道单一
在上文提到,只熟悉一两种常用的和限于使用熟悉的人数在学生中占到了84.7%,在实务工作者中占到了87.1%,而在每天都要运用知识产权信息进行工作的专业人员,对知识产权文献信息渠道都较熟悉的人也只占到了11.5%。可见,人们对知识产权信息渠道的利用范围过窄。如果没有一个完备的、及时更新的信息库,人们势必会因信息渠道的狭窄降低获取知识产权文献信息的范围和速度,而在知识经济、信息经济高度发展的今天,第一时间掌握有效的信息就是最大的竞争优势,相反获取信息的低效必然会降低工作和生活的效率。
问题是我们是否要强行拓展人们获取信息的渠道?回答这一问题要考虑以下背景情况:第一,不同渠道的信息数量大小不一、质量良莠不齐;第二,获取信息的能力本身需要长期的培养,而人们搜寻任何一个特定信息的时间是有限的,永远不可能搜寻完所有的渠道。因为人的精力是有限的。基于这两个前提可以发现,把主要精力放在强行拓展人们获取信息的渠道上是不必要、也是不可行的。那么,依存于现有的获取渠道,是否就对解决获取信息问题完全足够了?经过调查分析,答案也是不对的,因为前提必须是现在存在一个令人满意的、较为完备的、及时更新的、系统整理的信息库,而令人遗憾的是,现在还没有建成一个“较为完备的、及时更新的、系统整理的信息库”。
四 知识产权文献及信息资料库的建设目标
针对“信息零散、缺乏系统整理”这个问题,我们认为构想一个好的知识产权文献信息资料库是必须的,而这个好的标准就是知识产权信息使用者的需求。在设计问卷时我们着重对这一部分进行了设计,通过分析整理各类信息使用人给出的选择,勾画出了一个理想资料库的蓝本,该蓝本有以下三个属性。
(一)针对性
人们认为经常使用某一数据库或者期待某一数据库的出现的理由归纳如图7所示。
但是,对于信息全面的理解却因主体不同而不同。知识产权信息按照子学科可以分为:专利问题、商标问题、版权问题、其他知识产权问题。从学生对这四方面问题的接触、感兴趣程度以及实务工作者在工作中接触到上述各类知识产权问题的比例来看,专利、商标和版权问题构成了知识产权信息需求的绝大多数,三者总体相近,略有差别,见图8。在学习和研究领域,版权信息的需求最强,其次是专利问题,再次是商标问题;而在实践领域,对于专利信息的需求最强,其次是商标、版权。
在信息的整理需求上也反应了一个我们忽视的现象。比如,我们通常认为知识产权方面的社会服务信息是非常重要的,而在对数据分析后的发现却完全不同。我们在分析上述数据时将知识产权信息分为:研究论述、相关立法和制度、专利等权利信息、社会服务信息、其他等五类。在针对知识产权专业人士的调查问卷中,对这五类信息的需求从大到小分别是专利等权利信息>相关立法制度>研究论述>社会服务信息>其他,见图9。基于此,我们认为,应当着重收集整理权利信息和立法制度,其次收集整理研究论述,再次收集整理社会服务信息等。因此,未来数据库的建设应注重其针对性。
(二)智能性
多数受访者认为,认可一个知识产权数据库(网站)的理由是使用方便,这也是专业人士和实务工作者经常光顾某一知识产权数据库(网站)的首要理由(见图7)。这里,使用方便和智能性是同一个问题,只不过前者是从使用者的感受角度,后者是从数据库设计角度的考察。智能性有三个要求:系统整理、功能强大和操作简便。如前所述,当前知识产权文献信息最大的问题是信息零散、缺乏系统整理。系统整理是指数据信息按照人们的检索习惯分门别类,以帮助检索者快速、准确的定位。而功能强大是指数据库除了能够提供资料之外,还能够进行一定的资料分析。比如根据关键字等将不同数据之间自动关联,标注出相同与不同,帮助使用者进行高效的分析对比。在调查中,71%的知识产权专业人士、58.6%的实务工作者和63.8%的学生认为一个理想的“国家知识产权文献及信息资料库”应当具有的特征就是系统整理,见图10。
智能性的最后一个要求是操作简便。操作简便是从使用者角度说的。而从数据库设计角度说,就是符合用户使用习惯。应当说,百度等一般公共数据库的设计已经很贴近用户习惯,具体体现在其界面简单、操作只要一次点击即可完成检索等特征。在问卷中,学生、实务工作者和专业人士都将检索简便看成是一个理想的“国家知识产权文献及信息资料库”应当具有的首要特征,足见其重要性。表面上看,操作简便似乎与功能强大有冲突。但,事实上我们也不能为了操作简便而牺牲数据库的功能强大这一特征,两者需要平衡。对于这一点,调查数据反映的情况很有意思。不同用户对“检索简便”的要求不同,实务工作者>专业人士>学生,非知识产权专业的实务工作者对“检索简便”的要求最高,因为非专业人士往往不会花太多时间去研究、区分各个数据之间的关联,只是要求快速找到。而学生则由于对计算机和网络的运用能力较强,所以对“检索简便”的要求并没有实务工作者那么强。对于知识产权专业人士,由于其对知识产权信息的利用更加深入,因此在要求“检索简便”之外,更注重其功能的强大,他们的需求在前三项中处于中间状态,明确表示了既要方便又要功能强大,而智能化,就是他们第一位的要求。因此,在进行数据库设计时,可以将数据库的检索等功能界面分成快捷检索和专业检索,快捷检索充分满足操作简便的要求,而专业检索中设置强大的数据分析对比功能,这样就可以照顾到不同用户的需求。总结起来,智能性要求系统整理、功能强大和操作简便。
(三)部分免费性
多数受访者认为,其认可或经常光顾某一知识产权信息数据库(网站)的理由是不需付费,如图7所示。似乎全部免费才是我们建设的目标,但这显然不符合市场经济发展的要求。根据调查数据,只有高校学生才将不需付费作为其经常光顾某一知识产权数据库的首要理由,而实务工作者和知识产权专业人士都将不需付费作为其认可某一知识产权数据库的末选理由,如图7所示。个中原因非常清楚:绝大多数高校学生没有收入,将不需付费选作首要理由是情理之中的,但高校学生不付费并不意味着数据库不收费,各高校的图书馆往往会购买数据库资源,本校学生在使用中不需付费,费用由各高校出。基于以上原因,未来的数据库可以收费,并且收费也是激励数据库不断发展和完善的直接动力。那么是否所有数据都应当收费,费用如何分担?这方面的调查数据分别汇总于图11和图12。
对于来自学生的数据,上面已经分析,其对收费性的看法并不全面和科学。故在此着重分析实务工作者和知识产权专业人士对这一问题的看法。实务工作者和知识产权专业人士认可度最高的分别是“政府部门提供的公共信息:免费;商业机构提供的信息商品:收费”和“一般法律法规、司法文书、专利审批信息:免费;经过了加工整理的信息:收费”两个选项。这两个选项相同点在于从内容上分析,政府部门(这里的政府部门泛指官方)提供的公共信息就是一般法律法规、司法文书、专利审批信息,商业机构提供的信息商品一般就是经过了加工整理的信息;不同点在于从提供主体上分析,前者将政府提供的归为免费,后者没有做提供主体上的区分。即使存在角度的不同,总体上这两个选项还是有很大的相同点。即人们认为知识产权数据库在收费方面采取的理想规则是未经加工整理的一般法规、司法文书、专利审查信息等公共信息免费,其他经过加工整理的公共信息和非公共信息收费。这一调查结果和知识产权的权利框架相吻合,即未经过加工整理的信息,即使是公共信息也是知识产权法的保护对象。
五 资料库建设的手段
(一)国家扶持,商业化运行
在“您认为国家对‘国家知识产权文献及信息资料库’的建设和运行中所起的作用”问卷中,实务工作者和知识产权专业人士对该选项选择的比例一致性最高,都认为由国家参与数据库的建设与运行是合适的,见图13。分析其中的原因,我们认为,首先,国家知识产权文献信息数据库涵盖内容广泛,成本较大,一般个人与团体无法完成;其次,数据库中有一大部分数据是来自于国家的行政机关的权利信息、司法机关的裁判信息,国家机关出面收集,工作将更加顺畅;最后,具体运行需要商业的效率,应当由非国家机关具体建设运行。
(二)单独建立网站
国家知识产权文献及信息资料库兼具政府支持和商业运作的特点,其表现形式是一个网站。对于该网站建设的方式,在提供给受访者的选项中,单独建立网站的支持率最高,见图14。
六 资料库建设的效果
(一)解决实践问题
在当下知识产权信息需求巨大和信息提供缺乏全面、系统性这一矛盾突出的环境中,解决实践问题、推动国家知识产权文献及信息资料库建设运行是信息使用者的共同心声。在“您认为‘国家知识产权文献及信息资料库建设研究’的目标是(可多选)”的问卷中,“解决理论问题”的支持率最低,见图15。可见,需求主体更关心能否解决实际问题。
(二)以理论研究结果和资料库模型为成果
实践问题需要考虑的一个重要因素是成本。一个完整的数据库需要的人力、财力成本虽然对国家来说可行,但对于一个课题组来说显然已超出其承受范围。建设一个完备的资料库模型是现实的和可行的,这一点也为信息使用者所支持,见图16。
结 论
科学调查编码化的结果是解决未来“知文资库”的有用性。建设“国家知识产权文献及信息数据库”,根据信息使用人的需求将信息统一整理、分门别类做出比较分析,是科学地解决全社会知识产权问题并提升效率的有效途径。因此,资料库是一个载体,其内容是知识产权资料和文献信息。知识产权资料和文献信息本身可以满足大众的需求,但是将这些内容以大众所需要的科学的方式编码化就是资料库建立的目的。这是一个非常宏大的工程,并非盲目想象即可完成。必须做广泛深入的调查研究,从中获得可靠的第一手资料,使我们得到一个反映需求和供给之间的正确结论。本文的调查数据清晰地表明社会各界均需要知识产权文献和数据信息,他们并不满足于现有的信息利用方式;不同的受众对未来的知识产权数据库是否免费认知不同,知识产权专业人士更希望付费从而获得针对性和专业性强的数据库,公众也存在信息渠道不愿拓展,以方便为主的现象。因此,未来“知文资库”应以信息针对性强,信息处理手段智能化、人性化,操化方便并实行部分资料免费为建设目标,以单独建立网站,依托国家资金,商业成长性运转作为其运营模式。
注 释:
①文中图1~16均为作者根据调查数据绘制而成。