APP下载

大数据环境下地理标志产品保护与监管系统对申报流程的影响

2016-05-14朱跃林朱万颖蒋慧菊朱竹

科技创新导报 2016年5期
关键词:标志数据挖掘申报

朱跃林 朱万颖 蒋慧菊 朱竹

摘 要:地理标志产品因其关联于特定地域的自然与人文因素所形成的特色表现,具有显著地大数据特征,其知识产权的区域公益性和对贸易日益重大的影响。我国地理标志产品资源丰富,但相关的保护起步较晚,且目前地理标志产品的申报依然处于人工阶段所以效率依然低下,迫切要求实现向基于信息化的地理标志产品全业务全流程保护与监管系统的科学转变,以最大程度地保护我国地理标志产品。该文将对地理标志产品保护与监管系统在大数据环境下对地理标志产品的申报所产生的影响进行讨论。

关键词:地理标志产品 大数据 申报流程

中图分类号:P208 文献标识码:A 文章编号:1674-098X(2016)02(b)-0080-02

文章将基于地理标志产品申报全业务全流程的专业知识,主要是针对地理标志产品保护申请流程,结合大数据相关数据挖掘、分析处理等手段,对地理标志产品保护与监管系统在大数据环境下就数据采集、分类、汇总等方面进行分析。

1 地理标志产品

地理标志产品指产自特定地域,所具有的质量、声誉或其他特性取决于该产地的自然因素和人文因素,经审核批准以地理名称进行命名的产品。

2 大数据环境

2.1 大数据

大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理的庞大的数据集合。大数据的5 V特点(IBM提出)分别为:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性)。

2.2 数据挖掘

大数据有着量大、多变、复杂等特点。所以要在这庞大的数据中寻找到隐藏的、有用的资料十分困难。而大数据的潜在价值主要表现在数据与数据之间的关联性。所以需要通过数据挖掘等方式来获取合理、有用的数据。

2.3 地理标志产品数据定义

根据数据的来源与数据的应用领域进行界定,可以把地理标志产品数据定义为:(1)地理标志产品保护申请信息数据;(2)地理标志保护产品专用标志使用申请信息数据。

2.4 地理标志产品数据分类

地理标志产品大数据按其数据结构可分为:结构化数据、半结构化数据和无结构化数据。

文本数据按来源及收集方式可以分为:显示数据、系统数据。显示数据是指由用户主动输入或者输出用于显示的数据。系统数据是指系统自动生成的数据,主要为申请信息数据在工作流程中阶段状态、受理公告、批准公告、核准公告。数据类型图见图1。

3 地理标志产品保护与监管系统对申报流程的影响

3.1 数据来源

系统中的数据分为两类:地理标志产品保护申请信息数据、地理标志保护产品专用标志使用申请信息数据(因此文主要分析对象为地理标志产品保护申请流程,故地理标志保护产品专用标志使用申请信息数据暂不考虑)。来源为有申请者输入的文本数据。

地理标志产品保护申请信息数据中文本数据主要包括:产品名称、产品类别、产地范围、产地地理特征、产品的理化感官等质量特色、产地的自然因素和人文因素、产品生产技术规范、产品知名度、销售情况、历史渊源说明。

3.2 地理标志产品保护申请工作流程整理

由现有地理标志产品保护申请流程可知,申请流程主要分为申请、初审、形式审查、公示、技术审查、批准6个阶段。通过集成大量的地理标志产品保护申请信息数据,经过数据汇总、合并、过滤、解析,将收集的大量的数据整理成便于系统使用结构化数据、半结构化数据和非结构化数据。如设定统一的申请号、受理号、批准号格式,确定文本的长度及内容限制、拟定附件的格式限制。

3.3 数据挖掘与分析

在大数据环境下,利用数据挖掘方式,获取地理标志产品保护申请流程中在初审阶段、形式审查阶段、技术审查阶段中被打回的数据的原因。通过建立数学模型进行数据分析,总结出易犯错误及优质的申报机构。

3.3.1 总结出易犯错误

设定在地理标志产品申报过程中因各种原因需补正或整改材料被打回或是不予受理的总次数为x,因某种原因需补正或整改材料被打回或是不予受理的总次数yn,n=1,2,3,4,...,m,每个数字对应一种错误,即y1代表的是因产品名称不符合规范这一错误而被打回的总次数,m为错误种类最大数。

根据数值偏差算法:偏差值p=yn-x/m;可得知p值区间为(-∞,+∞),经总结可发现如下规律:(1)数值偏向+∞时,代表这一类错误经常出现,需要注意。(2)数值偏向0时,代表这一类错误也会出现,但是出现的频率不高。(3)数值偏向-∞时,代表这一类错误只是很少或偶尔出现。由以上结论可以得知何种错误属于易犯错误,可在申报之初就提醒申报者注意,以减少犯错的可能性。

3.3.2 筛选优质的申报机构

与1中所述同理,设定在地理标志产品申报过程中因各种原因需补正或整改材料被打回或是不予受理的总次数为x,设定省局初审通过后,在形式审查阶段和技术审查阶段因需补正或整改材料被打回或是不予受理的总次数为sj,其中j=1,2,3,4,...,k,每个数字对应省级质量技术监督部门或出入境检验检疫部门,在此便不一一列举赘述了。k代表所有省级部门总数。

根据数值偏差算法:偏差值q=sj-x/k,可得知q值区间为(-∞,+∞),经总结可发现如下规律:(1)数值偏向+∞时,代表该机构初审通过后的地理标志产品申报信息任然存在较多问题,可提醒该机构加强初审力度。(2)数值偏向0时,代表该机构初审通过后的地理标志产品申报信息任然存在部分问题,需要注意。(3)数值偏向-∞时,代表该机构初审通过后的地理标志产品申报信息任然存在较少问题,可将该机构列为优质上报机构。

4 分析及优势总结

在大数据环境下地理标志产品保护与监管系统对依然处于传统人工阶的段标志产品的申报流程将起到极大的促进作用,可加快地理标志产品申报流程,加速我国对地理标志产品保护的步伐。且由于大数据分析后可以得出在申报的过程容易出现的错误,在申报初期提示申报机构,以避免人力和时间的浪费。而一些被筛选出的优质申报机构,可向社会公布供选择,也可对一些存在较大问题的申报机构给予有针对性的干预措施。

(致谢:该项目受到质检公益性行业科研专项项目《质检行业大数据关键技术研究及典型应用示范》的资助。)

参考文献

[1] 佚名.地理标志产品[J].China Fruit News,2008, 25(1).

[2] 佚名.地理标志产品保护[J].中国蔬菜,2008,1(1):8.

[3] 宋军,暴志军.地理标志产品保护[J].品牌与标准化, 2009(10):44-45.

猜你喜欢

标志数据挖掘申报
“少年工程院活动校”暨“航天未来人才培养校”共同申报
多功能标志杆的使用
国际收支间接申报问答
认标志
基于并行计算的大数据挖掘在电网中的应用
《申报》与上海民国时期禁戏
一种基于Hadoop的大数据挖掘云服务及应用
医改进入新阶段的重要标志
基于GPGPU的离散数据挖掘研究