APP下载

网络原生数字资源开发利用策略研究

2014-06-18李娜宋生艳

经济师 2014年4期
关键词:开发利用

李娜++宋生艳

摘 要:文章在分析网络原生数字资源内涵与特征的基础上,简述网络原生数字资源开发过程中涉及的几个突出问题,进而引入新时期我国信息资源开发利用战略思想,从政策支持、采集与储存、信息深度聚合与动态组织、完善立法等方面提出网络原生数字资源开发利用的相关策略。

关键词:网络原生数字资源 开发利用 开放存取

中图分类号:F49 文献标识码:A

文章编号:1004-4914(2014)04-062-02

互联网为人们提供充分开放、自由发表言论及传播信息的平台,基于人类互联网活动而产生的网络原生数字资源也因此应运而生,呈现几何级增长。据CNNIC2008-2009中国互联网研究报告统计:截至2008年12月31日,中国的青少年网民达到1.67亿人,占到全国网民的55.9%。可见,网络原生数字资源逐渐成为互联网时代数字信息的主流,探讨网络原生数字资源开发利用策略,对提高用户的低碳意识,传承社会特色文化,具有重要的历史价值和学术价值。

一、网络原生数字资源概念界定

综观国内外目前对网络原生数字资源的研究,究竟何为网络原生数字资源,时至今日还没有统一的定义。联合国教科文组织(UNESCO)把原生数字资源定义为:除了数字形式再没有其他载体形式的信息资源。也可以从两个方面理解:一是直接产生于互联网活动是网民在互联网活动中的即兴原创,并直接发布,具有网络“原生态”性。二是网络原生数字资源从产生、发布、传播交流到最后的长期保存都只能以数字载体形式存在。在低碳背景下,网络原生数字资源借助新媒体技术生产的特色资源,具有与其他网络信息资源相区别的网络原创性、数字形式唯一性和极易灭失性等独特特征,构成当前和未来网络数字资源发展的高级阶段。

二、网络原生数字资源开发过程中存在的突出问题

(一)开发活动缺乏战略思想指导及总体规划

当前,由于网络原生数字资源缺乏政府主导,我国信息资源开发各自为政现象十分严重,其开发战略思想仍然处于基础性开发阶段,信息资源的深度挖掘、资源的再组织等“瓶颈”约束问题日益突出。另外,缺乏网络原生数字联盟共建共享的机制,信息共建共享程度低。

(二)知识产权问题成为瓶颈问题

目前,缺乏开放获取背景下知识产权保护与共享的相关法规,客观上制约了网络原生数字资源的开发、传播与共享。

(三)网络原生数字资源长期保存复杂和棘手

相对于其他非原生网络数字资源,网络原生数字资源具有网络原创性、数字形式唯一性、极易灭失性等独特特征,因而开辟一条不同于非原生网络数字资源的保存标准、保存方法,从保存技术而言,也更加复杂和棘手。

三、网络原生数字资源开发利用策略

(一)总体规划,创新网络原生数字资源开发战略思想

我们应该看到,新信息环境下,资源产业建设是增强国家综合国力和国际竞争力的重要标志,要实现党中央设定的2021年达到更高水平的小康社会、2049年基本实现现代化的目标,必须把强化资源的国家控制力作为主轴。从宏观上,政府应当制定资源开发规划,从技术、经济、法律、人文方面对网络数字资源进行综合性调控,设立网络原生数字资源开发基金,并针对网络数字资源的不同类型和性质,采用市场驱动模式,加大对信息资源产业的扶持力度,促进网络原生数字资源开发有章可循。从微观上,图书馆行业、科研机构等部门要界定本行业资源的开发范畴,应用现代信息技术、采取合作机制,科学有序地加快网络原生数字资源开发利用进程。

(二)网络原生数字资源的采集和保存

网络原生数字资源的原创性、唯一性和极易灭失性等特征要求人们重视其采集和长期保存。总结国内外一些具有代表性的案例,结合我国实情,依据保存范围的不同,采集方式分为批量采集、专题采集、选择性采集和混合式采集四种,资源开发部门应依据需求选择合适的方式采集。

1.批量采集。它是利用机器人、爬虫等搜索工具,将目标网站上的所有网络原生数字资源全部采集下来的一种收割方式。通常是采用自动采集机对域名内的网站进行自动收割,需要投入大量资金和技术设备,因采集信息量大,垃圾信息难以控制,信息质量良莠不齐。

2.选择性采集。它是依据网络原生数字资源的文化、研究和经济价值,有选择地保存信息的一种收割方式,是对所保存的每一项主题都要经过价值评判、甄别、评估,然后优先选择所需的、高质量的资源进行采集,采选的信息质量高。但内容甄别、筛选非常费时费力,这种方式主观性较强,一些有特殊价值的信息可能会采集不到,而永久隐藏在网络深处得不到利用。像英国的UKWAC项目、克罗地亚HAW项目就是选择性收割方法。

3.专题采集。专题采集是针对某一主题进行信息资源收割策略,既能反映某一事件的全貌,也能满足用户对特定主题信息的需求。具有代表性项目如美国Minerva项目同Internet Archive合作,收集像伊拉克战争、9ll事件等某一主题信息进行专题采集。

4.混合式采集。上述三种信息采集方式各有优缺点,但三者可以互相补充。混合式采集就是将三者综合运用,最终将资源采集策略最优化。对于不同类型的网络原生数字资源,可以选择最合适的采集方式加以收割,研究欧洲18个WA项目,发现大多数是选择混合式采集方式。

5.采集与保存的标准、策略。鉴于网络原生数字资源变幻莫测、极易灭失等特性,图书馆在进行网络原生数字资源采集与保存时面临诸多问题,主要包括:如何收割动态网站、音/视频网站、个人网站等原生数字资源,如何将收割下来的资源科学、有序地呈现给用户,如何收割那些加密或收费的网络原生资源等等。为了使网络原生数字资源采集和保存畅通有序,应当构建资源采集和保存标准,这些标准主要包括:网页存档格式标准、资源编码标准、资源标识/著录标准、资源选择标准、无数据编码与传输标准、数据存储转换格式标准等等,以约束采集和保存的整个流程,并在完善组织技术、方法的前提下,实现网络原生数字资源组织与OA技术的无缝链接和有机融合。endprint

(三)关联数据的资源深度聚合

研究发现,未来原生数字资源知识组织体系(下转第64页)(上接第62页)的主攻方向和新研究视角是知识链接与知识关联的研究。为此,应当运用网络对信息资源的调配算法:蚁群算法、遗传算法和模糊聚类算法等,实现关联数据的信息动态聚合、信息检索技术等,将网络原生数字资源“碎化”为具有一定语义的细粒度知识元,以批量、智能化地处理多样化的网络原生数字资源,改变网络原生数字资源的信息揭示方法、信息组织方式,将用户信息需求意图与网络原生数字资源进行聚合,实现面向用户的网络原生数字资源的多粒度、多层次的动态组织模式,把有利于用户认知的方式的网络原生数字资源加以组织后展示给用户。

(四)加快立法工作,提升法律支持环境

社会信息化的起点和归宿是信息资源的开发利用,而网络原生数字资源作为新的生产要素、新的资源类型,已构成信息资源产业开发的一个重要组成部分。为保证资源采集、保存、利用无后顾之忧,互联网信息采集与保存相关立法显得十分重要。首先要重视解决版权和知识产权问题,图书馆在针对一个网站实施资源捕捉、存档和供用户利用之前,要提前获取网站所有者的许可。其次要建立数字出版物和互联网原生数字资源的呈缴制度,通过立法来约束数字出版物及原生资源创作者或法人向指定的开发机构提交其原生数字产品。研究发现,法国、英国等国家是网络原生数字资源呈缴制度方面的先行者,其以法律形式规定了图书馆对该国网络原生数字资源采集和保存的权利和义务,值得我国资源开发者借鉴。

四、结语

在开放获取的环境下,网络原生数字资源建设的共享联盟是发展走向。为此,我们认为,各图书馆在开发网络原生数字资源阶段,一方面要以本机构的用户需求为主导,自主创新本机构的资源开发和利用。另一方面要融入开放获取(OA)与合作分享智能资源,教师和各研究机构联盟建设知识仓储,以此扩大图书馆资源覆盖范围,最大限度地实现网络原生数字资源的共建共享。

[基金项目:本文为山西省社科联2013至2014年度基金项目“网络原生数字资源开发利用策略研究”(项目编号:SSKLZDKT2013095)研究成果之一。]

参考文献:

[1] PalfreyJ,GasserU.Born dig ital Understanding the f irst generationof dig ital nat ives. New York:Bas ic Book s,2008.

[2] 中共中央办公厅、国务院办公厅关于印发《2006-2020年国家信息化发展战略》的通知(中办发[2006]11号)

[3] 常娥,袁曦临.网络原生数字资源管理问题探析[J].图书馆建设,2009(5)

[4] 索传军.网络信息资源组织研究的新视角[J].图书情报工作,2013(7)

[5] 陈红星,张淑芳.网络原生数字资源:概念、特征与类型[J].图书馆建设,2010(5)

(责编:吕尚)endprint

猜你喜欢

开发利用
旅游档案的开发利用方法浅论
校园体育场地和器材资源现状分析及开发利用
档案文化资源的开发利用
审计供给侧改革背景下的审计成果利用探析
天台县忍冬科野生观赏植物资源及开发利用
云南食用花卉开发利用浅析
档案的开发利用在供电公司全面管理中的作用