众包模式下的个人原生数字资源长期保存平台研究
2021-09-23袁留亮
袁留亮
【摘要】 个人原生数字资源的长期保存对个人、社会、国家和民族都有非常重要的意义。目前有关个人原生数字资源长期保存的研究很少。为促进个人原生数字资源长期保存的研究,本文介绍了个人原生数字资源的概念、类别和特点,从众包的角度提出建设个人原生数字资源长期保存平台,并阐述了众包模式在个人数字资源建设平台中的应用方法,为个人原生数字资源长期保存提供参考。
【关键词】 众包模式 个人原生数字资源 数字资源长期保存 资源建设
引言:
第 47 次《中国互联网络发展状况统计报告》显示截至2020年12月,中国大陆手机网络用户达9.86亿。人们的学习、工作、生活等活动已全面被卷入了数字网络化浪潮。人们一边消费多种数字资源,一边又不断生产独具个人特色、内容丰富和形式多样的个人原生数字资源。研究表明个人原生数字资源不但是个人重要的资产和记忆,是社会和国家重要的信息资源,还是人类重要的文化遗产。但由于受技术和环境等因素的影响,无论组织还是个人都常为保存各类电子资源付出不同的代价。个人原生数字资源具有网络原创性、数字形式唯一性、杂糅性、极其脆弱性和开放存取性等特点,它极易流失且保存成本高[1]。
研究个人原生数字资源的保存问题,有利于提高个人的数据保存意识和信息素养,改善他们的数字化生存质量,也有利于丰富国家的数字资源存档体系,挖掘个人资源价值,为文化遗产传播提供资源保障。目前已有文献对个人数字资源长期保存进行了一些研究,但有关个人原生数字资源及其长期保存的研究还比较少 [1]。
众包原指公司或机构将内部员工的工作任务以公开召集的方式外包给不确定的网络群体的做法。众包是一种广受推崇的成功商业成功。研究发现众包模式在数字资源建设中的平台规划、资源的评价、选择、采集和组织等阶段均具有可行性,组织者可将众包的理念和方式应用到数字资源建设[2]。故为降低个人原生数字资源长期保存的成本,提高工作效率,本文将根据个人原生数字资源的类型和特点,阐述众包模式在个人原生数字资源建设与长期保存中的应用方法。
一、个人原生数字资源
1.1个人原生数字资源的概念、特点和类别
个人原生数字资源指“个人在日常生活、学习、工作中出于一定目的,借助电脑、手机、数码相机、PDA 等设备和网络,以数字形式生成、发布、传播、交流、保存、利用的一种信息资源”[1]。个人原生数字资源保存是指“个人在其工作、生活和学习中对由自我产生的原生性数字信息进行价值判断后,通过一定方式对这类数字资源进行有效的不确定期限的保管和维护,以供个人或社会再次获取或利用的实践行为”[1]。个人原生数字资源是个人原创的资源,它具有网络原创性、数字形式唯一性、杂糅性和脆弱性。
按照信息存储的格式,个人原生数字资源可分为文本型个人原生数字资源、音频型个人原生数字资源、图像性个人原生數字资源和视频型个人原生数字资源。按照信息公开的程度,个人原生数字资源可分为完全公开的白色个人原生数字资源、半公开的灰色个人原生数字资源和保密的黑色个人原生数字资源[3]。
1.2个人原生数字资源的特点对长期保存的影响
1.2.1杂糅性对长期保存的影响
个人原生数字资源的杂糅性主要表现在资源创造者的杂糅性、创造资源的目的、资源价值和总类的杂糅性。个人原生数字资源的创造主体可以是全部电子设备用户,他们来自不同的行业、地区、民族,拥有不同的知识背景和生活阅历,不同信息资源创造者的信息创造水平和信息处理能力对他们的信息资源价值有很大影响。故个人原生数字资源的创造主体的杂糅性对资源选取、资源评价等活动会产生很大的影响。人们在生活、工作、娱乐和学习中会有意和无意的创造不同类型和不同保密程度的数字资源。不同的数字资源需要不同的保存方式,也会因不同的使用目的产生不同的价值。故个人原生数字资源的创造目的、资源价值和总类的杂糅性对长期保存的技术与方法、保存平台均有不同的影响。
1.2.2个人原生数字资源单一性和脆弱性对长期保存的影响
个人原生数字资源产生于个人的电子设备或网络中,个人为了未来使用和检索把它们存储在自己或者公共的空间。个人原生数字资源对个人的电子设备、账号或网站服务器有很强的依赖性,随着个人物理介质的损坏,服务器的更换或系统的更新,个人原生数字资源都随时面临毁灭的危险。
小结:不同类别个人原生数字资源具有不同的社会价值和经济价值。研究者应根据个人原生数字资源的类别探索和挖掘它们的潜在价值。目前个人原生数字资源主要以个人存储为主,由于受个人经济水平和信息素养、数字资源本身特性、网络环境和政府政策的影响,人们的原生数字资源的保存能力参差不齐。如果个人原生数字资源完全依赖个人存储,这些数字资源随时可能因某些因素被毁灭。如果完全依赖机构或者政府,由于个人原生数字资源种类繁多且良莠不齐,对其完全存储花费巨大。故本文考虑到众包模式在个人原生数字资源长期保存中技术可行性、模型可行性和人员参与的可行性,结合个人和机构保存的优点,从项目和平台规划、资源分类采集和评价筛选、平台管理、后期维护等方面开展众包模式在个人原生数字资源长期保存中的应用研究,根据个人原生数字资源的生命周期,建立一种长期的、可持续的存储机制。
二、众包模式下个人原生数字资源长期保存的策略
2.1制定收藏政策
由于个人原生数字资源数量巨大,类型多样,分散度大,价值密度低,数字资源保存应根据不同的建设项目进行合理的规划,构建合适的技术平台,从而实现对不同类别和不同价值的数字资源进行保存。组织者应先规划保存目标、制定收藏政策,确定保存的信息资源类型,根据知识产权法规确定保存范围、重点和标准,区分保存级别。最后根据收藏政策和资源类型,确定众包的对象。鼓励用户收集网上已有的原生数字资源,或鼓励用户亲自创造原生数字资源。研究表明众包用户有能力完成那些需要专业技能和知识的工作[4]。
2.2建设众包支持技术与平台
数据的长期保存是为了未来的检索和使用,故组织者需要根据保存目标建设不同的平台[4]。目前众包平台主要有全自建平台、半自建平台和通用平台。全自建平台是指平台由机构全自助开发。这类平台成本相对高,但稳定性强、个性化和针对性都高。半自建平台主要指基于已有平台或开源软件开发或修改的平台,这类平台成本相对低,应用广泛,成熟度高,平台可快速组建。通用性平台指支持众多众包任务和项目的平台,如一些门户网站和社交平台,这类平台成本低廉,用户多,开放性强,但功能有限,针对性和个性化弱。在选用不同平台时,组织者也要考虑其技术的有用性、易用性,以及技术对结构资本、关系资本和认知资本等社会资本的支持程度。已有研究表明有用性、易用性和社会资本对用户的持续使用态度和行为有显著的正向影响。
2.3平台资源的建设
资源平台需要一个严格的流程监督众包模式在资源建设和数据保存中的应用,如数据选择与采集、数据组织与管理、数据评价等。
1.数据选择与采集中的众包行为。研究表明无论是众包参与者收集数字资源,还是创造个人原生数字资源,他们能采集到种类更多、范围更广泛、数量更大的数字资源。同时众包模式的数据采集与创建的成本较低,更适合长周期的数据收集与保存活动。众包参与者依据平台的数据收藏目标和政策,确定收藏范围和数据类型,依据收藏价值、可使用性、知识产权等标准进行数据收集[5]。
2.数据组织与管理中的众包行为。由于众包用户常相互不熟悉,他们采集或者组织的数字资源多为非结构化的资源,无序且凌乱。故为长期保存个人原创数字资源,需要对它们进行标准化的加工和组织。平台首先需要按照一定的分类标准和主题法对资源进行组织,即根据数字资源的外部特性内容主题之间的相关性,把性质相同的资源归入一类,并依照类别的结构关系进行资源组织,然后通过众包模式鼓励用户进行数据增强、数据拓展和数据策展等。数据增强主要是指鼓励众包用户对平台上的数据进行标记和分类等。数据拓展主要是指对一些数字资源添加标签、注释和评论等。数据策展主要是指为宣传保存的信息资源,鼓励众包用户创建、评价和筛选资源呈现和展出的相关元素,帮助确定资源策展工作的优先级。
3.数据评价中的众包行为。由于数据生产者水平不同,平台收集的数据需要进行多种方式的评价。为鼓励众包用户进行评价,平台设计者可以采用一定的技术鼓励用户对资源进行评价。让用户通过点赞和评论的方式对资源的科学价值、学术价值、经济价值、保存价值、传播价值进行评价,同时也组织专业水平较高的用户对资源的准确性、有用性、权威性进行评价。
2.4平台数据的管理与运营
长期保存个人原生数字资源的目的是为了将来的信息检索和利用。个人数字资源长期保存是一个长期的合作过程,故数字资源平台除了积极采用数字更新、数字迁移、数字仿真等新技术外,还要积极采用合适的管理方式,激励众包成员积极参与保存工作。如合理的任务匹配管理,针对不同的类型的任务,给众包用户权利检索和选择相关的任务,或者直接给他們分发或推荐任务。同时也采取多种方式激励成员的内在和外在动机,从而激励他们持续工作。为促进平台的交互性和用户参与度,组织者也要积极采用不同的数字技术,如协作与交互技术、数据管理技术和数据安全与隐私保护技术。
三、结束语
个人原生数字资源是个人和国家重要的资产,是社会的集体智慧,个人原生数字资源的长期保存对个人、国家、民族都有重要的意义。本文基于个人原生数字资源的特征和类别,分析了众包模式在个人原生数字资源长期保存应用的可行性和必要性,并在项目和平台规划、资源分类采集和评价筛选、平台管理、后期维护等方面阐述了众包模式在个人原生数字资源长期保存中的应用,为我国个人原生数字资源长期保存事业提供一定的参考。
参 考 文 献
[1]柴欢. 大学生个人原生数字资源长期保存行为影响因素模型研究[D].西南大学,2020.
[2]蔡培纯. 网络原生数字资源馆藏化建设研究[D].福建师范大学,2017.
[3]夏南强,李倩.网络原生数字资源的类型、特点与开发[J].图书情报工作, 2011,55(03):47-51.
[4]赵宇翔,练靖雯.数字人文视域下文化遗产众包研究综述[J].数据分析与知识发现,2021,5(01):36-55.
[5]蔡培纯,许春漫.网络原生数字资源馆藏化建设面临的著作权问题和对策[J].图书馆学研究,2016(19):82-86+76.