互联网环境下个人数字档案归档研究
2018-09-21吴建军
吴建军
[摘 要] 21世纪随着互联网以及智能领域的发展,个人使用手机、个人电脑、平板电脑以及智能设备的频率不断上升,随之而来的是个人电子数据的急剧增长,从档案学视角来研究对于这些个人数据如何归档管理和利用成为新的研究领域。本文第一部分就个人数字档案的基础来源进行了阐述。第二部分在互联网环境下确定了归档数据的基础上提出了个人数字档案归档收集和管理的设想,包括收集标准和范围、收集方式、个人数字档案具体的管理方法。第三部分主要阐释了个人数字档案的利用以及归档的意义。最后就个人数字归档存在的问题提出了相应的解决办法。
[关键词] 互联网;个人数字档案;归档利用
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 079
[中图分类号] G270.7;G273 [文献标识码] A [文章编号] 1673 - 0194(2018)13- 0175- 03
1 概 况
个人数字档案顾名思义是个人或者一个家庭在互联网环境活动中所产生的文字或者音视频等的数字记载,伴随着各种电子载体尤其是手机的普及,人们在日常的生活和工作当中自动创造了大量的电子数据。这些数据对于不同的主题有不同的价值,对于个人而言,参考这些数据有助于以后的规划和回忆美好人生,对于政府来说,这些数据是管理社会的一项基础参考,对于企业来讲,将这些数据整合在一起形成大数据并加以分析利用,给企业带来利润,而对于档案馆和图书馆,收集这些数据成为必由之路。而随着网络大数据的出现,个人数字档案的收集以及保管利用成为新的研究热点。
2 网络环境下个人档案的归档
2.1 网络环境下个人数字内容的产生和形成
据中国互联网络信息中心(CNNIC)2017年8月份发布的第40次《中国互联网络发展状况统计报告》统计表明[http://cnnic.cn/gywm/xwzx/rdxw/201708/t20170804_69449.htm]:
随着网络的覆盖率范围不断扩大,网民的数量也随之上升,截至 2017 年 6 月,中国网民规模达 7.51 亿。互联网普及率为 54.3%,截至 2017 年 6 月,中国手机网民规模达 7.24 亿,较 2016 年底增加 2 830 万人。网民中使用手机上网人群占比由 2016 年底的 95.1% 提升至 96.3%。如表1所示,每天有庞大的网民规模在使用着各种各样的互联网应用,产生着海量的应用数据,而这些数据都来自于网民的创造和行为活动的痕迹,那么,对于这些个人数字内容的归档就显得尤为重要。
2.2 收集和管理
2.2.1 收集标准
个人数字内容的形式可以分为图片、文字、音视频三大类来归档,根据中国网民各类互联网应用的使用率统计可以看出每个人在日常的互联网生活中无时无刻不在创造着这些内容,其中这三大类数据主要呈现形式来自互联网中的社交媒体:即时通信、自媒体、笔记等各种互联网模式。互联网当中的网民在创造内容的同时将这些内容分散存储在外部设备和载体以及提供服务的互联网公司的服务器上面,其中外部设备包括了手机内存、硬盘、可存储穿戴设备、U盘、存储卡等,各类网盘、云存储、服务器本身存储等商家提供可存储的服务。
在海量的数据当中如何才能更好地搜集和保存有价值的信息资源,确定其收集范围是首要的任务,可以从以下两方面来确定,首先从个人时间方面来确定,比如个人从出生到死亡的时间轴来确定收集的范围,在这个范围内按照鉴定标准收集个人一生中创造的互联网数字档案资源信息。其次根据个人所处的组织机构来确定收集的内容范围,个人在某个机构或者公司中所产生的互联网数据和信息资源根据个人的存储需求来存档,一个人的一生所参加和工作的组织机构比较有限,所以根据组织机构存档会显得更加清晰可寻。最后在确定收集范围时,也可以根据需求采用时间和组织机构相结合来确定存档范围,两者结合可以更好地根据收集目的来确定信息资源的时间和空间,使得收集更加地精确和有效。
在实际的归档中,首先要鉴定所归个人数字文件的价值。鉴定的总原则要从国家、家庭、个人的整体利益出发。相对于遵循归档鉴定原则的机构和复杂多样的个人互联网内容,在互联网环境下制定个人数字归档原则是不太现实的,但是可以从网民个人和社群整体的角度需求来探索互联网环境下的个人数字内容鉴定归档原则即用发展的全面的创新的观点来判别个人数字档案的价值。相对于个人来说,个人数据具有天然的隐私性,保存的个人数字资源不想成为个人的负担且在以后的生活中可以被利用和回忆美好的生活,因此归档时应从个人对于档案的记录、科研等价值的需求来判断,归档鉴定弹性比较大。相对于国家及家庭的整体利益来说,个人互联网环境下的数据反映了社会活动的轨迹,是社会文化的一部分,更是家庭档案乃至社会记忆的重要组成部分,鉴定时应从保留社会文化以及为国家管理活动提供参考和对子孙后代的价值来确定。
其次是具体的收集方式,个人、企业、档案馆、图书馆之间应该紧跟互联网的发展,将个人有价值的信息资源归档。个人的数据一般存储在外部存储设备或者互联网服务器中,那么个人应该树立普识的归档意识,用户自己平时及時收集并将这些数据适时地按一定规则保存起来以备后用,企业现在提供的云存储等服务也在一定程度上解决了个人存储的问题,但是在企业提供这些服务的同时没有提供个性化的归档服务,存储得到了解决,但是规范的归档存储没有得到解决,基于以上问题,企业可以在云存储划归出一部分存储空间,而这个空间是专门为网民提供个人数字资源的归档服务。图书馆、档案馆这些机构应该利用互联网多宣传,让网民了解并乐于归档,以便利用和回忆美好时光,这些传统的归档机构也可以建立自己的服务器来为个人数字归档服务,让网民放心和方便地存储自己的个人数字资源。企业和档案馆、图书馆可以开展合作,企业提供支持扩大效益,同时档案馆、图书馆很好地收集个人数字资源,在新时代互联网环境下完成自己的职能。
2.2.2 管理个人数字档案的方法
管理个人数字档案首先要将这些原始数据分类标引,而元数据分类标引的最终目的是方便地查找和利用,因此为元数据分类标引是个人数字档案归档管理和利用的基础性前提。在建立个人或者家庭数字档案目录中,每个人或者每个家庭的目录下有按统一命名规则的文件夹,这种命名规则如:姓名+时间轴或组织机构+分类的标签文件。对于收集到的个人数字档案,分类整理是利用的第一步,为元数据添加元素标签是管理的第二步,这种管理办法可以制定出一个普遍适从的管理规则,比如文字元数据可以添加“GRWZ”-“个人文字”的标签,然后在细分类管理,依次类推“GRTP”“GRYS”个人图片、个人音视频的元数据标签,个人在归档的时候根据标签进行分类,上传到云或者档案数据库时设置好元数据规范上传格式,通过大数据技术自动分析辨别数据并上传。做好这些准备之后就是个人档案数据的实时更新,实时更新和同步个人档案数据库为今后的查找利用做好数据全面性的准备。
分类是整理的核心,好的分类方法可使整理工作事半功倍。对个人数字档案进行整理的第一步就是要对个人数字档案进行科学的分类,接着对分类好的个人数字档案添加元数据和标签,建立个人独有的方便记录和记忆的个人数字档案目录,最后一步就是更新和同步。个人数字档案经过这样的整理,便于个人的查找检索,为今后的开发利用做好准备工作。
3 网络环境下个人档案的利用
随着时代的进步,每个人都在创造着数据资源,如果不加以归档或者保存的话这些数据将会消失,当今世界数据就是资源,是发展创新的源泉之一。那么对于个人来说归档保存这些数据会对以后的生活和工作发挥借鉴作用,或者对其他人有潜在的学习和利用价值也可以说是一份经验借鉴,起到了一定的教育和指导作用。对于保存自己的美好时光来“记录生活轨迹”让自身档案意识逐步提升,留住记忆的同时被家人或者子孙后代记起起到了非常好的作用。相对于个人来说还有一项重要的作用就是原始数据的记录性,个人数字档案顾名思义是一种档案,那么它就会有档案所具有的真实性、原始性等属性,如果个人在生活中遇到纠纷或者确定直接负责人时,这些档案数据可以作为直接证据用它来维护自己的合法权益及确定责任人!
对于一些学者来说,这些数据有着潜在的科研价值。个人总是生活在某个家族当中,那么这些家族成员的个人档案的汇集就组成了家庭数字档案,对于研究家族史的学者来说,这些数据就是研究的样本和目标且这些数据是极其丰富和真实的存在,对于科研成果的支撑起到了真实而具有说服性的基础作用。不仅于此,对于各专业的学者来说这些个人档案数据都是可以作为研究对象的,比如社会学,可以研究这些数据背后所折射出来的社会现象等。因此个人数字档案不仅仅是一堆个人数据,其所包含的科研价值值得学者去研究和发掘。
对于社会来说,这些数据为社会的管理和文化的留存起到了很好的作用。每个人都是社会的组成部分,人离不开社会,社会也离不开人,社会的运行离不开人的管理,那么这些个人档案数据可以为社会管理提供数据支撑。国家参考这些个人档案数据可以具有针对性,在制定某项政策,有效实施社会保障和管理,让这个国家运行更有效率。每个人是文化的承载者也是文化的创造者,个人数字档案很好地保存了体现在每个人身上的文化内涵。通过形式丰富多样的元数据记录每个人的轨迹,保存体现在每个人身上的我国各地丰富的个人生活和群体生活以及天南海北悠久而又丰富灿烂的历史文化,这些档案记录将成为文化中国和文化强国的有力支撑,更是个人承担中国记忆的历史体现。
4 个人数字档案归档利用中存在的问题及可行性
4.1 防止互联网归档信息的泄露
虽然个人数字信息的归档保存了属于个人或是家族的信息,但是发生个人信息泄露的事件无时无刻不在我们的身边发生着,个人的隐私在互联网上也发生着泄露。个人数字档案经过若干年后会对社会公众开放,但是在开放前,个人的数据归档在档案馆、图书馆的服务器上或是跟这些机构合作的企业的服务器上面,为了保证个人数据不被泄露或者被盗取,就要采取相应的措施比如服务器访问权限和规则身份认证的加密,将归档的数据采取加密水印技术,加强数据的双重保护,防止病毒感染和被盗。在归档时让用户选择秘密级别,一些文字或有趣的照片视频是能让其他人查阅和分享的,而一些信息是不想让别人看见的,那么在利用和保存这些信息时应重点做相应的调整,让不公开的这些信息访问权限级别升级,这样既可以有效地保护个人的隐私,又很好地将归档数据加以利用。个人数字档案也属于档案,受到《档案法》的保护,为了更加有效地保护数据,对泄露个人数字档案形成威慑,国家和相关行业机构应着力对用户个人数字档案信息泄露出台相关的补充规定来保护用户的合法权益。
4.2 数据存续的长期性和可视性
作为个人数字档案,需要以一种有效而又长期保存的环境保存下来,随着科技的进步,或许今天先进的存储技术在若干年后被淘汰,而这种落后的存储状态下的数据没有有效的设备方便地利用和读取这些信息,那么就失去了个人数字档案存档的意义了。要想解决这个问题,首先要对归档保存的数据分类保存,例如一些档案需要永久保存的,那么随着保存技术的发展,要适时对这些数据进行迁移,以保证数据的有效性。其次有些数据需要长期的和短期的保存,对于这些数据应该采用相应的处理方法,如短期保存的个人数字档案,其数据本身在上传时设置到期自动销毁功能。随着长期保存技术的发展,信息的加密保存、永久保存和完整安全性读取方面会越来越成熟,这些问题将会得到很好的解决。
4.3 技术问题及归档意识的培养
个人数字档案归档过程中首先是要对数据进行分类标引,而分类标引不管对于个人还是档案馆、图书馆来说无疑都是工作量巨大的工作。这也导致了用户个人不愿花大量时间手动去标引自己的数据,但是不标引的数据在今后的查找利用中会带来诸多不便,这个问题也影响了个人数字归档的积极性。要想解决这个问题,从技术方面着手解决更加有效率,个人在归档时如果将数据直接上传,由智能化的数据检验和标引系统去完成分类和标引工作然后直接上传到指定的归档位置,既节省了人力,物力也给归档个人带来智能化的全新体验。
时代的进步使得人人成为网络的建设者和贡献者,那么产生的这些个人数据需要及时地保存和归档,归档的前提是个人归档意识的提升,没有意识就不能很好地归档。档案馆、图书馆以及从事档案事业的从业者应该从自身电子数据归档意识培养开始,不断地进行宣传,如档案馆门户網站的宣传,各馆的线下宣讲,开展各种关于个人电子档案归档的竞赛等来提高个人的归档意识。
5 结 语
个人数字归档是一项长期的工作,而且是势在必行的工作。本文就个人数据的产生以及在这个基础上的收集、管理、利用提出了可行的设想,在开展工作的过程中会产生许多问题,本文就个人数字归档产生的问题进行了阐述并提出了有针对性的解决方法。相对于传统档案来说,个人数字档案是新的档案领域,随着信息化和智能化的发展,这种信息量会不断增加,我们需要利用新的手段和方法去归档和挖掘这些数字资源,让个人数字档案发挥其应有的价值来推动整个社会的发展进步。
主要参考文献
[1]施明仪.个人数字档案存档研究[J].现代商贸工业,2018,39(2):80-82.
[2]夏莲春. 个人档案保存策略及其实现机制研究[D].合肥:安徽大学,2017.