APP下载

大数据时代背景下图书馆读者信息保护研究

2020-03-11郐媛媛

科学与财富 2020年34期
关键词:保护大数据图书馆

郐媛媛

摘 要:互联网已经悄然进入了大数据时代,给我们的生活带来了很多便捷。让我们不论做什么事情都得心应手。同时大数据也给我们带来了一些烦恼,尤其是在个人隐私保护方面,让人们总是防不胜防。本文着重从图书馆在大數据时代下的变化开始,深入剖析了读者的隐私保护问题。并从多个角度分析饮食保护的泄露途径,并提出了大数据时代下图书馆隐私保护的相关对策。

关键词:大数据;图书馆;读者信息;保护

一、引言

图书馆是人类知识的源泉,从古至今图书馆为一代又一代的新新学子提供了精神粮食。时至今日,图书馆已经向现代化迈了一大步,在当今互联网普及的情况下,大数据系统已经融入了图书馆建设。并给图书馆注入了新的活力,使图书馆的管理方法,运营模式和服务方式发生了悄然的改变。由于计算机系统的特性和大数据的智能化,使得以前的图书馆传统管理方法,已经不能适应读者的需求。读者所需求的信息已经悄然的发生了改变,从图书的原始内容到,所需图书的各种评价,再到该书的相关知识连接,最后是关于该书的论坛,这种变化已经从图书本身发展到更加广阔的空间。由图书开始,最后发展到网络的讨论。对于图书馆而言,除了提供优质的图书外,还需要对每一个来图书馆或者是登录图书馆网络系统的读者进行识别。除去读者的性别,年龄,身份证号,联系方式,家庭住址以外,如何通过计算机系统对读者的阅读行为进行跟踪和记录,如何确定一个读者所喜欢的图书范围,如何确定一个读者的读书习惯和社会关系等等,这些都是相对隐私的数据。通过大数据系统的智能分析,又可以把读者的相关信息进行收集,分析,所有的可供参考数据整合到一起进行去除取经虚伪纯真操作,这样就能更加精确的定位每一个读者的阅读需求。可以一样图书管理系统,准确地向读者投放相关书籍。使图书馆的功能更加精准,服务更加到位,更加智能化。由于计算机时代和大数据的到来,我们把服务投向了个性化的服务。图书馆也需要这样的服务,为每一位读者进行更好的信息推送。大数据给了我们这样一个机会,使图书馆可以根据读者的兴趣爱好,满足读者的各种需求,提供读者个人的个性化服务。任何事情都有两面性,当客户的信息被我们所掌握,当我们可以实行更加精准化的投送,但是如何确保客户的信息安全又成了一个新的问题。大数据成就了未来,但是大数据也为我们带来了隐患。随着网络数据的逐年递增,个人身份信息在网络上逐渐暴露。网络信息安全问题逐渐提上了日程,这是我国以及世界各国都非常重视的一个问题。因此我们既要提高图书馆的现代化管理,利用大数据为读者提供更加有品质的信息,又要保证读者个人隐私的安全。使读者能够放心的去从图书馆获得自己所需要的相应支持。

二、什么是大数据

大数据时代已经开启,我们生活中每天都会产生数量巨大的数据,这些数据在我们生活中传播着,很大一部分被人们实用。大数据时代的数据量每年都在成倍的增长,当存储设备从古代的书记转变成现代的电子存储以后,数据量就像爆炸了一样令人震惊。有人说我们最近5年所产生的数据量比有人类后到近代产生的数据量总和还多,这一点都不是危言耸听。大数据中的数据指代的范围非常广,并不是我们想象中的那么狭窄。人们日常生活中使用手机通讯或者上物联网所产生的数据,仅仅是大数据中的一小部分。可以说有传感器的地方,有网络的地方,就是有数据产生的地方。比如水表所产生的数据量,煤气表产生的数据量,电表所产生的数据量。又如数控机床所产生的数据量,电子门禁系统产生的数据量,我们随身所带的智能手环,汽车的定位系统等等。这些数据量都是会直接或者间接的通过传感器传输到网络上而形成一条条的数据。这些数据有可能是关于物体的运动轨迹的,有可能是关于人们运动情况的,更有可能是一个设备的状态或者是震动频率的。无数的数据慢慢的汇聚到了互联网上,越来越多,形成了大数据,也将我们带入了一个大数据的社会。

我们对大数据技术并不感到陌生,虽然我们不曾留意,但是,事实上我们却每天都在与大数据交道。可能有人会说,大数据是由海量的数据组成的,这些数据都是政府部门或是商业部门才能接触到,我们普通人是不会接触到的。其实,这种想法是不对的。大数据是由千千万万个小数据组成,而这些小数据都是由我们每天看似不起眼的每一件事情、每一个动作组成的。关于大数据技术,笔者通过四方面对它的优点进行描述:首先,大数据是一种技术,也是一个数据集合,它是由无数的数据集合而成,几乎涵盖了全球所有数据,例如商业数据,政府数据,医学数据,科研数据,科学数据等等,属于各行各业五花八门的数据的总合。其次,这些聚合的数据,很容易被我们调取使用。不论你在哪里,只要你能够连接到互联网,你就可以在大数据上获得你要的相关知识。再次,这些数据不仅仅是文字,而且有可能是各种图形,视频文件,音频数据等等,一切可以被我们参考的东西都是数据。最后,大数据在给人们提供快捷与便利的同时,也为我们提供了巨大的价值。大数据的价值是无法估量的。大数据由原始数据被深加工成有价值数据,供政府,商业,农业,科研,以及我们普通老百姓使用,从而创造更大的价值,产生更有用的数据,服务更多的人。大数据会越聚越多,为人们提供便捷。人们与大数据的关系会越加密切,没有大数据将会寸步难行。大数据自从出现开始,就引起了世界各国的兴趣,随着大数据的不断发展,人们对大数据的认识逐步成熟以后,各国把大数据上升到了国家层面的高度。各国开始加大关于大数据研究的人力和物力投资。大数据的出现改变了社会,并且将会对未来社会的走向起到引导作用。未来一个国家的综合实力将会以大数据的优劣作为评价。目前的大数据已经就在我们身边,时时刻刻的为我们提供着无数便捷的服务。

三、读者个人信息选取范围

随着互联网技术和移动互联网技术的快速发展,人们通过使用网络来进行学习、生产、生活已经不再是想象当中的事情。随着移动终端设备的普及,越来越多的民众通过使用手机、iPad连接上移动互联网就可以享受随时随地,不限时间,不限环境的网上冲浪,并且也可以通过使用电脑、笔记本,以连接WiFi的方式享受网上所提供的快捷服务。大数据的时代的到来,使我们的生活更加多姿多彩。图书馆也要将大数据技术引入到图书馆的日常管理和对读者服务中,图书馆也可以利用大数据系统对读者实施更加精准的信息投放。通过大数据系统可以收集到很多关于读者方面需求和想法,并通过这些需求和想法准确的预判到读者喜欢的书籍和信息,就可以为读者提供更加准确的个性化服务。例如,当读者在图书馆或者使用电子设备进行阅读查找、外借等一系列的阅读行为时,就会产生与所有行为相关的数据。图书馆可以对读者所产生的阅读行为和社会关系相关的这些数据进行收集和整合,通过对这些数据的准确分析来判断和预测读者的阅读喜好、阅读习惯、阅读行为,以及阅读需求。当图书馆了解读者的这些需求后,可以更有针对性的为读者提供个性化的阅读服务和信息推送服务。并且图书馆可以根据读者的需求进行有针对性的图书采购,这样可以将有限的经费更有效地购买读者喜欢阅读的图书。同时,这也是提高图书馆馆藏图书借阅率、提高了图书馆的工作效率的有效途径,同时还改变了图书馆的运营模式和服务模式,简化了图书馆的操作步骤,为图书馆降低了日常管理成本和运营的成本,。这样更能够提高读者对于图书馆的认可,增加图书馆在读者心中的满意程度,同时也是图书馆提高服务效率、简化服务操作程序的有效方式。

大数据给图书馆的管理模式注入了新的活力,使图书馆的传统工作模式发生了巨大的改变,也把图书馆的工作重点从纸质书籍转变到了网络信息。大数据下图书馆的服务方向,应该向读者的需求方向靠拢,在为用户提供优質服务和个性化服务上都是以大数据为基础。并且在信息的采集内容方面将会更加丰富多彩。以前我们只采取姓名身份证号,家庭地址或者是借阅押金等等,现在我们需要采集的则是电子邮箱,第三方增值服务,绑定的资金账号,相关的视频信息图片信息,租用的存储服务空间,语音信息,文件的传输方式,后台数据库系统和前台登录系统,读者的点击率等等。这些信息都是以前我们所没有接触到的,也是这些年刚刚兴起的。都是关于计算机方面的数据。同时在传统数据方面,我们也需要记录。所有的这些记录都是在法律允许范围内的,并且是通过读者同意的。大数据的到来改变了图书馆的面貌。不论是在管理方法上还是在服务内容上,都使图书馆变得更加丰富多彩。图书馆的资源从纸质资源到数字资源,实现了一个非常大的跨越。在数据资源的收集与采集方面也改变了原始的方法。数量的急剧增加,给我们带来了新的挑战。在数据采集方面我们要坚持,读者需要什么样的内容,我们就采集什么样的内容,用户喜欢什么样的服务模式,我们就提供什么样的服务模式,而且图书馆也从实体走向了网络,从图书馆阅读转向了家里阅读。随着大数据的到来,网络数据输出数据的逐渐增加,在数量的增加的前提下,如何把好质量关也是图书馆面临的一个重要问题。单纯从阅读数据量上来讲,原始的图书馆的数据量远远没有大数据时代的数据量多。原始的图书系统提供的数据比较分散,集中度不高。而互联网时代的大数据下的图书馆,数据量急剧增多,通过计算机智能系统,又把这么多的数据聚集到一起分类汇总,使之更加有序聚集度集中。但是,随着数据量的逐渐增大,也会出现很多没有用的信息,也就是信息垃圾,这会造成总量中垃圾和正常信息相混淆的问题。一旦垃圾信息超过一定比例,对于信息提取没有好处。对于大数据来讲,提炼数据的价值是非常重要的一个环节,图书馆信息除了书籍和报刊杂志以外,也包括了市面上几乎所有的信息。比起老式图书馆来讲,复杂性将会更大。大数据的真正价值就是根据不同的数据和不同的资料之间的联系找出实质性的价值。而数据的关键就是真实性、价值性。而目前市场上存在着大量的虚假信息和无用信息,这也是给大数据系统提供了一个非常有考验的难题。如何把这些信息进行去粗取精,去虚伪纯真是大数据需要做的,也是保证信息数据有效性的一个难题。因此在图书馆大数据系统收集各种信息的时候,应该有城市的对信息进行逐层筛选,逐层审查,这样才能保证信息的真实性可用性。加工出来的信息才能更加适应读者。

由于大数据的出现,社会上的整个行业都发生了一定的改变。当大数据系统融入图书馆之后,单纯的借阅式服务已经成为过去,单纯的一种模式向多元化发展,比如传统的借月行或者是在图书馆阅读行发展,到现在已经成为了掌上阅读,不论是你在吃饭的时候也可以通过手机进行阅读,或者是躺在床上,也可以通过手机进行阅读,如果需要搜索什么特殊资料也可以通过手机APP直接连接到图书馆的后台服务器进行资料查找。也就是说目前的图书馆阅读模式变得多种多样。在这种情况下,我们如何把图书馆的服务变得丰富多彩,更适合读者通过大数据获取知识粮食。所以我们在图书馆的建设中,更需要注重信息的收集种类和信息的资料。在信息的种类上尽可能多的进行收集,由于读者的不同所涉及到的资料也就不同。突出国所面对的是社会上形形色色的各种人士,在信息的收集上就会需要百花齐放,多种多样。尤其是目前仅由纸质书籍组成的信息,已经不能满足人们的需要。我们需要在纸质信息的基础上,大力增加音频视频等一系列的信息,扩充图书馆的有效链接,进行图书馆的高数数据共享。这些措施都是能够提高数据量的最好方法。在我们提供了足够数据量最好方法的同时,我们也需要加强质量监管。尽量为图书馆提供正面的有效的读者喜闻乐见的信息。而对于反面的错误的劣质信息,坚决剔除,以保持图书馆信息的质量。

四、大数据下的图书馆涉及的相关技术

大数据下的数据库中的一个难点就是如何把大量复杂的种类繁多的数据通过整合形成一个有相互联系的,可以让人们辨识的信息。这就是我们所应用到的大数据里面的一种技术:语义网技术。这项已经存在了多年的技术是非常重要的。任何一个图书馆为了更好地提供服务和工作,都离不开语义网技术。数字图书馆在大数据的作用下完成了很多艰巨的任务。在图书馆我们需要把各种信息进行分类,做成分类的一个报表也叫分类表。再从这些分类表中找出关键的词语,这些关键的词语是整个信息的重点,通过关键词语我们可以搜索到我们需要的文章。我们把关键词语加入到索引搜索里面去。这信息急剧爆发的时代,信息量的急剧增长,以我们人类的能力完成这些事情比较困难。在人员有限资源有限的情况下,如何把这个工作做好,就需要大数据系统帮忙了。计算机的运行次数远远超过了人类的计算能力。通过计算机中的人工智能,把信息量巨大的关键词语进行自动生成,把其中有关联的词语进行自动资源连接。有效的帮助人类进行了信息的收集以及知识的扩展。

语义网技术已经是一个非常成熟的技术,普遍的应用于图书馆管理工作之中。这是以前人们总结出来的最先进的方法。如何把各种图书进行有效的区分?如何让许许多多信息的关键词语连接在一起?都需要通过语义网技术。但是语义网技术也有它的缺点,可以说他在信息整理方面是成功的。但是如何使信息资源的内部发生更深的连接就很难完成了。在大数据的帮助下,通过大数据系统,我们完成了这个不可能完成的任务。由于任何信息的内部连接都使得用户在使用信息的时候更加方便,更加快捷。从而使使图书馆具有更高的意义。

目前、社会信息的生产量非常庞大,通过语义技术,把纷繁庞大的信息资源提取出有效的信息。但是这些有效信息仍然是庞大的。如何把这些庞大的有效信息,进一步的进行深加工,就用到了数据的聚类技术。聚类技术是随着计算机科技的产生和成长而慢慢成长起来的。并不是传统的图书馆处理信息技术的一种方式。图书馆对于书籍索引的处理是聚类技术的前身。显然人工技术已经不适合进行目前庞大信息量的处理。聚类技术引入到数字图书馆,大大的减轻了信息的处理繁琐程度。只要有新鲜的信息产生,就要应用到数据聚类技术。数据聚类技术的应用范围非常广,几乎所以关于信息方面的处理都用到了数据聚类技术。例如信息的分析系统,信息的深度挖掘系统,信息的服务系统。同时数据聚类技术也为客户提供了很大的方便,当用户有任何关于数据信息索引方面的要求时,数据聚类技术就提供了帮助。当今社会,信息量每时每刻都在产生并无限膨胀。每一个客户如果想更好的获取自己所需要的信息。就要在大量的信息中进行挖掘。如何在大量的信息中去出取经,去伪存真,我们需要使用数据聚类技术进行解决。这样的例子有很多,通过该技术,我们可以让信息进行关键节点连接。通过语义系统找出信息的关键节点,也就是关键词。并以关键词为核心,将所有与该关键词相关联的数据进行聚集。聚集在一起的所有关键信息,使得用户图可以通过相关的搜索引擎进行排查筛选。进而得到自己所要的核心内容。聚类技术的产生为图书馆,尤其是数字图书馆,提供了大大的帮助。在大数据系统的作用下,数字图书馆为人们提供了一个新的可以用数据聚类技术进行查找信息的场所,让图书馆更好的为客户进行服务。

五、读者隐私问题分析

5.1读者的透明化问题

目前,现代化的图书馆运行都与大数据相关联,而形成智能化的图书馆。从而影响到图书馆整个的运行情况。当读者来到图书馆内,或通过使用电子设备登录到图书馆网站、图书馆微信公众号内所有的操作都会产生数据。图书馆利用大数据技术就是为了将读者所产生的这些数据进行收集,并且将收集到的这些数据进行很系统的分类、比较、归纳,最终目的就是通过读者所产生的这些所有数据信息,来找到它们之间所存在的相关性,或者是隐含的相关性,这样就可以为图书馆的日常管理、读者服务、阅读行为、运营操作等提供科学而有效的数据依据。这为图书馆现阶段的运营和未来发展提供可以进行决策性的数据依据。因此,为了图书馆能够收集到更加全面的,更加真实的读者行为所产生的数据,也是为了在分类、归纳时,这些数据是有效的,这就需要大数据平台对读者行为实施全方位的、24小时的监控,这无疑就将读者的所有信息、所有行为进行了透明化,完全暴露在大数据平台中。在大数据时代,只要读者进入到图书馆内或者是读者登录图书馆的官网以及微信公众号中,当读者从进入的那一刻开始大数据就对读者的所有行为进行了监控,包括新读者的用户注册、浏览信息、查找资料、登录服务系统、与图书馆工作人员的对话、与网上其他读者以及作者的沟通与交流、服务信息、提出的意见和建议等等。此外,目前很多图书馆都会与第三方增值服务的运营商进行跨界合作,比如支付宝软件、电子地图软件、电子阅读机厂商等等,以此来共同的为读者提供更好的服务。通过图书馆与这些服务运营商的跨界融合可以为读者提供移动图书馆、个人图书馆的服务,以及可以对用户提供更好的数据管理操作。虽然说图书馆与第三方增值服务商进行跨界融合后,可以为读者提供更好更多的增值服务,但是同时也将读者的更多个人信息和社会关系数据信息暴露在大数据平台面前。图书馆与第三方服务商进行合作后,可以更好地实现对于读者的全天候、全方位的监控,这些监控除了读者在图书馆以及图书馆网站,微信公众号所产生的阅读相关行为数据以外,还会对读者的身份特征、日常活动路径、家庭住址、消费习惯信息等等,这些更加隐私的数据进行收集。换而言之,在大数据时代,读者在不知情的情况下就已经处在了被监控之中,这样让每个人和每个人之间变得更为透明,让人们感觉到没有个人隐私的保护。

5.2图书馆大数据的前瞻性

图书馆计算机系统对读者的相关数据进行海量的收集整理,然后模糊的分析出读者的需求,这是非常正常的。但是大数据系统对于信息的收集更有针对性,比如对读者的学历收集,兴趣爱好进行收集,社会关系网收集,设置是读者的上网习惯,点击记录都被收集进来。并对这些数据进行长期的存储,不断的继续收集新的信息,边收集边分析,最后得出读者的兴趣爱好结论,从而使图书馆可以更加准确的把读者所需要的信息提前输送到读者面前。这就是大数据系统通过期智能化进行数据分析预测出来未来读者将要需要的信息。也就是说大数据作为我们生活工作的一种工具,已经为我们提供了一个崭新的方向,通过大数据,我们可以将自己的管理和服务模式更加靠近读者需求,而且能够提前的为读者需求做准备。使个性化服务更加精准的投递,从而提高了工作效率和用户的阅读效率。但是有一点,也是用户最为最为担心的一点:全透明的网络行为,全透明的个人信息暴露在大数据面前。

读者的全部信息被大数据搜索到后,进行了特殊的处理,从使用大数据角度来讲,可以说是变得更加得心应手,但是从读者来讲,自己的所有隐私将会暴露无遗,换句话说在没有授权的情况下,自己隐私受到了严重的侵犯。这是一个相互排斥的事情。例如图书馆根据客户的所有信息可以预测出用户的阅读可能性,分析出用户阅读的内容性质。从而对客户的阅读有目的性的记录,并把用户在图书馆的行为痕迹进行全部监控。并对用户的危险阅读行为,进行提前预警。这些行为对于图书馆来说是有益的,但是对于个人来说就侵犯了个人的隐私权。图书馆的大数据系统也可以根据读者在网络论坛或其他读者圈上的交流数据进行判断。尤其是判断读者的社会关系网,可以非常准确的定位出读者的朋友圈,亲戚圈。并引申出一系列的连锁关系。读者的个人信息是非常保密的,但是在大数据面前变得非常脆弱,非常简单的就可以获取读者高密度的隐私信息,这样让读者的隐私信息一览无余。一旦出现任何问题,将会造成不良后果。比如读者的个人隐私泄露,被不法分子操作等等。

5.3个人隐私与图书馆建设的冲突

图书馆利用大数据系统可以更高一步的提升图书馆的服务质量。从读者的阅读信息到,精准服务,再到后期的预测都比以前提高了很多。用户也满意了很多。从而让读者体验出了现代图书馆的优越性。这样使得利用大数据的图书馆,在现代化的竞争中抢先了一步,拥有更广泛的读者群体。并且除了图书馆为读者提供更好的服务以外,为图书馆增加了更多的效益。但是根据大数据所制定出的相应图书馆方针政策,却有可能涉及到读者个人的隐私,造成一定的部分客户利益的损害。任何一个经济实体的主要目的就是为了自身的经济发展,如果自身没有发展的话,其他的都谈不上。图书馆也是如此,一旦当读者的隐私和图书馆的发展发生了相碰撞时,图书馆不可能为了某些权益而放弃自身的发展。也就是说图书馆为了发展,对于用户的权益在极尽维护的情况下,一旦发现冲突还是以图书馆为主。图书馆为了自身的发展,自身的管理政策的执行,就會有选择性的牺牲一些读者的利益。当然相应的社会监管部门会对图书馆的行为进行监管,从而避免读者的个人权益和隐私受到严重的损害。

5.4读者隐私保护的意义

互联网在大数据时代下变得更加先进,但是在先进的同时也有一定的负面问题,个人隐私的透明化使得网络没有秘密可言。而个人的隐私关系到的范围非常广,小到个人的经济行为等方面,大到社会国家的安稳。如果一个社会的个人隐私都是透明的话,这是一个严重的问题。个人隐私背后的深度挖掘,很有可能涉及到整个社会的经济利益,国家利益。我们既要非常合理的有效的对数据进行挖掘和分析,也需要对关于个人隐私方面的数据进行保护和监管。如何加强个人隐私的保护,是我们一直都在讨论和不懈努力的问题。这不仅仅关系到个人,也关系到整个国家,具有非常重要意义的。图书馆作为整个社会公共事业的一部分,其读者的个人隐私也需要受到重视和保护。例如,图书馆在对读者信息进行管理的时候,各个流程都需要进行严格监管。不论从信息的采集还是客户信息的使用,都需要进行层层把关。客户的数据隐私通过大数据可以进行挖掘,但是在挖掘数据隐私的时候,客户是否同意对自己的饮食进行操作,谁有这个权限?在进行操作的时候,由谁来进行监管?这些都是图书馆是否能够合法利用个人隐私的关键。对于个人隐私的利用问题,目前法律没有明确界定。在各个法律条文中都有相应的规定。在利用和客户允许之间,总是有争论不完的问题。在图书馆数据维护人员和数据管理人员方面,这些人员经常会对客户的数据进行整理,很有可能会出现不良工作人员对客户信息进行窃取牟利。这种损失是图书馆内部问题造成的。但是对读者的饮食有很大的威胁。不论出于何种目的的进行隐私获取或者是隐私篡改,都会严重的影响图书馆的正常管理和读者对图书馆的信任。在突出管理人员非正常操作的情况下,比如传输数据没严格按照要求进行,或者是存储数据过于简单都会造成不良后果。同时黑客窃取也是一种进入图书馆内部进行数据破坏或者是窃取的另一种途径。客户的个人隐私也有可能是因为自在自己的终端进行数据登录,把自己的登录文件暂时留在了缓存而被他人窃取。也有可能在公共场合进行,电脑登录以后忘记退出,造成遗失。还有很多情况都有可能造成客户隐私的丢失。不论是哪些情况对个人对社会都会造成不良的影响,会影响社会的稳定,这些个人隐私数据有的是国家公职人员的数据,有些是企业人员的数据,也有一些是商业人员的数据等等。这些数据如果被遗失或者是非授权加工,会涉及到国家的安全问题。我们对于大数据进行个人隐私发掘的担心就在于此。个人隐私保护的意义也在于此。

六、大数据分析需要注意的相关情况

6.1数据的完整性使信息更加可靠。

任何一个大数据处理都是靠固定的模型进行的,模型的好与坏直接关系到大数据的处理能力,这样大数据才能寻找到与之相关的或者隐身进一步可能发生的事物。大数据的信息或许是一个非常大的工作。每天无时无刻都在进行。虽然这些数据比较凌乱,但是大数据在收集的过程中需要去粗取精,去伪存真。这样对数据的检索才能更加科学合理。大数据对具体数据的操作还能更加准确无误。例如一个商品的名称,价格用途,生产商,组成成分,使用方法等等,都需要大数据去精准掌握。

6.2 大家积极分享使得大数据系统更加丰富

大家积极分享数据,数据分享是大数据的一个重要指标,大数据之所以能够成就到今天,就是因为无数的人分享了自己的数据。不论通过各种情况,各种途径大数据在收集数据的时候,也必须要遵守法律的原则,收集可收集数据,同时保守个人隐私问题不被泄露。大数据是一个庞大的工程,涉及到一个国家的未来。任何一个大数据都不是独立存在的,而是由全国全社会各个系统的连接而成。资源共享可以是网络游戏数据,可以是网络社交数据,也可以是网络聊天数据,只要是在网络上的各种数据都可以被大数据收集。共享资源也可以是政府部门的社保系统,可以是医保系统,也可以是银行的各个系统。这些数据都会被大数据系统所记录。大数据系统也是按照法律进行数据收集。他会将这些数据进行分类,并设置相应的权限。不同级别的数据有不同的权限。不同类型的数据有不同的归类。而且这些数据也有相应的密保期。从而保证了用户的信息不会被轻而易举地泄露。在这种情况下,大数据有条不紊的运行,对数据进行相关的有用的筛查,从而大大的提高了数据的价值。每一天我们都有新的数据进入大数据系统,使大数据系统更加丰富。

6.3数据库安全问题时刻不能忽略

大数据系统是一个利国利民的系统,它对于我们有很多好处,但是一旦大数据系统出现漏洞或者是被不法分子把数据进行盗取,就会出现不可估量的后果,大数据安全问题是我们时时刻刻都要关注的问题,是确保人们信息安全的问题。大数据系统的另一个问题就是数据被恶意破坏。人们辛辛苦苦建来建立起来的数据系统,如果被恶意破坏毁坏,恢复起来相当困难,后果不堪设想。因此我们对于大数据系统就需要查缺补漏,禁止不法分子进入掠夺或者是破坏数据。首先我们需要对系统的补丁,系统的防火墙进行严格的筛查,确保不法分子无法进入。同时我们也需要做好系统备份工作,把系统重要数据进行一次或者多次数据备份,以防遭到破坏。目前我们已经进入了云存储和云处理的时代,我们可以通过例如华为云系统,把各个政府部门的小型数据库系依托到云数据库云主机等等上,这样就做到了事半功倍,得心应手。同时我们也可以根据相应的数据库进行手机应用程序终端开发,使人们可以通过手机APP非常迅速的调取数据,得到自己想要的信息。

七、读者隐私保护的方法

7.1信息采集的范围

大数据之所以能够通过智能系统对任何事情进行分析,是因为它有足够多的资源供其进行处理。也就是说大数据之所以能够非常好地为人们出谋划策,是因为数据量足够大。几个数据几十个数据都不能达到这个目的。对于图书馆大数据系统也是这个样子,当图书馆收集到的客户信息达到一个值的时候,而且这些数据的关联比较强,这样大数据就能顺理成章的进行数据分析,处理和得出,最后想要得到的预期结果。对于用户的信息采集,我们应该设定一定的范围。如果过分的采集用户的信息,虽然说对大数据系统足够有利,但是会触碰到法律和个人隐私,往往事情得不偿失。因此图书馆在进行个人数据的相关收集处理过程中,都需要有一个非常好的监管机制和条例,这样能够规范收集数据的范围,尽量避免客户隐私的泄露。规定出图书馆对客户隐私采集的范围是对客户自身的一种保护,可以说可以使用户安全放心的进行图书馆阅读和借阅。但是这样也降低了大数据系统所能够分析和采集的范围,让数据的价值和意义变得没有大量的無限制的采集重要。也就会影响大数据系统的判断能力。所以我们就更加建议,图书馆在采集用户的数据时,尽可能的收集客户允许的信息,而对客户的隐私信息尽量规避。因此在严格的监管下,我们在规定的范围内,既可以大量的收取规定范围内的客户信息,又不损害客户信息的利益。然后我们可以让大数据不受限制的采集读者允许的相应的信息,例如客户的点击信息,客户的基本身份信息,客户的家庭信息等等。当我们制定了严格的规章制度以后,我们还要需要告知读者。也就是让读者有相应的知情权。使读者知道自己的哪些信息是被使用,哪些信息没有被使用,自己的哪些隐私信息被很好的保存。并且有权利决定自己的这些信息是否被大数据处理和加工。大数据系统也应该对读者的个人信息包括隐私信息进行加工整理的同时,确保其安全性。做到以上这些以后,我们还要加强图书馆内部员工的管理。从规章制度上进行管理,从思想教育上进行管理,从道德品格上进行管理。同时让他们明白,个人隐私如一旦被泄露将涉及到法律的惩罚。避免一切渎职情况而造成的信息泄露,或者是客户信息乱加工现象。在一些图书馆中,有很多情况会出现,比如把业务数据和客户数据放在一起,尤其是新用户数据管理,在管理中对二者不加以区分,导致了个人信息难以被妥善管理,业务数据和用户数据管理混淆在一起,而这些数据应该并行管理,这也是用户的数据被遗弃或者丢失的可能性增大。只有图书馆足够重视,才能从上至下推动大数据事业蓬勃发展。在读者信息安全方面各个部门所能做到的教条性的管理制度,而是需要灵活运用的行为准则。由于个人信息在处理方面灵活度很大,实际操作起来也会面临很多具体困难。哪些信息应该多收集,哪些信息应该少收集,哪些信息是关联信息并不一定在某一层面能够确定。这就需要大数据系统,通过其智能手段进行校正。在确保数据完全准确又涉及到敏感个人隐私信息的情况下,进行安全准确的录入,分析和处理。

7.2个人信息数据要有条理,配置分明

个人信息涉及到很多方哪,哪一些信息可以和大家分享哪一些信息不可以进行分享,需要作为隐私保器起来。是我们需要细分的。对于任何一次涉及到个人信息的支付,我都是需要认清哪些信息提供出去了,哪些信息被留了下来。要做到信息足够安全。为了确保信息支付的正常进行,需要我们提供一些允许分享给第三方支付平台服务商的信息。同时也要求第三方支付平台提供的服务商对这些数据进行分级管理,在没有用户获得授权的情况下,不允许将这些信息无论是重要信息还是不重要,信息泄露出去。这种条理分明,配置明确的信息管理方法才能使金融行业得到稳步的提升和繁荣发展。而且科技发展的速度已经进入了大数据的时代。大数据下的金融管理又是一个我们需要探讨的问题。借助于人工智能大数据的帮助,个人支付系统的信息采集变得十分快捷,同样也使个人支付信息的泄露变得更加快捷。这就需要我们更加严格的监管系统和相应的法律保护。在大数据系统中,如何融入个人信息监管机制是一个非常重要的问题。我们既要保证大数据系统下的个人支付信息平稳正常的运行,又要保证大数据的个人支付信息被有效地进行监管。对于不同类别的个人支付信息,我们需要有不同的方法进行监管。我们可以从个人的交易额度信息进行分类监管,也可以从个人的档案信息进行分类监管,你可以从个人的行业信息进行分类监管,再或者从不同支付服务商进行分类监管。通过分类监管之后,整个监管的层次就变得非常明确。再加上各个机构之间的有力协调和相互沟通。把各个部门的职责和能力与个人支付信息相挂钩,形成一个非常有效的完善的个人信息监管机制。

7.3法律约束十分重要

法律的作用就是使人们按照正常的方式在社会上进行生活。对于愈演愈烈的大数据互联网的个人隐私问题,我们如何通过法律手段进行相关的限制和规范,迫在眉睫。由于个人隐私倒买倒卖的利润越来越大,互联网大数据系统对个人隐私的挖掘越來越深。导致很多人会铤而走险进行个人隐私贩卖活动。通过一部专门的个人隐私保护法对这些相关问题进行沟通进行规范和管理,是十分必要的。这样可以限制社会方方面面对个人隐私的乱用或者是误用。进一步防止个人隐私乱用的失控现象,这次我们从根本上找到治理依据的最好方法。

首先,一部法律的制定应该按照国家的利益和方针政策进行制定。通过有效的法律限制和约束保证人们的个人利益,经济利益不受到损失和伤害。只有这样通过互联网大数据系统才能够有效的利用个人信息进行收集,分类,整理挖掘等等。形成一个健康有序的大数据信息管理系统。其次,图书馆管理条例应该很严格的指定和实施大数据数搜集的规范。既要挖掘出有利于图书馆发展的数据,又要保护好客户的隐私数据。把图书馆的相关管理制度放在首位,同时接受来自社会各个方面的监督和检查。最后,数据共享方面要做到选择性共享。以前的数据存储仅仅是以孤岛的方式进行,互联网时代大数据下已经形成了数据共享的模式。而数据是一个关系的国家民族未来前途和安危的重要战略资源。以前的图书馆单独拥有本馆的数据资源,已经逐渐向多个图书馆互相共享资源发展。这就出现了一个资源共享后,如何利用资源,是否资源会流失,是否资源开采过度的问题。因此我们也需要做相应的规章制度,对其进行规范和监管。而对重要的读者隐私进行绝密保管,禁止共享。如果超过规定范围,需要得到读者的允许。确保在数据挖掘的过程中出现隐私乐用的现象。在法律层面,我们还有很多需要适应时代变迁的法律需要出台。在大数据时代下,过快的科技发展速度,使得相应的法律制定有点捉襟见肘。而法律又要服从国家的意识,既要保证社会主义建设的快速前进,又要保证客户的隐私不被侵犯,中国有句古话叫忠孝难以两全,而法律在这里就处在既要保证社会的发展速度,应要保证人们的隐私权利不受侵犯,这样的双充标准的围攻之下,也可以说是步履维艰。如何把握和权衡好这两方面的利益,至关重要。法律制定的时效性和大数据的快速发展性,也形成了相互矛盾的一个问题。法律制定完以后,如果前瞻性不够,则会有很多新兴的关于个人隐私的问题,由于没有在法律条文中进行明确规定,而出现法律漏洞。如果要是出现在国家利益和个人利益上发生矛盾的情况下,任何利益都都高不过国家利益,在这种情况下,个人的隐私问题就必须服从国家的安排。个人信息保护法的出台将会对个人信息进行有效的保护,个人信息保护法也是对社会主义建设的保护。只有出台了个人信息保护法,我的我国的信息化建设才能走得更加长远,人们的利益才能切实的得到保证。图书馆读者的个人隐私和图书馆的建设,与个人保护法息息相关。

7.4制定统一标准

个人信息支付行业需要有一个统一的管理标准。统一的管理标准解决了很多不必要的麻烦。统一的管理标准,使用户的信息不在或多或少的被窃取,也可以使行业之间有共同的通信接口进行信息交互。以此为前提,再根据第三方支付平台的职责所在,进行设定相关的个人信息详细搜集办法。由于不同平台所需要的个人信息是不一样的。这就给各个平台收集多余信提,提供了借口。当统一标准以后,也就是统一了基础,收集信息范围,然后再根据不同的第三方所需要的不同信息进行第三方归纳和整理。把需要多余收集出来的信息,向有关部门进行报备。这样治理以后乱收集支付信息的行为,就可以被大大的遏制。我们除了在对个人支付信息进行设定和保护以外,还需要建立一个对个人支付信息的评价体系,这个评价体系可以是政府部门对商业组织的评价,也可以是商业组织之间的互相评价,还可以是政府部门和政府部门的相互评价。做到互相监督,互相评价,通过互相监督互相评价,可以查不出相当多的漏洞,并对这些问题进行相应的处罚。同时鼓励所有被数据侵害的支付个人进行举报。帮助政府部门查找相关漏洞,补齐短板。同时政府也应该设立相关奖励机制对任何能够查出相关个人信息泄露漏洞的行为予以奖励。只有这样才能让全社会都动起来,保护好自己的信息,也保护好他人的信息。很多方法和方案都可以设立出相应的标准机制,把这些标准机制应用于个人信息安全系统,实时达到标准化。一个统一的有效的执行标准,是对全社会个人信息的一个保护。

7.5数据筛选

图书馆大数据系统在工作的时候,收集数据非常多。大多数数据都被存储到了后台。这么多数据对于图书馆系统并不一定全部有用。我们既要得到关于图书馆的相关信息,又要把与图书馆没用的信息进行存储,这种情况下就会出现大量信息的冗余。这种冗余现象在大数据系统中非常广泛的存在。由于数据的冗余对图书馆又没有益,所以我们需要进行定期的清理。使图书馆大数据系统不至于由于数据过多而造成运行缓慢。而这些数据过于冗余没用,却造成了另一种问题。由于服务器之间数据的共享,使得这些图书馆看是没用的,数据会流传到其他地方。对图书馆没有用的数据在其他地方有可能就会被利用到。而这些数据是图书馆读者留下的未经授权不应该被其他服务器所使用。这就出现了严重的问题。对于图书馆读者数据过于冗余的问题,我们不能掉以轻心。如何通过有效的办法,既提取了数据的精髓,挖掘出了问题,分析出了方法,又把冗余的数据清除掉,非常重要,必须通过有效的办法对数据进行删减。任何数据之间都是有关联性的,但是过度的关联也是没有必要的。收集数据非常容易,但是删除数据就没有那么容易了。当我们把没没有用的数据剔除掉以后,留下有用的数据,也就是精华数据,这样读者的信息的可用性就更加大了。如何对冗余的数据进行清理呢?首先,我们应该制定出一个相当完备的规章制度。并对大数据进行相应的设置。这样在整个图书馆运营过程中,就会对所涉略到的收集的数据进行整理和划分。区分出有用的数据和没有用的数据。通过层层过滤,所进一步的缩小范围,数据就会渐渐的清理出脉络来。而且我们在清理数据的时候,还要根据时间的推移,政策的转移和图书馆的变化,进行相应的数据筛选调整。不能一直墨守成规,保持一种筛选规则或者标准造成随着时间的变化数据的变化,而出现了不符合时宜的错误,删除或者是漏除。其次,我们在收集数据的同时,需要与读者有相应的沟通。对收集的信息向读者通报。使读者知道自己有什么樣的信息被收集。也可以允许读者来图书馆或者是网络连接图书馆,查询自己到底被搜寻到了哪些信息。而读者的这些信息的所有权归于读者,允许读者通过网络连接或者到图书馆对其数据进行修改或者删除。并且图书馆大数据系统所分析的是某种方向和管理趋势。不应该针对某一群体或者是某一个人进行特殊巡视。如果出现这一现象,我们将会严格制止。因为图书馆的目标是更加好的服务于读者,而不是更加深度的挖掘读者。如何建立更好的市场竞争机制和更好的吸引读者,才是图书馆大数据系统最关心的。最后,任何系统都避免不了共享自己的信息,图书馆之间也是如此。共享信息是可以加快大数据的分析和加快图书馆运营管理的一种非常好的方法。但是问题是读者的个人隐私信息被共享是否可以,如果可以,哪些信息可以共享,哪些信息不可以共享。我们不能一味的为了追求利益最大化和先进的技术最大化,而不顾读者的隐私问题。正常情况下,我们应该在数据共享之前,把读者的普通信息和重要信息区分开来,进行分别存储。当共享的时候只分享客户的普通信息,而不是重要信息。一旦需要分享客户的重要信息的时候,需要和客户进行沟通,只有在获得同意的情况下才能共享。这样可以尽可能的避免客户的隐私数据受到不当利用。

7.6个人保护意识太低造成数据泄露

每个法律主体都有决定个人信息的权利。包括个人信息的使用范围和和信息的相关共享情况。任何第三方支付平台和相关机构都应该有明确的条文帮助个人养成良好的个人信息保护习惯。不可轻信他人或者第三方软件的诱骗,不可以对自己的信息随便填写。一旦出现任何问题,将马上运用法律的手段予以维护。任何第三方平台都应该在收集个人信息的时候,列出相应的详细清单或者列表告诉相应个人所收集的个人信息是什么。并且给客户一个明确的提醒,告知客户数据的存储和销毁时间或者是第三方支付平台的使用权限。严格的管理才能出现强大的企业,严格的个人信息数据治理力度,才能确保个人信息不被泄露,不会出现冒名顶替或者资产泄漏等问题。我们要从各个方面严格抓控,我们要从法律上进行抓控,从管理制度上进行抓控,从各个第三方业务平台的具体业务行为上进行抓空,从后台数据库的技术保障上进行抓控,从涉及的相关个人的道德品质上进行抓控等等,在这种情况下才会有一个全面的健康的个人支付系统体系展现在我们面前。这样的好的个人支付体系,符合我国的发展国情,符合习主席的全面脱贫的要求,我们既要在全局上。我们也要在各个细节上进行梳理。个人信息的泄露不仅仅是个人的事情,也涉及到一个国家安全的问题,如果让境外不法分子获取这些信息,后果不堪设想。所以我们要对这些进行加大力度的管理和精细化管理。这样流程规范了,数据安全了,保障有力了,人心踏实了。

7.7个人隐私保护

在大数据的平台下,读者的隐私很难保护。虽然我们在个人隐私保护的方方面面已经做得非常尽力。但是还有很多弊端和漏洞。云计算是大数据系统的基础,没有云计算大数据系统无从谈起。他是大数据系统的根基。通过语音计算技术提供的一系列服务,使社会的各个行业的工作水平和能力得到了显著的提升。尽管如此,我们在云计算的利用上还是不够完美。无法在既利用数据又保护数据上,做到平衡。也就是说我们还需要找到更多的好办法去保护读者的隐私安全。而不同的图书馆有不同的工作和管理方法,每一个图书馆都应该制定出更好的方法,在不耽误自身的发展建设的前提下,多多的进行个人信息保护技术的研发。特别是从技术角度如何规避障碍,使客户的隐私能够得到完美的保护,使任何一个在图书馆进行在线或者是实地阅读的读者能够安心的阅读。在图书馆里阅读者的读书行为,读书轨迹,是可以被追踪和记录的。读书者的社会关系是可以用大数据搜索到的。读书者在图书馆被提供的服务需求也是有相关记录的。这些隐私数据都具有很高的机密性,也是图书馆对自己阅读者的行为跟踪的一部分。比如阅读者的注册信息的详细程度,浏览相关网页的点击率,各种论坛的信息发布情况,是否有更高级的个性化套餐订阅等等。云计算都给了相应的技术支持。例如对于这些信息的存储,相关信息收集的计算算法,云资源供给的动态伸缩等等。这些都是大数据系统在图书馆运行上所需要的技术基础。

首先,互联网有很多提供云计算服务的商家。在这些商家中,我们应该选择具有较高的技术水平,又有安全保障的云服务商提供服务。云服务商能够给我们提供图书馆之之前所办不到的一系列工作,比如对大量数据的采集,同时把分乱复杂的数据进行处理后,有规则的存储。并在集合到一定量的情况下,把存储的数据高效的分析,用于管理和服务。对于图书馆这种图书容量大,信息容量大,读者容量大的机构来讲,需要处理的数据和种类非常之多,而且所得到的数据的价值并不是一定很高。所以当图书馆与相应的云计算平台运营商进行签约的时候,一定提前关注云服务商的很多特点,看一看云服务运营商的信誉好不好,整个的团队管理水平如何,计算机硬件和软件的实力如何,安全可靠性如何,从而能够确保在安全处理用户信息的情况下,更加高效的为图书馆提供服务和帮助。让云计算技术更好的协调和服务于图书馆事业。其次,在图书馆读者数据处理方面云计算辅助大数据显得得心应手。但是如果通过高科技而过度的进行挖掘和计算。过度的收集和侵犯都是不应该的。这样既违背了图书馆服务的宗旨,也违背了读者的初衷。所以在云计算平台工作的时候,如何把数据收集好,管理好,如何在处理加工数据分析数据的时候,能够有一定的节制性,使数据的整个环节都可以在可控范围内,既满足了图书馆建设的需要,也满足了读者阅读的需要。这样是最好的。而不是过度的开采,无节制的挖掘造成隐私严重泄露而无法弥补。更有甚者使读者和图书馆对簿公堂,这些都是我们不想看到的。再次,无论是图书馆还是网络提供商都要以严谨的工作态度对待每一个工作环节。在进行客户信息管理的时候,双方要权责明确,并且对于不同的信息设置不同的保密级别。双方可以通过定期的研讨会议进行多层面的沟通和交流。在互相讨论中找出不足和差距进行弥补。通过双方的共同努力,使圖书馆既向好的方面发展,又确保了客户隐私数据的安全性。最后,图书馆也需要让读者提高自身的信息安全保障意识,在众多的网络使用用户中,或多或少都会出现由于粗心大意,造成自己隐私信息暴露的情况,图书馆应该负责对每一个读者都进行详细的指导,而不是在书面上或者是APP里告知读者注意事项,同意就通过,不同意就不通过,这么简单的。读者也不应该因为怕耽误时间或者是阅读材料过长,而忽略了注意事项。要对自己所要签署的协议的各个条款都熟悉和清楚,不草率签字。读者在个人隐私上虽然有被动的一面,但是也有主动的一面,如何应用好自己的主动一面,确保自己隐私的安全性,是读者需要明确掌握的,图书馆也有责任和义务向读者清晰明确的告知其所具有的权利。而不是只为了图书馆建设,读者个人利益就置之不理。

八、结束语

随着大数据时代的来临,图书馆从原先的固有资源到大数据资源,图书馆的价值和作用被重新定义,更加丰富,有内涵的大数据下的图书馆展现在我们面前。图书馆与大数据的结合是图书馆焕发了新的活力,在大数据的帮助下,图书馆的存储量急剧增加,单纯的手工操作变为了复杂的计算机存储,所涉猎到的种类越来越多。通过大数据对图书馆所获得数据的智能跟踪分析,使得图书馆的竞争力显著提升。而且大数据的出现使得图书馆的管理模式和提供服务的方式,有了大大的改变。如何既保证读者的隐私在可控范围内进行挖掘,又使图书馆在社会的竞争中处于不败之地。是我们需要研究的问题。如何在大数据中找到一个很好的平衡点,是是图书馆的责任所在。图书馆人应该加倍努力,未雨绸缪,学习先进技术,为读者多做贡献,为社会多做贡献,为国家多做贡献。相信通过我们的不断研究和探讨,一定会找到一个既保护消费者权益,保障个人隐私,又能够促进图书馆长期发展的好的方法。

(中共辽宁省委党校(辽宁行政学院 辽宁省社会主义学院)辽宁 沈阳 110000)

猜你喜欢

保护大数据图书馆
图书馆
刍议增强林业生态环境保护的有效途
浅谈遗址公园的保护
基于大数据背景下的智慧城市建设研究
去图书馆