网络信息环境下读者隐私保护策略研究
2016-05-14陆康
〔摘 要〕[目的/意义]在高校图书馆学科服务中,运用多种手段获取读者信息行为数据,用以数据挖掘和信息推送服务,提高了信息服务效率,可能无意侵犯了读者隐私。[方法/过程]高校图书馆信息服务获取读者信息行为过程中,采用信息混淆隐私保护策略,同时引入第三方认证技术,设计并实现读者隐私保护模型,避免在信息服务中对读者隐私的侵犯。[结果/结论]探讨出技术与制度相结合的读者隐私保护策略模型,应用于高校图书馆读者数据规范管理。
〔关键词〕网络信息;读者隐私保护;图书馆;信息服务
〔中图分类号〕G250.73 〔文献标识码〕A 〔文章编号〕1008-0821(2016)06-0119-05
〔Abstract〕[Purpose/significance]In the university library subject service,using a variety of means to obtain the reader information behavior data,data mining and information push service,improved the efficiency of the information service,may inadvertently violated the reader privacy.[Method/process]Information service for readers of university library information behavior in the process,the confused information privacy protection strategy,at the same time introducing the third-party certification technology,designing and implementing the reader privacy protection model,avoid to invasion of privacy in the information service.[Result/conclusion]Discussed the combination of technology and system reader privacy policy model,applied in the data management of university library readers.
〔Key words〕network information;readers intimacy protection;library;information service
1 网络隐私概念与侵犯现状
通常说互联网改变商业模式,商业模式改变生活方式,人类与教育,医疗,文化,出版,物流,旅游等公共服务行业的联系更加紧密[1]。人类生活涉及网络的点点滴滴,随着物流体系实名认证条例以及移动运营商实名细则实施,用户已经无法做网络背后的隐身人,个人信息泄露等一系列问题也会随之发生。不法分子利用网络盗取用户的账号,进行一系列诈骗等犯罪活动,给人们的生活带来很多不必要的麻烦。金融业涉及用户隐私保护,主要从资金安全保护考虑。互联网改变了商业支付模式,支付宝等个人商业支付模式在方便用户购物等行为的同时,资金账户安全也逐步被日益重视起来,如2015年12月28日上午,中国人民银行正式发布了《非银行支付机构网络支付业务管理办法》,新规意在保护用户隐私[2]。支付机构应以“最小化”原则采集、使用、存储和传输客户信息,并基于征求意见稿增加了不得存储客户银行卡磁道或芯片信息的规定。然而随着一些特殊的监测要求,有些场合需要对网络用户进行一定的监控以防止一些危险的事情发生,如欧洲多国拟增强网络监控应对威胁或牺牲民众隐私[3]。互联网隐私保护,不仅是监管机构需要加强网络管理,而且需要用户自身加强隐私防范。网络用户也需要具备加强隐私的保护意识[4]。在社会网络中,用户隐私保护不仅需要网络管理部门,如公安部门,网站管理部门等机构制定协同保护机制,而且也需要用户采用安全策略对自身核心信息进行规避,如身份证信息,银行卡信息等。总之,个人安全已经突破传统的安全领域,信息安全也是未来安全领域中重要组成部分之一。图书馆管理着大量的读者个人信息,图书馆各种资源与服务系统中也记录着读者涉及个人研究动态与学术思想的数据信息,其信息安全也必须通过技术与制度手段得到有效的保护。
2 高校图书馆读者信息数据现状
网络环境的不断发展,已经逐渐形成具有社会特色的网络社会,如微信朋友圈,微博空间等已经逐步形成一定网络社会空间。高校图书馆在网络化信息化的环境下,为了满足读者的网络偏好,建设了微信图书馆,移动图书馆等符合读者使用习惯的互联网应用平台。高校图书馆作为高校的专业文献资源保障部门,提供着读者所需的教学与科研文献资源。信息技术发展促进资源的数字化水平的提高,互联网也拓宽了读者获取资源的途径。数字图书馆多年来的发展,不仅在图书馆技术应用水平得到提升,也在一定程度上促进了资源数字化的发展。数字资源也逐渐提高在资源体系中的地位。长期以来数字资源类型存在差异,音频、视频、电子图书、电子期刊等格式,并且存在资源供应商的不同,图书馆暂时无法对数字资源进行有效的统一管理。现有主要的图书馆管理系统中,也缺乏数字资源管理模块,导致了高校图书馆在复杂的网络环境下,无法对读者利用数字资源等信息进行有效的统计分析。部分馆员和图情界学者针对读者资源获取方式、资源获取的内容以及途径在技术和策略方面做了理论与实践性的研究工作。最初研究的目的是为了准确获取读者信息需求数据,保障图书馆能够在有限的资源经费情况下,采购读者所需的资源,提高图书馆的资源利用率。例如运用网络日志分析的方式对读者使用数字资源的情况进行统计,得出数字资源的利用率数据,从中分析出读者信息行为,挖掘需求动态信息[5-7]。数字图书馆建设至今形成了多种系统并存的状态,如门禁系统、无线网络系统、座位管理系统、图书馆管理系统等,各种系统在运行过程中,一般会以日志的形式记录读者访问信息,可以利用这些信息进行数据关联的方式得到读者在图书馆的信息行为数据,得出读者的行为轨迹。数字图书馆系统组合运行,为资源与服务网络化服务提供了方便,同时能够吸引读者利用图书馆进行教学与科研的资源获取。高校图书馆提供的各种系统主要分为资源类系统和服务类系统,如表1所示:
针对这些得到的数据进行挖掘,可能会得到一些涉及读者思想行为与学术动态等内容的信息,但是过渡挖掘其中的数据信息,也许已经涉及侵犯读者隐私等问题[8]。在系统运行过程中产生日志等涉及读者隐私数据,一般通过对这些数据进行挖掘,才能够图书馆资源建设与读者服务的指导性信息,利用这些信息运营图书馆,才能够提高图书馆的服务效率,迄今为止在利用图书馆读者行为数据的过程中,暂时还未规范建立一套针对读者数据安全的隐私保护机制。本文以高校数字图书馆的各种系统数据为研究对象,提取出与读者信息行为数据相关的日志的保护方法和策略进行研究,实践探讨高校图书馆可行性的读者信息保护机制模型。
3 读者网络信息行为与隐私保护
由于互联网的普及,改变了读者获取信息的方式,百度等已经成为读者主要的搜索工具。在高校图书馆开展以读者为中心的理念推动下,读者利用互联网进行信息检索等行为,是高校图书馆想要获取的重要信息之一。高校数字图书馆建设至今,各种信息资源的网络化与数字化普及,已经能够满足现代读者的资源获取的习性需求。但是资源的建设成本不断提高同时读者需求也存在着多样化发展,在此背景下也带来了图书馆改变原有的以资源为中心的图书馆建设模式,逐步向以读者服务为中心的模式转变。掌握读者的信息行为数据,是进行以个性化读者服务的关键基础。资源获取方式互联网化,与传统的资源检索形式相比,显示出其高效性、便捷性。读者获取信息的方式已经离不开互联网的支持。在网络环境复杂化与读者资源获取习性的背景下,高校图书馆也逐步尝试运用新的技术获取读者信息动态以及资源动态信息。数字资源在互联网中多媒体应用的大环境下,已经逐步被广大读者所认可。由于数字资源的内容以及供应商不尽相同,资源的品质与服务也逐步被图书馆所关注,同时数字资源利用率统计数据等也逐步被用以评估数字资源效益。部分图书馆技术部门和一些软件开发者设计并实践了针对数字资源的统计分析系统,该系统不仅能够统计分析出数字资源的利用率详细情况,如访问的数据库类目,访问、浏览、下载的数字资源名称、类型等,而且能够通过访问情况获取到读者的详细信息,如班级、姓名、研究内容和研究方向等信息。纸质资源的统计分析可以利用图书馆管理系统对读者用户的借阅行为监测,例如通过对读者借阅数据信息能够获取到读者阶段性研究方向与信息行为。纸质资源的管理系统,是一个相对封闭的系统,如汇文系统等。读者信息行为数据需要通过图书馆管理用户登录获取,与各种服务系统之间的关联性不够顺畅。在图书馆管理系统中进行纸质资源的读者借阅行为分析一般是在系统内部进行,例如统计一定时间内读者借阅量等数据信息。图书馆中多系统整合不仅利于统计分析的方便,同时也降低了系统的管理成本。将业务相关的系统进行关联,通常利用数据接口形式进行,在一定程度上达到部分功能整合的目的。在多系统整合与数据关联,挖掘其中读者相关的数据信息,不能够有效的控制系统之间的数据的稳定性与安全性,也会出现读者隐私数据泄露以及系统崩溃的情况出现。所以,在当前图书馆比较关注系统整合,异构系统数据关联整合环境下,虽然方便了管理者对系统管控,但是也在一定程度上对读者信息数据隐私侵犯。所以,在图书馆实际工作需要条件下,根据所需关联获取有关的数据信息,避免核心无关的数据截取,从数据挖掘的根源规避对读者隐私的侵犯。
4 数据隐私保护策略规划
高校图书馆应用系统建设在校园网范围内,并且系统之间存在着独立性,不同系统之间的数据标准也不尽相同,如果不建立数据接口对相关系统进行关联,系统中数据的安全系数较高并且处于稳定的状态。近些年来,图书馆为了各种业务需求,将业务相关的系统进行数据关联,在此过程中也带来了一系列数据安全性问题。系统之间的关联主要目的就是方便对不同系统之间目的数据进行采集,用以后续的数据挖掘、分析,获取对图书馆有用的读者信息需求动态数据信息。由于读者在系统中的信息行为等数据本身就已经涉及读者隐私问题,如何保护这些数据不被图书馆用作信息服务以外的用途,是图书馆技术人员与管理者所需要思考的问题。图书馆需要通过制定制度来规范读者数据的利用,主要围绕以下4点来进行逐一制定策略。
4.1 提高数据采集精度
高校图书馆为了满足学科服务需要,运用技术手段采集读者信息行为数据,并对信息行为数据进行分析,得到读者资源需求并匹配相关资源推送给读者,从而达到提高图书馆资源利用率的目的。例如利用微信图书馆和移动图书馆等平台进行信息的定点推送。图书馆在数据采集过程中,由于参数设置不够完善,标准不够明确,会导致许多无关学科信息也同时被采集,不仅增加了数据清洗的工作量,并且也容易泄露读者信息。所以,在数据采集过程中,必须要优化采集参数设置,例如关键词等,做到采集精度的提高,保障数据采集的准确性与高效性,也避免对读者隐私的泄露风险。
4.2 研究数据采集法规
读者信息、读者数据、读者隐私这些不同的说法一直长期存在,如何界定之间的关系,需要从法律法规方面进行讨论。数字图书馆建设至今,资源数字化和管理数字化程度不断提高。管理数字化系统的管理对象为读者以及与读者相关的资源。系统运行过程中,就会时刻产生系统日志,其中难免会涉及读者数据信息,如何保证该信息不被不法分子所利用,不仅是技术保障的问题,而应该是制度与技术同时制定策略,在达到保障信息服务工作目的的同时又能够有效保护读者隐私目的。我国没有制定单独的个人信息保护法律和法规,相关法律和法规也只是针对姓名、肖像权、名誉和隐私等权利[9]。在相关信息保护基础上,建立适应高校图书馆的数据采集制度,是图书馆管理者所要考虑的问题。可以适当在资源与服务项目服务过程中,以告知的方法让读者知晓相关权利和义务。具体原则性内容包括以下5点:
(1)图书馆与读者之间的建立知情与同意原则。图书馆在信息服务过程中,明确告知读者的信息将被采集、处理、并且被利用等情况,并征得读者同意。
(2)图书馆必须告知读者信息利用的目的用途。图书馆在信息服务过程中,要解答读者关于信息服务工作中,读者信息采集的目的与用途,以打消读者存在的顾虑。
(3)图书馆遵循信息质量和安全保障的原则。图书馆在获取读者信息数据过程中,必须准确获取数据的字段信息,剔除无用数据信息,在一定程度上保障数据的安全。
(4)图书馆遵循读者信息保密义务。图书馆在读者信息管理与数据挖掘过程中,不能散布、出售和非法利用读者的信息,否则应该承担相应的法律责任。
(5)应急机制例外原则。如遇到政府等行政机关以及安全政法机关在遵照相关规定的前提下,提取图书馆系统读者数据,应允许政府等执法机构维护管理职责中合理使用。
4.3 建立匿名模型体系
高校图书馆的服务对象较为固定,可以划分为教师读者和学生读者。高校中为了方便人员管理,往往建立类似于人员编号的管理方法。如教师有教师工号,学生有学号等。所以,可以建立以读者代号的方式隐蔽读者敏感信息的方法,既可以让图书馆时刻掌握读者的学术动态,也可以在一定程度上避免读者真实信息外泄。由于读者的工号或者学号的惟一性,可以用作系统关联的字段进行系统集成。通过读者的工号或者学号取代读者的真实信息,用以分析读者的学术动态的匿名模型体系,从管理角度,利用现有的读者身份认证体系进行读者隐私保护,可以避免核心敏感信息的泄露,具体模型如图1所示:
4.4 多方信息交互信息管理
高校图书馆的读者用户个人注册信息,如果与学校数字化校园关联,一般是通过第三方的信息交互推送至图书馆管理系统中,例如高校新生报到注册、新教工注册等,通过一卡通管理中心将图书馆所需的读者证件号、身份证号、单位、读者类型等信息推送至图书馆管理系统中。交互式的方式常用的方法是访问的控制,第三方信息推送的过程中,按照预先设置的参数和策略进行信息推送,在一定程度上避免了读者用户信息泄露的风险。多方信息交互管理的方式,以高校图书馆为例,一般包括图书馆、用户信息管理方(学工处和人事处)、一卡通管理中心。读者用户与各种系统之间信息交互模式如图2所示。
读者数据信息集中管理的方式,保证了数据的稳定性与安全性,通过认证与授权方式对读者用户的自主权进行管理,也方便了读者对自身数据的维护。针对系统平台的数据信息请求,通过访问授权与访问令牌结合的方式,保证了系统平台与读者信息数据库之间的通信稳定与安全,系统平台可以将系统中有关用户的数据传递给读者用户信息数据库,进一步保证数据的安全性与稳定性。高校一卡通的管理模式一般是通过该方式进行管理的。
5 网络技术隐私保护方法
5.1 采用独立认证方式
随着网络实名制度的普及,网络中的门户网站,软件工具等都需要进行实名注册登记。采用手机实名认证是比较简易的方式之一。由于手机实名认证体系较为规范,而用户通过手机获取动态验证码登录,是当前比较安全的用户认证登录方式之一。高校图书馆在各种系统建设过程中,需要逐步引入独立认证系统,在规范用户行为的同时,也避免用户的隐私泄露等风险。
5.2 采取信息混淆方式
高校图书馆获取读者信息的目的,主要是想通过信息追踪的方式进行学科服务,同时获取资源动态信息用以指导资源建设。在图书馆各种系统中,获取的读者的信息,一般较为精确。按照统计学相关理论进行归纳、统计、分析,个人的动态信息不足以反映客观事实,所以,通过将海量的读者需求信息,通过信息混淆的手段进行聚类分析,可以较为准确地反映读者的信息需求。信息混淆的方式,可以将单个读者信息模糊化,在这个过程中可以避免读者的个人思想动态与学术研究泄露。这个方法可以在宏观层面掌握读者信息需求,但是对于特定读者的个性化服务无法实现。
5.3 模糊网络监控方式
高校图书馆各种系统的异构性,决定了技术人员无法通过同构系统手段获取相关的数据。通过网络监控的方法,能够较为全面的获取到读者在网络范围内的信息动态,可以较小地受到异构系统的影响。图书馆进行针对性的读者服务是未来发展的趋势,针对性的读者服务前提是获取读者的需求。例如读者通过管理服务系统向图书馆发出信息请求,读者通过资源系统获取信息资源数据信息等。所以,部分高校图书馆实践了网络监测方法用以时刻掌握读者的信息行为,其主要原理是在校园网范围以内,读者访问图书馆所拥有的资源信息的行为进行记录。高校图书馆的读者群体,一般都有统一的身份识别号,如学号或者工号。网络监控过程中,读者访问的记录,一般都会被准确记录,如IP地址信息,实名认证后的姓名等,通过身份识别号的方式取代读者的核心信息,一方面可以获取到读者的信息需求同时保护了读者的核心信息;另一方面可以精确获取到读者的信息需求动态,从而可以进行个性化服务。
5.4 用户信息中心化管理
多系统综合运行是图书馆数字化服务的基本模式,在图书馆的多系统服务过程中,涉及读者个人信息部分,需要建立可信的第三方中心模型进行管理。因此本文在总结读者信息保护策略前提下,提出读者信息的中心化管理模式,与图书馆各种系统合作提供可信的读者个人信息的管理与应用服务。例如在Web服务框架以服务的方式进行封装应用,并对外发布形成一套跨平台的Web服务共享体系[10]。
6 读者信息保护模型与实践
南京晓庄学院图书馆在与数字化校园的数据对接过程中,优化了读者数据库注册部分。将原始读者资源库采用数据对接的方式引入图书馆管理系统中,如条码号、姓名、单位、身份证号码、证件号、生效日期与失效日期等。在系统对接过程中,为了规范读者信息与应用服务数据,需要设计一套读者用户信息模型,目的是为了规范读者个人信息与各种系统语义的标准化。其中包含读者用户信息编码规范,系统之间通信权限的设置模型,读者信息应用记录模型等。
6.1 理论设计部分
定义1 中心服务UID为注册读者用户提供惟一的身份识别符,如身份证号、证件号等。读者用户身份识别符号集合UIDs={ID1,ID2,ID3,…,IDn},代表了中心服务中n个读者群体信息的集合。
定义2 服务系统System为各种服务平台储存一类读者信息。Systems={S1,S2,S3,…,Sn},代表了服务系统中由n个系统组成的一类读者数据的集合。
定义3 权限管理AP为各种系统以及各种读者的权限进行划分。如读者中分为教师读者和学生读者,其使用图书馆的权限存在差异性。AP={AD,TID,SID},其中AD表示图书馆管理员,TID为教师读者,SID为学生读者。
在图书馆网络中,读者用户信息的编码规范需要对类型标识、数据格式以及取值范围进行定义。例如读者的证件号、性别、出生年月、身份证号码、登录系统的密码等。数据格式的定义如男女分别可以用{“M”,“F”}标识。
所以,读者的个人信息应用轨迹模型可以用{UIDs、Systems、AP}所示,其中UIDs表示用户的基本信息,Systems表示读者用户在各个系统之间信息行为轨迹数据,AP为用户的权限。例如AP在读者用户权限管理,接受或者拒绝读者用户访问系统,Systems可以用以读者信息行为统计分析等。
6.2 保护实施部分
读者用户信息管理,伴随着应用的需求,例如微信图书馆、移动图书馆的登录访问,只有有效用户才能够利用图书馆提供的资源与服务系统。读者信息服务针对的对象不同,可以分成两类,第一,以读者为数据源,即以读者为研究对象,统计分析读者的信息行为,例如访问的数字资源、借阅的图书、使用过的设备设施、访问图书馆门户的页面等。第二,将读者信息行为与系统运行数据联合统计,运用数据挖掘方法获取应用需求等信息,例如图书馆资源热点信息、读者关注较多资源信息、校内读者研究动态热点、读者借阅排行、图书借阅量、读者近期研究内容等信息。
高校图书馆一方面需要获取读者的信息需求;另外一方面也担心在此过程中对读者隐私权的侵犯。在技术引领发展的环境下,高校图书馆利用先进技术的同时,也需要不断对技术尚未考虑到的人文层面的问题进行修订。互联网中的读者隐私保护也逐步被提升到决策层面来,图书馆也需要不断完善读者数据保护策略。高校图书馆在保证图书馆工作正常运行的同时通过技术与制度手段保护信息数据的安全,是图书馆管理职责之一。高校图书馆隐私保护与数据应用模型,如图3所示。
引入第三方认证方法,能够保证了数据的真实与可靠性基础上,能够保障读者个人信息的安全。在对读者信息的抽取应用的过程中,也能够避免虚假信息对图书馆数据管理与数据挖掘结果的影响。数字资源分析利用与馆藏资源分析方面,图书馆能够从资源利用角度获取读者的信息需求。座位管理与门禁管理系统数据方面,也在一定程度上反映读者对图书馆空间利用的状态。模型能够根据不同应用的需求,提供相关的数据,在一定程度上能够避免无关信息对数据应用结果的干扰,同时也避免过多无关数据泄露读者个人信息的危险。
7 结束语
高校图书馆属于专业性图书馆,其工作职责是为高校提供教学与科研服务。随着读者教学与科研水平的不断提高,对资源的要求也随之提升。高校图书馆在围绕读者需求的环境下,采取读者信息行为跟踪的模式,应用技术与工作手段获取读者的学术动态,研究方向等信息,一方面可以提高学科服务效率,提升资源利用率;另一方面能够针对读者进行个性化服务。但是当前高校图书馆往往只注重服务手段,如在读者毕业季的时候,通过采集读者系统数据的方式,提供给书单等关联信息等。缺乏规范性的读者隐私保护策略措施,缺乏主动告知读者权利和义务的宣传。本文通过当前图书馆数据管理与利用的情况进行分析,提出了当前商业运行比较成熟的模型和策略,构建了高校图书馆隐私保护与数据应用模型,与广大读者共同探讨完善。希望在不久的将来,高校图书馆技术工作者在通过技术提升服务的同时,也兼顾相关法律法规政策的制定,避免在工作中出现违规乃至违法事情出现。
参考文献
[1]网络时代如何守护个人隐私[OL].http:∥tech.gmw.cn/newspaper/2015-12/22/content110298677.htm,2016-01-11.
[2]银行专家:央行新规意在保护网络支付客户个人隐私[OL].http:∥finance.china.com.cn/money/efinance/special/zfglbf/20151228/3518967.shtml,2016-01-11.
[3]欧洲多国拟增强网络监控应对威胁 或牺牲民众隐私[OL].http:∥news.163.com/15/1225/09/BBM22H2D00014JB6.html,2016-01-11.
[4]专家谈2015网络安全形势 建议网友强化隐私保护意识[OL].http:∥society.people.com.cn/n1/2016/0105/c1008-28015257.html,2016-01-11.
[5]王政军,董晓梅,俞小怡.基于旁路监听的数字资源评估系统的设计与实现[J].图书情报工作,2015,(9):52-57,35.
[6]沈奎林,邵波,杜瑾.基于网络日志分析的数字资源监测系统的实现[J].图书馆学研究,2015,16:21-25.
[7]陆康.高校图书馆数字资源统计系统建设研究[J].现代情报,2015,(9):140-145.
[8]常雅红.网络信息监控环境下图书馆用户隐私保护探究[J].图书馆学刊,2015,(11):36-38.
[9]张凌利.论我国个人信息在网络环境下的法律保护[D].合肥:安徽大学,2010.
[10]王晗,张玲.面向个人信息管理的网络隐私保护模型研究[J].情报科学,2015,(10):47-51.