基于CiteSpace知识图谱的1997—2022年中国个人信息保护可视化研究
2022-09-01王燕妮
王燕妮
(西安外国语大学,陕西 西安 710128)
0 引言
互联网的兴起给日常生活带来了极大的便利,但无止境的信息索取也给信息安全带来了极大隐患。个人信息是指以电子或其他方式记录的,通过单独或与其他信息相结合,识别出自然人身份或活动轨迹的各种信息,包括姓名、出生日期、证件号码、个人生物识别信息、行踪轨迹等[1]。2021年11月1日,我国正式施行《中华人民共和国个人信息保护法》以促进个人信息依法有序使用,这是我国第一部专门针对个人信息保护的综合性法律。在此之前,我国对个人信息的法律保障以间接的隐私权法为主。截至目前,世界上对个人信息保护制定专门法规的有美国、日本、荷兰等50多个国家和地区。
国内学者对个人信息的研究始于1997年,但此后数年该领域的研究处于缓慢甚至停滞状态,直到2010年出现第一个小高潮。2010年的研究热可能与《中华人民共和国政府信息公开条例》及《个人信息保护法(草案)》的提交有关,法理研究与时事政治的连接之紧密可见一斑。此后该领域的研究呈现持续走高态势,对隐私保护、大数据、信息公开、立法、征信等关键词的研究持续深入。至2021年《个人信息保护法》正式开始实施,将我国个人信息保护研究推向最高潮。以往的研究浩若烟海,本文对现有文章进行梳理可以对领域内的研究现状进行探析,并爬梳研究热点,进而对后续研究有所启发。
1 研究设计
本文借助华裔学者陈超美开发的可视化软件Cite-Space(版本号5.8.R3)作为数据分析工具,对中国个人信息保护领域在1997—2022年间的相关研究进行计量分析。为了使数据具有权威性,本文选取中国知网(CNKI)数据库中的CSSCI与北大核心来源期刊作为数据来源,以“中国个人信息保护”为主题词进行检索,剔除卷首语、述评等无效数据后,共得文献1 317篇,最后检索时间为2022年2月28日。
2 领域内发展分析
2.1 发文量分析
发文量情况可以在一定程度上反映研究领域的受关注程度。从图1可以看出,我国个人信息保护领域的研究在1997—2001年间处于较低水平,但此后整体呈上升趋势,尤以2021年最为显著。
2.2 学科分布分析
中国个人信息保护领域涉及民商法、行政法及地方法治、新闻与传媒、刑法、法理法史等多个学科。总体来看,人文社科方面的研究较多,理工类研究较少。研究最多的为民商法领域,有628篇;其次是行政法及地方法制、新闻与传媒两个研究领域,分别有402与86篇。
可以看出,个人信息保护属于多学科交叉的复合型研究领域。 民商法、行政法及地方法治领域重在对个人信息的专属性保护,提倡加强领域内的法律保障。新闻与传媒领域则试图寻找信息公开与信息安全、社交媒体时代个人的自我表达与信息安全之间的平衡点。值得一提的是,图书馆情报与数字图书馆领域对个人信息保护研究也处于走高状态,领域内以图书馆系统内个人信息的类型与泄露方式为主,分析不同需求用户的差异化信息索取。
2.3 核心作者分析
核心作者群可以从发文量与文章高被引两个层面进行探究,用以展现学科内部的发展路径与成熟度。由图2可知,中国个人信息保护领域核心作者连线E=90,密度(Density)=0.000 7,说明该领域内核心作者之间的合作较少,未能形成规模化合作;且作者的学科分布广泛,在该领域内深耕的学者较少,最高发文作者仅有9篇。此外,个人信息保护领域高被引文献以法学领域为主,张建文、张新宝、齐爱民、丁晓东等学者无论是在发文量还是被引量方面都遥遥领先,为领域内的核心作者。
图1 研究成果数量时间分布
图2 核心作者合作共现图谱
3 研究热点与前沿
3.1 研究热点分析
主题词、关键词是对文献的高度概括,关键词中心性可以体现该词在整个共现关系中的能力强度,高频且高中心度的主题词代表该领域的重要议题[2]。一般认为,中介中心性大于0.1即表示该节点在网络结构中处于重要位置。由表1可以看出,1997—2022年中国个人信息保护领域研究的热点议题为个人信息、隐私权、大数据、隐私保护等。这表明学界对个人信息保护的考量主要从隐私权、人格权、法律保护及其在大数据环境下的新呈现出发。
表1 高频及高中心性关键词
早期个人信息保护模式体现在个人信息与隐私制度的逐渐界分。隐私权起源于美国,学者将其定义为“免受外界干扰的、独处的”权利[3]。英美法系主要通过对隐私权相关内容的丰富应对互联网时代的个人信息保护,即“大隐私权的保护模式”;而大陆法系更多采用人格权模式应对个人信息保护领域的相关问题,认为有些个人信息与生俱来且无法转让,具有专属性与依赖性,当此类信息被泄露后,可能会对个体的人格自由与尊严产生伤害。如认为应在《民法典》的“人格权编”中增加“个人信息权”,这是“独立人格权说”的典型例证。我国对个人信息保护领域的法律依据主要是对传统模式的选择性继承,认为个人信息侵权视为隐私侵权的附属类别[4],此外对个人信息保护立法的可行性探究与《个人信息保护法》立法后的应用也是一热点话题。在大数据时代,对个人信息保护的探讨自然离不开时代环境的烙印,新时期下对个人信息保护的模式应与实际需求进行平衡权宜以达到合作共赢。
在此基础上,CiteSpace软件还可以对关键词与主题词进行聚类,将样本中具有明显相似特征的词汇进行整合,进而在研究范围内挖掘领域内的热门议题。具体到本次研究中,聚类标识词按照节点数频次排列依次为:个人信息、人工智能、隐私权、信息公开、法律保护、信息保护、信息安全、隐私保护、图书馆、个人隐私,如图3所示。为了对个人信息保护领域近年来的热点选题进行探析,本文对以上聚类词进行合并处理:个人信息保护的政策研究(个人信息、信息公开、隐私保护、信息保护);个人信息保护的法律研究(隐私权、法律保护、个人隐私);个人信息保护的技术研究(人工智能、图书馆、信息安全)。
图3 关键词、主题词聚类图谱
个人信息保护的法律研究集中在隐私权及其法律保护层面,从政府信息公开管理过程中可能的个人信息泄露、电子商务发展过程中对消费者隐私的保护、大数据时代相关条文的新解读等层面进行探讨。个人信息保护的技术研究以人工智能环境下的信息可视化与数据挖掘为主,倾向于将互联网环境下的海量数据进行整合分类,以期对日常生活带来便利。个人信息保护的政策研究聚焦于对国外相关法的呈现,分析其在我国的适应性与在地化;在相关政策的草案收集、颁布期间,学界也会形成研究热点,对法规、部分法条进行解读,并分析其在实施期间的优势与问题。
3.2 研究前沿分析
因为在不同时期,中国个人信息保护研究领域的热点话题有所区别。为了更加直观地探析时区内的关键词分布,本研究绘制重点关键词突现图谱(见图4),反映文献被引频次在某一时间节点的增减情况。突现词能够直接简明地反映某一时间段领域内的重大转向。检测发现,中国个人信息保护领域在20余年研究中存在9个关键词突现:信息公开、征信、刑法保护、权益保护、法律保护、大数据、被遗忘权、人工智能、知情同意。
图4 重点关键词突现图谱
综合发文量、关键词中心性、聚类分析与关键词突现分析,可以将中国个人信息保护领域的热点时区分为以下3个增长阶段。
第1阶段(1997—2006年):对个人信息保护相关理论的初步探讨阶段。在这一时期,学界对个人信息保护这一话题进行初步探索,相关概念如信息安全、隐私权、信息公开、法律保护、人格权等已经开始出现并得到持续发展,隐私权这一关键词更是贯穿个人信息研究的始终。
第2阶段(2007—2013年):对个人信息保护方式的探讨阶段。个人信息保护领域的研究进入第2个发展阶段,“保护”成为研究热点,信息保护、刑法保护、权益保护、法律保护等对个人信息的保护手法不断兴起。从重点关键词突现图谱中可以看出,刑法保护作为热点关键词持续的时间最久,影响最为深远,如图4所示。此外,在这一时期,互联网开始出现并迅速发展,互联网社交媒体时代的个人信息保护研究也开始浮出水面。
第3阶段(2014—2022年):对互联网影响下个人信息保护的探讨阶段。随着互联网技术的不断发展,人工智能、大数据、云计算开始出现在研究视野内,这就是第3个增长阶段,人工智能自2018年成为领域内研究热点以来,一直备受学者的关注。在这一时期,被遗忘权也曾风靡一时,至2019年逐渐淡出学者的视野。此外,受新冠肺炎疫情的影响,2020年,2021年间对个人信息保护与突发性卫生事件发生时的信息采集之间如何平衡也成为研究的热点话题[5]。
4 讨论与总结
本文以1997—2022年间中国知网的CSSCI期刊与北大核心期刊数据为基础,以信息可视化软件CiteSpace为研究工具,对20余年间中国个人信息保护领域的相关研究进行可视化图谱分析。研究结果显示:从发文时间看,我国个人信息保护领域的发文数量呈现上升趋势,可以分为较少关注阶段、稳定增长阶段与持续走高阶段,不同时段内学者的研究脉络大致呈概念探究—法律保护—互联网影响的趋势,其中隐私权贯穿个信息保护研究的始终;从发文作者方面看,张建文、张新宝、齐爱民、丁晓东等学者是个人信息保护领域的核心作者;在作者合作网络方面,由于个人信息保护属于多学科交叉的话题,领域内部呈现分散有余、合作不足的状态,独立研究与两人合作发文的情况比较多,学者之间、机构之间的联系较少;隐私权、大数据、隐私保护、民法典、人工智能、信息公开是该领域的高频关键词,个人信息保护的前沿研究包括其政策、法律及技术层面,对其政策发展路径、法律条文细分及参考原则、技术所带来的影响进行深入分析。
随着公民隐私意识的深入与《个人信息保护法》的实施,以及互联网带来的持续可能性,个人信息保护领域也迎来了新的发展机遇,同时也给未来个人信息保护领域带来新的研究命题:首先,个人信息保护领域研究的理论基础不甚完善,主要体现在研究过程中所出现的概念混用现象,如个人数据、个人信息、数据信息等同一理论采用不同的表述,给领域内进一步研究与系统化成就带来障碍,在后续研究中应当寻找一个为业界所广泛认可的理论。其次,个人信息保护领域研究思辨性、法理型研究较多,偏量化的实证研究相对较小,理论研究未能与一手的研究数据与统计结果相适应,对学界业界的普适性价值降低。最后,从关键词突现图谱中可以看出,个人信息保护领域的重点关键词此消彼长,每一时期的研究热点略有不同,但人工智能与知情同意两者作为新一时期的热点关键词,目前仍呈现重要的研究价值,有待学者们的进一步探讨。