APP下载

大数据时代个人信息安全问题现状研究

2020-12-14李宽苗李超赵胜

关键词:文本挖掘因子分析信息安全

李宽苗 李超 赵胜

摘 要:以安徽省合肥、蚌埠、淮北三个城市的公民为调查对象,分析影响公民个人信息保护意识的因素,提出个人信息保护措施.调查结果显示,目前个人信息安全法律体系尚不完善,公民虽有信息保护意识,但很少采取维权措施.提出以下建议:政府应综合利用刑事及科技手段,推动立法完善,构建多元的信息安全保护体系;企业应自觉遵守个人信息安全保护规范,建立户企间的信任;公民自身应进一步提高维权意识,勇于开展维权行动.

关键词:大数据;信息安全;文本挖掘;因子分析

[中图分类号]TP309.2   [文献标志码]A

Abstract:Taking citizens in the three cities of Huaibei,Bengbu,and Hefei in Anhui Province as the survey subjects,analyze the factors affecting citizens' awareness of personal information protection,and propose personal information protection measures.The survey results show that the current personal information security legal system is not perfect.Although citizens have information protection awareness,they rarely take measures to protect their rights.The following suggestions are put forward:the government should comprehensively use criminal and technological means to promote the improvement of legislation and build a diversified information security protection system;enterprises should consciously abide by personal information security protection norms and establish trust between households and enterprises;citizens themselves should further enhance their awareness of rights protection,Have the courage to carry out rights protection operations.

Key words:big data;information security;text mining;factor analysis

大数据产业快速发展为经济效益提供了支持,但也导致个人隐私数据泄露问题频发.2017年,世界范围内共计发生5 207起数据泄露事件,涉及公民个人信息量达78亿条,大数据时代个人信息与隐私安全问题成为全球性的难题.目前,对个人信息保护存在的问题研究较为深入.汪海波[1]将个人信息泄露风险分为本地化问题和其他用户媒体泄露问题.王雪婷[2]认为在进行社交活动的过程中存在着信息传递的行为.曹雅慧[3]认为,由于信息技术的发展以及社交网络的开放,使得个人隐私受到多方面的威胁,第三方机构、各社交平台、其他娱乐性平台等利益相关体均可能对用户的个人信息造成潜在的威胁.白宇栋[4]认为,在云计算过程中,由于计算数据是通过网络传输的,因此,在传输过程中可能会被不法分子破坏或是截获,从而造成个人信息传输的失败而泄露个人信息.李亚薇[5]认为,大数据技术的发展,给人们带来便利的同时也引发了隐私伦理问题.彭诚信[6]认为,在大数据时代,个人信息变成了网络空间的大数据,隐私、信息与数据的个人保护和企业利用成为数字社会发展的最大矛盾.张新宝[7]从个人信息的发展角度出发,分析了信息与利用的利益关系,提出强化“个人敏感隐私信息”的保护,强化个人一般信息的利用.范为[8]引进了“场景与风险评估”.郭春镇和马磊[9]将关注点从对个体权利的保护转向对信息控制者、监管部门等相关主体的责任分配,以期确立一种具有整体性、灵活性的治理框架.李学锋[10]提出国家应不断完善“保密法”和“隐私法”,进一步规范网络信息的公开.笔者通过分析影响公民个人信息保护意识的因素,提出信息保护措施,为公民保护自身的数据安全、企业降低和避免自身经营风险、监管者合法监管,提供科学有效的参考.

1 调查对象与方法

调查对象 安徽省合肥、蚌埠、淮北三市的公民.样本基本情况详见表1.

调查内容 受访者的基本信息,对大数据的使用与个人信息安全问题的了解与认知程度.主要内容:受访者的性别、职业、年龄、收入、对个人信息与个人隐私的区分,受访者对大数据与个人信息安全问题的基本了解情况.调查采取区域分层抽样与多阶段抽样相结合的抽样方法,共发放问卷550份,最终筛选473份有效问卷,回收率为86%.利用信度检验、效度检验以及随机检验检测问卷设计及问卷数据抽取的合理性.通过计算,克朗巴哈系数为0.810,KMO值为0.769,巴特雷特检验的P值远小于0,说明此次调查的问卷信度较好,具有结构效度.随机性检验统计量-1.96

利用Python软件对相关新闻、受访者对大数据的使用与个人信息安全问题的看法与建议进行文本挖掘.构建因子分析模型,探索影响受访者个人信息安全保护意识的因素.调查结果显示,61.5%的受访者遭遇过信息安全泄露事件,38.5%的受访者未遭遇过信息安全泄露事件.36.8%的受访者采取过维权行动(其中,63.6%的受访者维权成功,36.5%的受访者维权失败),63.2%的受访者未采取过维权行动.

2 结果与分析

2.1 公民对大数据时代个人信息安全问题的基本认知

调查结果显示,公民对个人隐私保护权的了解程度较高,占总样本数的62.16%.性别对隐私保护权的认知存在显著差异,女性对于隐私保护权了解大于男性,这可能是因为女性对于隐私一类的事件相比于男性更加敏感一些.学历的高低对于隐私保护权的认知存在显著差异.较高学历和较低学历人群了解隐私保护权比例低于中等学历.主要原因可能是初中及以下学历人群接受

教育年限较短,对于隐私保护权尚未完全了解,而硕士及以上学历人群有自己专业领域,无法分出更多时间研究隐私保护权,因此对于隐私保护权的了解程度较低.结果见表1.

2.2 基于Python的文本挖掘

使用Python软件,利用第三方库BeautifulSoup,对新浪新闻网站有关“个人信息安全”的新闻进行爬取.按照时间顺序共爬取了200多篇相关报道,初步了解涉及个人信息安全问题的矛盾及社会环境背景下的主要舆论走向.分析受访者关于大数据时代的个人信息安全问题的看法与建议进行文本分析,了解受访者对大数据发展与个人信息安全问题的利弊权衡,为解决个人信息安全问题提供有效思路.

2.2.1 新闻报道焦点解读

建立主题模型:一类关于机构,如第三方支付平台、酒店等由于数据泄露而造成个人信息安全的隐患;第二类关于大众居民对由公共卫生事件的扫码、打卡等涉及个人信息安全问题引起的反应.详见表2.

2.2.2 开放评价焦点解读

建立“大数据时代的個人信息安全问题”开放性评价文本主题模型.设立三个主题:一是大数据的使用,二是要加强对数据信息的进一步管理,三是国家应制定相关政策.详见表3.

2.3 个人信息保护意识影响因素探究

2.3.1 影响因素评价指标体系

影响公民大数据时代对个人信息安全保护意识的因素众多,笔者使用因子分析法和综合碎石图,进行公因子旋转.提取四个因子后,方差贡献率达到78%,很好地解释了全部因子的大部分信息,最终提取四个因子,详见表4.

因子载荷矩阵的列元素平方和反映了公共因子对所有原始变量的影响,是衡量公共因子的重要标准,可看作是公共因子对所有原始变量的总方差贡献.从表5可以看出,4个因子的重要程度依次为:个人信息泄露现状因子>社会法律环境评价因子>维权意识因子>隐私重视程度因子.

(1)从主因子角度分析,个人信息泄露现状因子最为重要.个人信息泄露现状是人们最为关心的话题,人们会判断其严重程度并以此采取一定的措施,防范个人隐私泄露问题.

(2)社会法律环境因子仅次于个人信息泄露现状因子.个人保护隐私的方式是通过社会舆论和相应的法律制度来维护自身的隐私安全,良好的社会和法律环境有助于隐私保护.

(3)网络大众的维权意识决定了人们在遇到隐私泄露问题时,是否能够采用适当的方式维护自身的合法权益.

(4)对隐私的重视程度决定了人们在使用大数据时是否会采取保护措施.在隐私泄露之前就将隐私保护起来,是有效避免因隐私泄露而遭受损失的重要手段.

3 建议

隐私泄露问题随着互联网技术的不断成熟,我国目前的隐私泄露以及个人信息保护问题日益严重,建议:

公民:提高维权意识,勇于维权,让信息非法收集者受到应有的惩罚

大数据时代所涉及的个人信息泄露事件越来越多,有超过60%的人都经历过信息泄露事件,但是仅有37%的人选择维权,说明大多数受访者仅仅是愿意,但很少付诸于实践.

企业:遵守个人信息安全规范,建立户企间的信任

建议企业自觉设置数据访问权限控制,明确数据使用者访问数据的目的、条件、保持时间以及责任;注意传递数据的隐私等级,保证信息传输安全,特殊行业涉及到更为重要的个人隐私,需要制定更为精确的行业规范.

政府:应积极参与网络治理,形成推动保护个人信息安全的合力

政府统筹管理,充分发挥信息安全中每一个环节相关主体的作用,严厉打击非法收集大数据伤害公众利益的行为;加强与相关专家学者、管理部门、网络服务企业之间的沟通衔接,共同保护大数据时代的个人信息安全,推动大数据时代信息使用的健康发展.

参考文献

[1]汪海波.大数据时代的个人隐私保护分析[J].信息与电脑:理论版,2019(7):204-205.

[2]王雪婷,孙晓雅.基于移动社交网络的个人隐私泄露防范能力评价[J].现代信息科技,2019,3(10):144-147.

[3]曹雅慧.社交网络隐私披露行为研究[D].北京:中国科学技术大学,2019.

[4]白宇栋.云计算环境下的个人隐私保护问题[J].网络安全技术与应用,2019(12):86-88.

[5]李亚薇,周建鹏.大数据背景下隐私伦理问题研究[J].牡丹江师范学院学报:哲学社会科学版,2018(4):23-27.

[6]彭诚信.数据利用的根本矛盾何以消除——基于隐私、信息与数据的法理厘清[J]. 探索与争鸣,2020(2):79-85+158-159+161.

[7]张新宝.从隐私到个人信息:利益再衡量的理论与制度安排[J].中国法学,2015(3):38-59.

[8]范为.大数据时代个人信息保护的路径重构——初探欧美改革法案中的场景与风险理念[J].网络信息法学研究,2017(1):248-286+393-394.

[9]郭春镇,马磊.大数据时代个人信息问题的回应型治理[J].法制与社会发展,2020,26(2):180-196.

[10]李学锋.互联网思维的“安全阀”理论与政府公信力提升研究[J].牡丹江师范学院学报:哲学社会科学版,2015(4):5-6.

编辑:琳莉

猜你喜欢

文本挖掘因子分析信息安全
信息安全不止单纯的技术问题
基于模糊综合评价法的信息安全风险评估模型
基于模糊综合评价法的信息安全风险评估模型
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
从《远程教育》35年载文看远程教育研究趋势
基于主导产业视角的战略性新兴产业识别以及实证研究
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
实证分析会计信息对股价的影响