大数据技术的风险问题及其防范机制

2020-03-16

广西师范大学学报（哲学社会科学版） 2020年1期

关键词：信息

(1.河北工业大学马克思主义学院，天津 300401；2.天津工业大学马克思主义学院，天津 300400)

21世纪以来，随着互联网技术特别是社交网络、物联网、云计算等技术的不断发展和普及，一个将数据技术作为核心资产的时代在给人类带来巨大商业价值、生活便利的同时，也对人们的社会生活、思维方式、行为意识以及理解世界的方式产生着重大的影响，某些情况下会带来技术性风险，影响社会的安全与安定。正如2012年联合国“全球脉动”小组发布的《大数据促发展：挑战与机遇》一书指出的：“数据革命正在世界各地以不同的方式和速度展开，数字鸿沟的缩窄比预期要快得多，大数据能创造国际发展的新机会，它撼动了世界的方方面面，从商业科技到政府、经济、人文、教育、医疗以及社会的各个领域，合理利用大数据可以为人类造福”[1]。相反，不合理利用大数据会产生诸多的社会性风险，“在这个电子垃圾、病毒、电脑黑客和安全突破的时代里，充斥着个人隐私、引起大规模不方便和盗窃保密资料等的行为”[2]18。为此，探讨大数据技术的社会风险问题，理性回应大数据时代的诸多挑战，寻求大数据时代社会治理的新路径，对于发挥大数据的技术优势，维护大数据时代的社会安全具有重要的现实指导意义。

一、作为信息技术发展结果的大数据技术

随着互联网技术的不断更新和发展，人类社会正在进入一个以信息生产、传播、使用和存储、可视化的信息时代。在这个不断变革的信息时代中，人们通过信息发布、产品交易、交友聊天、商业往来等每时每刻都会产生大量的数据，各种数据正在以海量的信息在聚集和变大，它们或以关系型、表格型等结构化数据存储，或以文本、视频、音频、图片等非结构性数据聚焦。在存储单位上经历了比特、字节、千字节、兆、吉、太、拍、艾、佑、诺、刀的转变，成为人类日常生活、工作和学习的重要战略资源。随着数据量的不断积累和发掘，数据从TB、PB、EB到ZB的发展，无论是量的集聚还是质的提升抑或是应用的拓展，都在宣告着人类大数据时代的来临。

根据普施曼(Cornelius Puschmann)和伯吉斯(Jean Burgess)对“大数据(big data)”一词的解释，“大数据是从商业世界走出来的。这一早期关于商业数据处理技术的词汇所反映的是这样的需求，即寻找新的工具以帮助企业更快地传送搜索数据或以更低廉的成本存储更大量的客户数据，但在此后，这个词语的意思发生了转变，它的核心变为了分析的目的——尤其为了预测建模——而使用收集到的信息”[3]。换言之，大数据不再仅仅局限于数据的存储和计算，而是转变为一个降低成本、增加收益、预测未来的工具和资源。当大数据与云计算、物联网以及移动互联网技术耦合发展不断向政治、文化和社会等领域拓展时，大数据便被赋予新的内涵，呈现出新的工作方式，改变着人类的生产、生活，同时也在改变着人们的组织方式和思维方式，将会带来社会管理和公共领域的深刻变革。诚然，在大数据的时代里，这种在后工业社会中出现的基于以“传感器、网络交易、电子邮件、视频、点击流以及当前和未来可获得的其他数字资源产生的海量、多样化、复杂化、纵向或分布式的数据集”具有以下几个突出特征：海量技术的可用性是不断被收集的；在云计算模型的海量存储系统中，利用快速计算、高数据的传输系统；存储和分析数据量的新型复杂技术。[4]

随着数据存储和挖掘技术的进步，大数据技术在驱动人们处理复杂事件、捕获在线信息、拓展商贸往来、实现产品创新、提供更佳决策、创新社会管理等方面发挥了更大作用。美国等西方大国已把数据资产上升到国家信息战略的高度，我国也高度重视大数据技术的应用和发展。中国共产党第十八届五中全会通过的《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》明确提出了要实施“互联网+”行动计划和国家大数据战略，“运用大数据技术，提高经济运行信息的及时性和准确性”，加快建设数据强国的目标。事实上，大数据技术已经或正在我国社会的各领域发挥着重要作用，而且也成为政府治理变革的全新途径被广泛应用。在政府决策方面，通过大数据分析民意、了解民情并将其转化为政策资源，为政府宏观决策提供科学、准确的数据资源；在权力运行和权力监督方面，通过大数据的记录和监督构建起立体透明的“权力运行数据库”，以此实施权力的研判、监察、预警和责任追究，实现全程化的权力监督；在风险预警和危机管理方面，基于大数据的微机系统，可以突破专业分工、部门分割造成的信息壁垒，实现信息共享、危机研判、动态管控、危机化解的处置机制，对于预测公众偏好、预防打击犯罪、缓减交通压力、防控各种疾病、预测自然灾害等方面发挥重要的防控作用；在公共服务方面，基于大数据的智慧公共服务为民众出行、教育、就医、社保、科技文化、公共安全等生产生活等方面提供精准化的服务措施；在社会治理方面，基于大数据的数据挖掘、信息存储、信息发布和查阅，一改过去自上而下的政府单向式社会管理模式，实现权力分散，治理重心下移，在社会民主化、治理网络化等方面产生重要的影响。此外，基于大数据的可视技术，使得人们可以以更加直观的方式去解读数据与结构的关系，并将复杂的数据转化为直观的图形(譬如一图读懂政府工作报告)，激发形象思维和空间想象力，以此表达政府的真实意图，拉近政府政治意愿和民众政治诉求的距离，为社会善治的达成提供新的手段。

二、大数据技术带来的风险问题

与所有技术一样，伴随着移动互联网、物联网、云计算快速发展兼容共增的大数据技术其本身并无好坏之分，其在学理上是中性的。然而，由于使用大数据技术背后的人的目的和动机不同，因而大数据技术在社会发展中的作用也不同，它既可以为人类和社会发展提供一个全新的技术手段和方法，同时也会给人类和社会发展带来诸多的风险问题。诚然，这些风险除了大数据本身因数据量的增大使得一些错误数据容易混进数据库，或者因故意封闭数据使数据缺乏多样化，或者采用断裂数据使数据缺乏结构化，进而带来数据规律的丧失和事实的失真引发大数据技术本身的风险外，在人们的社会生活中还会衍生许多新的风险问题，主要体现为：

(一)身份盗用

在现代社会，身份是公民确认自身或识别他人的条件，也是公民自身安身立命之基础。如果一个人的身份不能合理地加以确定，就会导致社会识别和认同混乱。在社会交往中，人们正是通过身份信息来证明自己或识别他人的身份，以此区别于他人的不同和差异，并保持自身的独特和身份异质。从这个意义上讲，身份与个体是同一的，是无法被偷走的。身份之所以被盗用是因为有人为了获取金钱、荣誉等利益或者逃避责任义务而盗取他人身份信息。这就意味着人的身份不只反映人生理属性的形体面貌和行为特质，而且也反映人的社会属性的符号化信息，这些信息包括姓名、性别、民族、年龄、职位、学历、籍贯、住址以及由此延伸出的电话号码、身份证号码等符号信息。由此可知，身份是人的生物信息和社会信息的结合，身份盗用实际上是盗取公民的生物信息和社会信息。身份盗用是一种古老的犯罪活动，在互联网出现之前，犯罪分子就已通过篡改他人身份、伪造他人证件、冒用他人肖像等低技术手段信息从事违法犯罪活动。随着互联网技术、云计算、物联网技术等大数据技术的发展，犯罪分子有机会有能力获取更大量的个人信息，其犯罪活动更加猖獗，给公民个人或集体造成更大的伤害。较为典型的像快递公司、家政公司、电信公司、教育培训机构、银行机构、保险机构等涉及公民个人身份信息的行业由于监管缺失，公民个人信息被肆意买卖，造成公民银行卡被盗用，不法短信肆虐，家庭住址泄露，有些甚至连高考考生信息也被盗取等。违法分子通过盗用公民身份信息进行电信骚扰、信用卡欺诈、工作欺诈、利益欺诈、移民勒索等犯罪活动，给公民个人或集体的人身、财产等造成很大的损失和伤害。

身份之所以被盗用与大数据技术的虚拟特性有着很大的关系。因为在大数据技术兴起以前，公民和组织的交往互动多是面对面进行的，而且交往互动的频率和范围是有限的，那时即使有身份盗用也多是低技术手段的运用，而且很容易被发现。但是大数据技术下的交往互动无论从互动频率还是互动范围来讲都是空前的，其交往又是基于虚拟的网络媒介进行的，虽然进入互联网空间互动都要遵守相关行业规则和法律，但由于网络立法迟滞于网络技术的发展，网络技术漏洞客观存在，再加上政府监管的缺位，给黑客利用网络漏洞提供了盗取信息的机会。当然，如果关涉公民个人身份信息行业的从业人员对他人身份信息安全处理不当和监管不力，或者行业从业人员的安全意识不强，或者为了蝇头小利不惜出卖个人信息，身份被盗用的风险就会加大。此外，由于用户的无知与疏忽，自我身份保护意识差，都会在不同程度上给犯罪分子提供盗用身份信息的机会。公民身份一旦被盗用必然会对公民个人人身安全、财产安全造成负面影响，严重的会形成社会恐慌，影响社会的正常发展。

(二)隐私泄露

美国学者丹尼尔·J. 索乐在《了解隐私》一文中指出：“隐私是人们自主决定是否把他们的思想、情感、情绪等信息传达给他人的一种正当权利。隐私是一种隶属于行为、事物和信息的特性；同时，隐私也适用于有形和无形的事物。”[5]24隐私就其形式而言表现为躯体隐私(指人身体的隐私部位)、空间隐私(指人生活的空间部位)和信息隐私(与人生命有关的一切信息)。隐私具有排他性和私密性，隐私能否暴露以及暴露于谁是个体自身的权利，通常要受到道德和法律的制约。在现代社会，随着个体生活空间的不断拓展、主体意识的不断增强，公民的个人隐私越来越受到社会的高度重视，而公民拥有隐私权是社会进步的标志。随着大数据技术的发展，公民个人的隐私与传统社会的隐私也有了很大的区别，大数据时代下的隐私最大特点是个人隐私的数据化，即个人在参与大数据生活过程中，公民的个人身份信息通常以数据的形式记录保存在信息系统中，这样有助于社会管理部门或行业服务部门对个体进行全方位的识别。相较于以往面对面的交流与交往，大数据的规模更加庞大，系统更加优化与便捷，数据更具关联和交叉，因而成为大数据时代公民个人网络信息管理的一种新的管理方式并被广泛应用。然而，在大数据时代，隐私暴露或隐私丧失也很容易发生。网上注册、网络交易或者安装一些应用程序，都会强制性地要求用户提供自己的私人信息、身份证号码、电话号码或者信用卡信息等，否则无法注册、交易或安装，多数情况下用户为了一些必要的服务不得不接受这一强制性条款，如果相关行业部门、网络公司监管不力很容易使用户隐私被泄露。此外，随着微信、微博等社交工具的广泛应用，一些用户也会毫无顾忌地在社交网站上发布自己的个人信息，包括生活照片、手机号码、生活情趣、个人爱好、家庭住址等，这些信息无疑将会赤裸裸地暴露，这为不法商人、诈骗集团利用用户信息进行间接或直接骚扰或诈骗提供机会，同时也对用户自身生活安全带来了诸多的风险和隐患。

(三)数字鸿沟

数字鸿沟(digital divide)一词肇始于利奥伊德莫里赛特(LloydMorrisett)有关信息富人与信息穷人之间所存在的一种鸿沟认识，主要是指20世纪80年代不同社会群体在计算机拥有上的差异。随着计算机技术特别是网络技术的发展，在大数据时代，数字鸿沟不仅表现为不同社会群体在计算机等设备拥有上的差异，还表现为信息传播技术的拥有以及使用方面的差异，这种差异更强调在数据认识和机会上的不同，因为对数据认识不足或者不能适时获得数据而造成个人发展或社会获得上的差异，这种差异产生的鸿沟不是微不足道的，而是影响深远的。事实上，在信息社会，“对大数据的掌握可以转化为经济价值的资源”[6]15，也可以方便公众更准确地了解社会，并进行自我管理。同样，对于政府或企业而言，大数据是一笔宝贵的财富，它们同时也是最先拥有和掌控数据的部门，至于数据如何流动、何时流动完全取决于政府或企业的意志。当政府和企业意识到自身利益可能实现或者将要实现时，它们很有可能与社会公众共享数据。当然这个过程通常是自上而下的缓慢流动过程，之所以缓慢就在于其在现实生活中往往会遭遇多重阻力：一是企业通常把数据当作核心竞争力或者核心机密，为此不惜花费大量的人力、物力、财力去收集和分析数据，这样很难将数据与公众共享；二是政府受制于观念、体制和安全等因素的影响，在数据公开方面通常步伐比较缓慢，公众要想获得有价值的信息依然有难度；三是公众自身由于思想认知、行为迟缓以及对于大数据技术适应度的差异，很容易造成数据鸿沟。此外，随着大数据技术的广泛应用，大数据技术必然带来公众数据思维的变化，而对于那些习惯于传统思维下生活、工作的公众而言，要想改变他们的习惯性思维确实不是一件容易的事情，这样，公众习惯性思维的客观存在与大数据时代数据思维的发展趋势必然会产生矛盾，这种矛盾不是短暂的，而是一个长期的、复杂的过程。在这个过程中，一方面大数据技术在不断普及，逐渐成为公众摆脱贫富差距的重要手段；另一方面却在信息“富有者”与“贫困者”之间无形地构筑了一道鸿沟，加剧了贫富差距，从而形成了新的社会不公正，这为社会的平稳发展增添了新的风险。

(四)安全危机

“安全”在字面上可理解为不受威胁，没有危害、危险或损失。社会学则将“安全”解释为人类在生活、生产过程中，将系统运行的状态对人类的生命、财产、环境可能产生的损害控制在人类可接受水平以下的状态。诚然，追求安全是人类生存和发展的基本需求。在传统社会里，人类的安全威胁主要来自于自然灾害、战争或人为伤害。但是，在网络社会特别是大数据时代里，人类安全的威胁远远越出了这一范围，其所面临的安全危机或安全风险要比传统社会里的风险大得多，危害程度要严重得多。因为大数据不仅仅意味着数据量的庞大，同时也意味着数据类型、数据敏感以及数据内容所牵涉的对象之庞大和重要，一旦数据被攻击或者窃取，就意味着死亡。诸如金融数据、医疗数据、国防数据以及政府情报都有可能在保密措施不完善的情况下产生安全问题。至于那些涉及国防安全、政治安全、网络安全、主权安全、文化安全等方面的信息数据如果安全防范措施不力或者留有数据漏洞很有可能被敌对分子、恐怖分子和分裂势力加以利用成为攻击的目标。而大数据在收集、传输、存储、管理、分析、使用、销毁等诸多环节上由于技术安全漏洞也在加剧数据泄露的风险。此外，大数据时代，人们往往只关注自己感兴趣的数据信息，往往忽视其它数据，那些被忽视的数据很容易被当作数据垃圾被丢弃或置之不理，而被抛弃的碎片化的数据绝大部分时间处于休眠状态，一旦被不法分子整理利用，积少成多，会形成新的大数据，成为他们窃取机密、盗取信息实施不法侵害的手段。从这个意义上讲，大数据本身是一个“金矿”，对于不同的挖掘对象而言会有不一样的价值，同时也会发生不一样的安全风险。正如加尔纳(Gartner)所言：“大数据安全是一场必要的斗争”[7]。放眼世界，中东北非“茉莉花革命”防不胜防，“维基解密”事件泄露美国军事外交机密震惊全球，斯诺登打开的“棱镜门”向全世界昭示着大数据的严酷挑战。可以断言，安全问题已经成为大数据技术应用的一大瓶颈，没有安全或者安全意识薄弱，大数据技术的风险将越来越高，问题越来越大，危机越来越难以把控。

三、大数据技术的风险防范

大数据技术应用的核心在于使用者对数据的管理。大数据技术有无风险全在于数据拥有者及其使用者的风险意识及行为动机的取向。如此推理，大数据技术风险防范的关键也全赖于技术背后操控者或行为者的道德意识、法律意识及价值意识和其手段。为此，面对大数据技术带来的身份盗用、隐私暴露、数字鸿沟、安全危机等社会风险问题，我们认为，除了增强大数据技术的技术管控和堵塞大漏洞外，更为重要的是要建立大数据技术的道德机制、法律制度和价值体系，这是有效应对和防范大数据技术风险的关键所在。

(一)建立数据诚信合约管理机制，防范数据盗用与隐私泄露

在大数据背景下，各级政府不仅是数据的生产者，也是数据的存储者、管理者和使用者，政府对于大数据的态度实际上体现着大数据背景下各社会群体的态度。面对大数据技术带来的诸多社会风险，事实上政府只是单纯地通过数据加密、秘钥分离以及使用过滤器等技术手段试图确保信息安全是极其困难的事情。因为在大数据时代，“道高一尺，魔高一丈”的技术性纰漏为盗用者提供了诸多机会。为了防止黑客对于加密技术的挑战，各级政府和企业除了进一步完善和提高秘钥技术外，建立数据诚信的合约管理机制显得尤为必要。诚信合约管理机制是社会主义市场经济发展的必然趋势，也是维护市场安全、规避市场风险的根本保证。诚信合约管理是建立在政府与市场、企业与用户、用户与用户间的征信体制，是确保市场规范运行的基本防线，它不仅需要利益主体间的合约管理，更需要利益主体间的诚信意识和诚信行为的确立。在大数据时代发生的身份盗用、隐私暴露、数字鸿沟、安全危机等社会风险问题多数情况下与市场运行中诚信机制的缺失有关。为了有效防范大数据时代的诸多社会风险问题，首要的是要建立健全诚信法律体系，为大数据技术的推广和应用保驾护航。大数据时代的诚信法律体系包括征信授权法律、诚信信息公开和查询法律、权益保护法律规范以及诚信奖惩法律规范等。其次，加强数据诚信合约管理力度，对于失信企业、失信人员要加强惩戒，不仅要予以舆论和道义的谴责，更需要法律和经济层面的制裁，要让其为盗用他人身份、暴露他人隐私等违法犯罪行为付出沉重的代价；对于那些长期恪守诚信合约的企业和个人要予以奖励性保障，要充分发挥诚信企业和诚信从业人员的信誉资本增值效应，在其生产、经营、银行信贷以及社会服务方面给予更多的便利和优惠。最后，要利用大数据技术的记录和评价优势“倒逼”从业人员和行业的诚信行为，对于违反诚信合约管理的集体或个体的行为要通过数据记录、媒体曝光使其体验失信带来的巨大危害，对于遵从合约管理的集体和个人通过数据评价、媒体展示使其体会到诚信合约的巨大荣耀，以此提升大数据时代的诚信意识，共同维护大数据技术的信息安全和数据安全。

(二)增强个人数据思维与理念，搭建共济价值平台

大数据技术所带来的重大变化是关于数据思维和数据理念的变化。大数据思维与理念作为一种全新的信息意识和生活理念，是基于互联网技术快速发展带来的海量数据，每个人、每一个组织都要适应大数据环境的变化，不断确立起互联网普及初期的“数字化生存”向大数据时代“数据化生存”的转变，这种生存方式的转变促使个体或组织在思维意识上发生大的变革，需要他们主动适应大数据时代的生活，弘扬数据理念，建立起用数据说话、用数据管理和决策、用数据理解和认识现代社会变革趋势的思维和理念，并将这一数据文化应用于个体生存、集体组织和国家治理的全过程，实现个体发展、组织管理和国家治理与大数据的有机结合。这一结合既是大数据技术应用于社会发展的必然趋势，也是个体、组织适应大数据时代的题中应有之意。这一思维和理念的转变不仅仅是政府和组织的事情，更是每一个现代人必须努力去承担的责任。如果个体缺失了对大数据技术的认知、思考和判断，拒绝或怀疑大数据时代的数据化生存，那么，个体不仅会在大数据时代缺失前进的机会和动力，而且也会使数字鸿沟越拉越大，使个体在信息赤贫中迷失方向。数字鸿沟的减少和消弭既需要个体数据思维与理念的确立以及数据素养的培育，更需要政府、企业等公共数据的开放以及共济数据价值平台的搭建。对于公众个体数据思维与数据素养的培育，一方面国家要加强大数据技术的舆论引导，唱响数据化生存的主旋律，通过网络、电视、广播、报纸以及标语等媒介普及大数据的知识和技术，从舆论上引导公众数据思维的确立；另一方面要加强各级各类学校教育、社区教育的数据教育内容，强化公众的数据意识；与此同时，在面向公众的社会管理和公共服务中，要逐步引导公众主动适应数据采集、用数据说话、用数据处理分析问题的工作和生活方式，在数据共享和协同中便捷自己的生活，审慎明示自己的数据身份和数据信息，以此确保自身的数据安全。对于政府和企业的公共数据开放及共济数据的平台搭建而言，数据的开放不仅有助于提升公民的知情权，促进数据的合理流动，提升政府或企业的服务质量，改善政府或企业的社会形象，而且也有助于把社会不同阶层的公众引入政府和企业决策中，有利于政府、企业决策和管理的民主化。此外，政府和企业要主动适应大数据时代这一变革形势，要不断创新理念和思路，运用数据决策和管理，发挥好自身门户网站的数据辐射功能、信息管理功能以及舆情风向功能，搭建一个亲民、惠民、利民、为民的数据共济价值平台。这对于改进政府和企业的形象，推进社会协同管理，消弭数据鸿沟带来的社会风险尤为重要和关键。

(三)依法维护数据安全，实现数据价值与行为的一致性

在大数据时代，数据采集有助于提高工作效率，便捷公众的办事流程，实现社会管理机制的创新；开放数据有助于提高公民的知情权，促进数据合理流动。但是，采集数据和开放数据同样也会带来新的安全隐忧，在数据采集、传输、存储、管理、分析、使用、销毁等任何一个环节上出现纰漏，都会造成严重的影响。加强大数据时代的数据管理，依法维护数据安全，实现数据价值与数据安全行为的一致性是大数据技术应用的必然选择，也是构建数据安全的应有之义。首先，要尽快贯彻和实施《网络安全法》，要在《刑法》中增设“倒卖盗用数据破坏网络安全秩序罪”，严厉打击信息网络违法犯罪行为，创建文明、有序、守法、健康的数据信息环境。其次，要加强网络行政执法力度，完善政府、企业信息监管机制，明确责任，采取技术措施、行业自律报告、信息安全报告制度以及监督检查制度，堵塞漏洞，防止、制止并查处数据和信息安全隐患，确保数据安全。再次，明确网络运营商、信息安全管理部门的法律责任，对违反相关网络安全规定的网络服务者、信息提供者借助大数据进行征信记录、媒体曝光和法律制裁。复次，充分利用大数据技术优势，开展普法教育，不断增强网络参与主体的信息安全意识和数据安全能力。最后，要推动信息网络安全国际合作，解决好国际社会对于信息网路安全法律的认知、标准及管辖权方面的问题，积极推动建立信息网络安全的国际法治体系，主动提高我国在国际信息安全领域的法制话语权，达成国际合作打击信息网络犯罪共识，斩断互联网空间的跨国信息网络犯罪链条，确保信息高速公路上的网络数据使用行为、数据价值在法律框架下沿着平等、公平、安全、健康、有序的轨道前进和体现。