大数据预测的伦理困境与出路*
2014-11-14蒋洁陈芳何亮亮
蒋洁陈芳何亮亮
(1.南京信息工程大学公共管理学院 江苏南京 210044)
(2.南京信息工程大学滨江学院 江苏南京 210044)
·前沿与热点·
大数据预测的伦理困境与出路*
蒋洁陈芳何亮亮
(1.南京信息工程大学公共管理学院 江苏南京 210044)
(2.南京信息工程大学滨江学院 江苏南京 210044)
立足海量信息资源与尖端分析技术的大数据预测模型在有效指导商业决策、优化资源分配、降低管理成本并提升教育科研水平的同时,存在结果预判挑战自由、隐私披露挑战尊严、信息垄断挑战公平、固化标签挑战正义等伦理背反问题。亟待通过健全以尊重原则、橡皮原则、无害原则、可持续发展原则等为核心的后现代数据伦理体系,有效表达各方自由意志并平衡利益冲突、顺利传承良善伦理观念、实现大数据生态系统的良性循环、推动人类生存价值与自然永续发展的和谐共进。
大数据预测伦理困境出路
1 引言
立足体量巨大、类型繁多的数据载体与云计算、感知方案和分布式处理技术的大数据预测“导致生产力、技术实力及社交结构的全新突破”。大数据风电预测助力风光储示范基地效益最大化并优化电网性能;腾讯云信鸽通过有效预测流失用户与潜在付费用户为开发者提供最优运营方案;全球最大的在线影片租赁提供商Netflix基于对海量收视选择与主题搜索的精准分析捧火《纸牌屋》;百度赛事预测将数万场比赛与国内外博彩数据融入巴西世界杯预测模型,再现章鱼保罗的神话;默克集团通过对550万疫苗生产数据的150亿次计算,探寻出能够大幅减少废物量的最佳发酵条件;奥巴马竞选团队依靠大数据评级系统开展的智能募捐、舆情监测与定向广告等赢得大选。
渗透各行各业核心领域的大数据预测正在开启重大的时代转型,在迅速变革商业模式、推进生态永续、低成本实现个性化教学并促成科学研究从假设推动到数据推动的全新转变的同时,严重威胁自由、尊严、公平、正义等人本固有的终极价值属性。亟待构建以尊重原则、橡皮原则、无害原则、可持续发展原则等为核心的伦理风险规避体系,积极破除隐私披露、信息垄断、标签固化等大数据负面效应的催发因素。
2大数据预测的伦理困境
21世纪以来,爆炸性增长的“未来新石油”逐渐俘虏人类社会。海量相关关系的过度分析大面积披露数据隐私,掌控核心资源的预测方肆意侵害数据对象的知情权与收益权;数据主导决策模式的无差别适用逐渐磨灭创造力、限制自由发展,全面破坏终极尊严、平等自由、公平正义等最基本的伦理衡标。
2.1 结果预判挑战自由
通过海量交叉验证征兆与变化规律发掘事件概率的大数据预测依托多维度、多来源、多形式的巨量元数据且挖掘工具与分析技术的深度、广度与精度前所未见,包括赛事、股市、用户行为、环境变迁、疫病疫情等在内的各类较为精准的预判(例如,“遥远未来系统”最多可以预测个人80周内可能到达的位置,准确度高达80%),引发整个社会对智慧生活的极力推崇。随着居民生活、商业贸易、政治活动等领域的数据主导决策模式日益成熟,我们正在进入一个“只需要知道是什么,而不需要知道为什么”的时代。隔壁邻居根据谷歌流感预测与百度旅游预测等选择度假去处、老牌球队依靠数据模型选择球员、政坛强人借助舆情预测调整竞选方案等等。
结果预判的极致扩张消减社会主体自由探索的勇气,剥夺个人自由发展、企业自主创新与政府自行决断的机会。首先,基于巨量基因与环境变量数据的职业选择服务已初具雏形,预测精准度的提升将使《千均一发》中数据决定新生儿成长道路、职业安排、婚姻家庭等的“理想国”降落人间,意味着否定人的一切努力与独立思考能力,彻底剥夺自由选择权。其次,商业组织过于依赖结果预判市场趋势、投资抉择并组织生产营销等将严重挤压突破性创新的生存空间。“斤斤计较成本不可能有发明”,高效创新源于持续试错与灵光乍现。X光、微波炉等具有探索性与开拓性的偶发事物是经济繁荣、技术进步、历史发展的契机。巨量数据结果预判促使大量企业放弃高风险的试错创新,整个社会全力追逐大概率反向提高预测精准度,最终完全击垮自主运营模式。再次,随着国际互动与利益交换全面数据化,结果预判日渐披露各国政府出于国家安全与秩序稳定等利益考量而隐瞒的特定决策理由和过程。例如,预测方对日本军国主义演变轨迹、中国军力增减趋势及欧美海外军事干预等的量化分析逐渐成为国际政治格局的重要影响因素。
2.2 隐私披露挑战尊严
“没有隐私的地方就没有尊严”,匿名是尊严拾得的重要保障。隐名人流或筛检艾滋病、不具名投诉或举报、戴头套提押嫌疑人和不公开审理等均是寻求维护生命和人格尊严与保障公共安全和社会秩序之间重要平衡点的有益举措。通过匿名注册、搜索与社交最大程度地实现个人意志自由表达是互联网络的核心吸引力与主要发展力。大数据预测系统使巨量结构化与非结构化数据中分离识别真实资料与意图,逐步达到“只要有合理的商业动机推动数据挖掘过程,任何形式的隐私都是‘算法上不可能’”。广大用户陷入以隐私披露为代价获取便利的个性化服务之尴尬境地,尊严受损现象层出不穷。例如,通过分析搜索记录发送定向广告的百度公司在发掘朱女士搜索“减肥”、“丰胸”、“人工流产”等词汇后,不断向该台电脑投放相关广告,“被示众”严重损害朱女士的人格尊严。又如,安客诚通过预测3000种不同行为及心理倾向,披露数据权人的性别、年龄、性取向、收入与婚姻状况等,减损互联网络作为观点自由市场、社会公共良心与创造力之源的重要价值。
2.3 信息垄断挑战公平
“泄密的通常不是关键性的保密数据而是普通的日常信息。”大数据预测通过整合海量碎片化信息资源之间的多元关联,完成数据对象的全景洞察,精准提升目标用户的活跃度并在流失前有效预警,全面颠覆传统商业模式和运营规则。越来越多的企业认识到基于巨量数据分析的营销波动预测对于掌握客户消费需求、开辟蓝海市场的重要价值。大量缺乏宏观把握市场状况必须之巨量元数据与高精分析技术的传统企业为了在信息时代的残酷竞争中取得优势地位,依托储流服务商或数据掮客的分析预测改善产品服务和运营模式。实时自动收集的企业搜索数据反为系统注入更多信息资源,进一步提高预测精准度。海量数据“已经变成生产原材料,是巨大的经济与社会价值的新来源”。随着预测市场持续集约化与预测方掌控能力不断增强,垄断海量高价值元数据的互联网巨头们借口安全保障与隐私考量独占使用(如“脸书”内部科学家利用独家掌握的100多PB个人数据发表数十篇研究论文)并悄然完成从免费到收费、从廉价到昂贵的华丽转身(如百度公司宣布下半年预测工具将全面进入商业化运营),破坏有序竞争的业内环境。
虽然大数据预测引领人类无限接近控制未来的终极梦想,采集与分析过程却不可能彻底消除人为推断与解释数据造成的隐性偏差。由于资源与技术实力处于劣势的社会主体难以察觉预测方篡改数据内容的不法行为,一些追求利润最大化的企业通过假造分析与预测结果控制市场活动、舆论导向与政治格局等,打破整个社会的平衡状态。
同时,预测方不仅未告知数据权人信息挖掘的真实情况,还利用避风港原则与格式合同附加条款等规避通知义务、安保义务与收益分享义务等。大量偏远乡村与贫困人口的信息化程度远不及城镇地区与富裕群体,大数据预测在经济发达地区与人群的迅速普及导致地区性与阶层性信息垄断,剥夺弱势群体的平等竞争机会。例如,具有一定电脑知识与上网经验的应届考生可以享受百度高考预测中从作文预判到填报志愿指导的较为精准的全程预测服务,某些欠发达地区的贫困考生却难以具备同等条件。
2.4 固化标签挑战正义
海量数据储流实现了信息资源的永久保留。例如,“脸书”服务器的1200多个PDF文件中存储着普通用户Max Schrems的海量个人数据(无论用户是否删除)。大数据预测通过对包括数据权人删除或遗忘的信息在内的巨量数据的上百万次假设验证控制错误率,揭示员工离职倾向、客户消费能力与死亡期、社会主体违法犯罪的可能性等,严重违反文明社会“所有人一律平等”的基本伦理要求并剥夺寻找新的生存与发展机会的基本权益。例如,掌握了离职倾向预测数据的雇主往往给予指数较高员工歧视性待遇。又如,保险公司基于客户消费数据预测死亡期判定是否接受投保。再如,不少执法机构依托犯罪趋势预测布署警力并对犯罪概率较高的社会主体实施监控,严重侵害个人自由生活的基本权益。数据暴政之下甚至出现“数据钓鱼”执法。例如,荷兰警方通过分析TomTom导航仪记录的道路速度数据,在那些最可能创收的地方设置限速陷阱,严重背离正义执法。
3大数据预测的伦理原则体系
广泛应用大数据引擎与不断增加预测精准度等助力大数据产业跨越技术进步与商业变革的临界点,成为信息社会高效益与高风险的矛盾载体。发达的传感器网络与海量数据计算能力使其能够精确捕捉动态变量数据,在满足时效性、准确性与实用性的同时,引发“一切新形成的关系等不到固定下来就陈旧了……一切神圣的东西都被亵渎了”的伦理忧思,亟待健全以尊重原则、橡皮原则、无害原则、可持续发展原则等为核心的后现代数据伦理体系,有效表达各方自由意志并平衡利益冲突、顺利传承良善伦理观念、实现大数据生态系统的良性循环、推动人类生存价值与自然永续发展的和谐共进。
3.1 尊重原则
在33个比特数据就足以辨识个人身份的零隐私时代,“才买了新车就有人来推销保险;刚去医院作完孕检,返家途中就接到了孕婴产品销售商的问候电话”,尊重人格尊严的核心是一丝不苟地执行匿名规则。虽然匿名具有放大人性弱点与扰乱社会秩序的弊端(如熟人匿名社交软件“秘密”),却是实现个人意志自由表达的关键环节。数据权人应当享有不受外力干扰、按照自身意愿决定是否分享以及如何分享敏感数据的基本权利。预测方必须建立隐私预警系统,在海量数据关联分析触及揭示个人真实资料的敏感信息时,自动向数据权人发送通知并立即停止挖掘,直至获得对方明示同意。
虽然目的限制与数据缩小等优质数据原则削弱大数据预测的经济效益,但对于自由选择权的尊重是文明社会长期存续的必要条件。整个预测流程应当确保数据权人自愿进退,不仅享有自主参与数据生活的权利,亦享有随时转移或清除敏感数据的权利。
大数据预测领域互相尊重的重要表征还包括预测方应当按时足额向数据对象交付数据收益。例如,基于人群收入、资产水平、搜索记录等的商业开发预测系统提供方必须将合理比例的销售所得妥善支付给数据对象。
3.2 橡皮原则
大数据技术的快速发展大幅降低数字化存储成本并实现数字记忆的全球化无障碍访问,人类社会自此迈进永久记忆的新纪元。大数据预测通过交叉访问海量匿名数据库的零散数据,再识别大量个人信息(如诚信等级、婚姻家庭状况、工作轨迹等),在一定程度上剥夺了社会主体重新出发的机会。任何人应当享有在既定条件下“擦除过往”的权利,必须有效贯彻数据权人能够随时彻底移除敏感数据并限制相关分析结果无序披露的橡皮原则。
3.3 无害原则
“超出传统的获取、存储、管理与分析数据集成”的大数据预测从海量元数据中提炼未知的有用信息,改变了零散分离数据的收集模式,加剧预测方与数据权人的不平等,使得权利人无从知晓敏感数据保留与使用的具体状况。一些看似普惠的金融、科教、社交的预测活动将预测方的企图潜移默化地强加于广大参与者(例如,基于投资者与股票间互动的“策略指数”隐性传递预测方的投资辅助信息;又如,通过微热点与热门标签等展现热门事件的发展脉络和走向,影响后期讨论和互动),违反平等与公允等必要的伦理要求,拉低整个社会的幸福指数。预测方的技术实力与资源掌控远胜其他参与者,应当承担不得直接或间接侵害数据权人生命安全、自由需求与隐私利益等基本责任,有必要以通俗易懂的方式向权利人通报预测目的、方法、过程、风险及收益,并切实提高数据权人的管控能力、监督和举报第三方违法行为等。
3.4 可持续发展原则
在大数据预测领域坚持可持续发展原则的核心要求是正确界定用户需求决定生产的范围与幅度。例如,某些正效应领域(如有利于防治疾病的流感传播路径预测与早产儿感染预测、有利于避免死亡的沙井盖爆炸预测、有利于节省燃料的UPS物流车队行车路径预测)从受众洞察、定位、接触到转化的全过程均依赖海量数据预测引导有助于避免不必要损失、提高运行效率、实现经济利益最大化。另一些需要保持自主创造力的领域却不可过度依赖大数据预测。例如,影视剧本撰写、选角、影院排片等完全由预测结果调控将辗毁文艺发展道路。
大数据预测的可持续发展需要数据采集、存储、流转、分析等各环节的多方参与者自觉避免话语权不平等导致的弱势偏见和不公平待遇。例如,服务商应当通过不断完善身份验证、增加追踪障碍并拓展密钥技术等建立有效阻止未经授权之再识别的安全屏障,确保大数据预测的透明化、客观化与有序化。又如,公权机关既不得为了节约涉法费用加入侵害数据权益的采挖行列,亦必须切实履行惩治违规与激励维权等多元责任。再如,其他参与主体在巨量数据运作过程中不得侵害他人权益。
大数据预测伦理原则体系的完善还应当在行业自律的绩效测量与评价体系中增加相应伦理指标并健全激励机制,通过相关伦理规约培训向参与者清晰传达各项原则并提高其自觉遵循的能力,同时设置履行监督职责的伦理调查专员并建立匿名检举制度以避免不当行为进一步蔓延。
4 结语
“这是一个最好的时代”,大数据预测的飞速发展带来全新经济增长点,加速技术文明发展进程,数据规模、流转活性及分析状况等逐渐成为衡量一国综合国力的重要指标。“这是一个最坏的时代”,大数据预测的盲目拓展限制个人意志的自由表达、阻碍企业自主创新与政府自行决断。亟待通过完善尊重原则、橡皮原则、无害原则、可持续发展原则等规避伦理风险,平衡各参与方的利益关系,健康有序地提升人类发展指数。
[1]Jordan Robertson.The Health-CareIndustry Turns to Big Data[EB/OL].[2014-08-25].http://www.businesswee k.com/printer/articles/26016-the-health-care-industryturns-to-big-data.
[2]周晓梦.当风电遇到大数据[N].科学导报.2014-05-30.
[3]深挖大数据腾讯云信鸽首个实现用户预测[EB/OL].[2014-08-25].http://news.zol.com.cn/468/4682618.html.
[4]《纸牌屋》的大数据力量:巫术一般的精准营销[N].21世纪经济报道.2013-06-24(A3).
[5]准确率高达81.8%百度世界杯预测广受彩民追捧[EB/ OL].[2014-08-25].http://sports.sohu.com/20140616/ n400912312.shtml.
[6]大数据正在改变每一个行业所有行业都正在享受收集和分析数据带来的优势[EB/OL].[2014-08-25].http:// www.36dsj.com/archives/9737.
[7]奥巴马连任背后:政界大数据时代即将到来[EB/OL].[2014-08-25].http://tech.qq.com/a/20121108/000182.htm.
[8]Chris Anderson.The End of Theory:The Data Deluge Makes the Scientific Method Obsolete[EB/OL].[2014-08 -25].http://www.wired.com/science/discoveries/magazine/ 16-07/pb_theory.
[9]大数据“入侵”我们还有秘密吗?[EB/OL].[2014-08-25].http://news.xinhuanet.com/info/2013-05/16/c_13238 4331.htm.
[10]维克托·迈尔·舍恩伯格,肯尼思·库克耶.盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012:20.
[11]曹斯,张胜波.“六冠院士”卓以和解密“贝尔模式”——斤斤计较成本不可能有发明[N].南方日报.2010-07-28.
[12]王芳.“没有隐私的地方就没有尊严”澳门解读[N].法制日报.2009-04-17.
[13]郭晓炜.大数据下的隐私安全[J].中国经济和信息化,2013,(24).
[14]南京一网民告网站引出话题“精准营销”怎能侵犯隐私[EB/OL].[2014-08-25].http://js.xhby.net/system/ 2014/03/18/020547091.shtml.
[15]蒋娅娅.谷歌新广告遭用户抗议:大数据和个人隐私的“战争”打响了[N].解放日报,2013-10-28(W10).
[16]央视曝苹果搜集用户位置信息90%用户不知情[EB/ OL].[2014-08-25].http://tech.
sina.com.cn/t/apple/2014-07-11/13119488633.shtm l.
[17]Omer Tene,Jules Polonetsky.Privacy in the Age of Big Data:A Time for Big Decisions[EB/OL].[2014-08-25].http://www.stanfordlawreview.org/online/privacy-pa radox/big-data.
[18]24岁用户向Facebook申请个人数据收到1200个PDF文件[EB/OL].[2014-08-25].http://www.cnbeta. com/articles/165595.htm.
[19]Tom被曝道歉后继续向警方出售用户超速数据[EB/ OL].[2014-08-25].http://www.cs.com.cn/hw/02/20110 5/t20110509_2872404.html.
[20]马克思恩格斯.共产党宣言第1章.
[21]杭春燕.大数据时代如何抹去“数据脚印”:新消法个人隐私保护规定亟待落到实处[N].新华日报,2014-04-07(A03).
[22]James Manyika,Michael Chui,Brad Brown.Big Data:The Next Frontier for Innovation,Competition,and Productivity[EB/OL].[2014-08-25].http://www.mckinsey.com/insights/business_technology/big_data_the_ next_frontier_for_innovation.
[23]Charles Dickens.A Tale of Two Cities:A Story of the French Revolution[M].EBook#98,2009:1.http://www. gutenberg.org/files/98/98-h/98-h.htm#link2H_4_0001.
Ethical Dilemmas and Solutions of Big Data Prediction
Based on mass data and sophisticated technique,big data prediction can effectively guide business decisionmaking,optim ize resource allocation,reduce adm inistrative costs,and enhance education and scientific research levels.W e focus on issues of violating ethical standards,such as results prediction infringing freedom,privacy disclosure infringing dignity,information monopoly infringing fairness,and stereotypes infringing justice,etc.The article proposes specific initiatives of constructing the system of ethical principles,such as respect,rubber,harm lessness,and sustainable development,which w ill express each free will,balance conflict of interest,inherit kind ethical opinions,realize the virtuous cycle of big data ecosystem,and promote harmonious development of human survival value and natural age-long development.
big data prediction;ethical dilemmas;solutions
G203
:A
:1003-6938(2014)05-0061-04
蒋洁(1979-),女,南京信息工程大学公共管理学院副教授;陈芳(1973-),女,南京信息工程大学公共管理学院副教授;何亮亮(1980-),男,南京信息工程大学滨江学院副教授。
*本文系江苏省“青蓝工程”资助项目、江苏省法学会自选课题“大数据挖掘的侵权风险及对策研究”(项目编号:SFH2014D19)与江苏省社科联江苏省社科研究课题“云环境中数据隐私侵权问题研究”(项目编号:13SQB-072)研究成果之一。
2014-09-01;责任编辑:刘全根