“节制”大数据
2017-09-22丁爱波
丁爱波
大数据来源于现实。
人类的许多想法却并非如此,创造性的思维与想象往往是非理性的,“创意和想象,用大数据是‘算不出来的”,因《大数据时代》走红的牛津大学互联网研究院教授维克托·迈尔·舍恩伯格直言。
今天,人们用数据来记录这个世界,再通过研究数据去发现这个世界。但这个世界的生活、生意都需要创意和想象,大数据只能是一种参考。
全球新增的数据有95%是数字化信息,很容易被搜索查询、引用或转载,但是这其中有不少是无效信息,甚至是当事人不愿意记忆的信息。维克托指出:“随着廉价数字存储设备的普及,记忆成为数字时代的常态。但是互联网如果记住了我们想要忘记的东西,就很容易毁了我们的生活。”
大数据时代,人们的一举一动都会“被搜集”,再加以资料整合与加总。网络通过大数据的搜集,会拥有比你更好的记忆力和分析能力,可能比你更懂你。当一些互联网公司拥有了“读心术”般的营销能力之后,人们就感到害怕了。的确,数字技术赋予人们前所未有的权利,可它也会产生意想不到的可怕后果。英国社会学者保罗·杜吉德也认为,“无止境的积累,会让人们迷失在记忆细节之中”。
维克托在《删除:数字时代遗忘的美德》一书中指出:“数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。”
数据无处不在,但数据并不是全部。人类的真实内心、思想并不能通过大数据完全测算出来。或许,网络科学家可以测量出我们在76%的时间里与6名同事的社交互动情况,但是,他们不可能捕捉到我们隐藏在心底对那些一年或许也见不了一次的儿时玩伴的感情。
人类的思维、决策镶嵌在时间序列和背景之中。人们往往擅长讲述交织了多重原因和多重背景的故事。但数据是不懂得这些背景的,数据分析不懂得如何叙事,也不懂得思维的浮现过程。
数据能告诉你很多,但总归有些事情,无法通过冰冷的数据来预测。人们所眼见的大数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。从这个意义上讲,大数据也不能成为人们决策的精准标尺。真正的“黑天鹅”隐藏于无形之中,是很难被发现的。
著名商业思想家、《黑天鹅:如何应对不可知的未来》一书的作者纳西姆·塔勒布指出,随着我们掌握的数据越来越多,可以发现统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。
“这种欺骗性会随着数据的增多而呈指数级地增长。在这个庞大的‘干草垛里,我们要找的那根针被越埋越深。”纳西姆说。
因此,人们不但不能把大数据一股脑地当作宝库,反而要冷静审视数据的两面性。预知未来的高科技“水晶球”也有不为人知的一面,抛弃有害和无用的信息至关重要。
和任何一种伟大的工具一样,大数据有其拿手强项,也有不擅长的领域。要想用大数据,先知其短板。机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人員也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。
正如维克托的建议,人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。endprint