信息交流曝隐私 幕后原是大数据
2015-08-25
诗曰:
天下奇事数不清,无缘和尚不登门。
掐指欲算明日运,信息高速走一程。
如果有一天接到电话,你被告知正在生病的妈妈吃一种某某药可能会有效果。而电话里的人你根本不认识,但他关于你的信息全部正确,你会怎么想?
如果有一天,你正在宜家兴致勃勃地逛家具,然后手机收到一条微信:《逛宜家会导致情侣分手》,你还会接着逛下去吗?
如果有不认识的人对你说,你的体重超标,因为你的朋友圈中胖子太多啦。你会不会真的相信?
不管你相信不相信,但你一定会非常好奇:对方怎么会知道你在想什么,做什么?
有一种叫大数据的东西,正是左右这些事情的“看不见的手”。而生活中的每个人,正在被这只“看不见的手”控制。如果只知其果,不知其因,盲目相信,我们称它为新迷信。
不管你是不是相信,如果你周边交往的胖子更多,过不了多久,你的体重也会跟着发胖。
这是麻省理大学的科学怪人PENTLAND的结论。他是麻省理大学人类动力学实验室的主任。
这个头衔说明他至少不会无根据地乱说。
他的根据是,人类并不能完全理性地主宰自己的行为,无一例外地会受周围环境的影响。而这种影响是透过人与人之间广泛的交流与信息传播实现的。
而这些交流与传播中,每个人都会留下自己的信息与喜好。就比如吃面包,总会有一些面包屑无意中掉下来,它们记录着你吃过东西的痕迹。
这些无意中掉落下来的“面包屑”,记录着人们的行为方式,思考问题的方式以及潜意识。这些数据一旦被别人掌握,想了解你的家庭、你的身体状况和你的过去、你的未来,就真的是小菜一碟。
举个例子。如果你在朋友圈中转发大量养育孩子的文章,而且时不时地晒出你家孩子的照片,大数据就会分析出,你的孩子将来会长成一个什么样的人。
PENTLAND的实验室有一个宠大的家庭数据库,里面有对人们30个多个行为指标的分析与跟踪,而且每6分钟更新一次。换句话说,如果恰好在他的数据库中,你的一切行为都逃不过他的眼睛。
也许你会说,美国人离我那么远,我才不会进入他的数据库中呢。话一定不能这么说,你也许不会合法地进入美国人的跟踪系统,但谁也说不好会不会有人非法地把你纳入他的跟踪系统。还是那句话,吃过面包,就会留下面包屑。除非不接触所有的电子科技。
现在人们知道,电子科技这东西真的是一把双刃剑。过去,人们去和另外一个人商量事情,会走到他家直接找他,然后面对面把事情说清楚。即使隔墙有耳,也传播不了多大范围。现在,一个电话或者几条微信就解决问题。与此同时,你们两个人商量的事情已经不再是你们两个人之间的秘密,可能有无数个第三者同时知道。
而且,还有无数个第三者试图从你们两个商量的事情中得到新的信息,生出新的事情。
比如新的迷信。如果你不知道大数据的作为,你很可能会被一个能把你的所有家庭情况说中的人忽悠。
据说地球上专门有人在干这种行当——大数据下的算命先生。具体做法是:他在前面问你的姓名,后台就有人飞快地在电脑上搜寻有关你的一切,并通过声电等方式传给前台的“算命先生”。于是,你在不知不觉中,还真以为撞上了大仙,遇到了先知。
宜家家居是源自北欧瑞典的著名家具品牌,以其简约、时尚、大方的风格深受年轻人喜爱。世界上有许多即将结婚的年轻人愿意千里之外订购宜家家居,为的是亲手体验组装的快感和成就感。
但最近有一篇文章很是吓人。题目是《逛宜家必分手,看情侣们谁还敢去宜家约会?》。
这又是咋回事?
这背后还是大数据得出的结论。美国一本叫作《公民科学》的杂志报道说,有17%的情侣因为组装家具而产生摩擦和争吵。而恰巧宜家家居的特色就是,用户买回去的只是钉子的板材,所有家具都得自己组装。
美国加利福尼亚州一位临床心理医生Ramani Durvasula说,许多情侣向她倾诉说,买宜家家居时感受到的压力特别大,走到厨房区,会讨论谁来洗碗的问题,走到儿童区,又会讨论将来怎么照顾孩子的问题等等。等到组装家具时,又开始吵。
其实,宜家家居真的非常好用。这个来自瑞典的品牌已经得到了全球消费者的欢迎,它在全球26个国家都有分店,每年的财政贡献达到360亿美元。
一个家具公司,财政贡献能达到2400多亿人民币,这得有多了不起,如果被那篇《逛宜家家居必分手》的文章黑掉,还真是得不偿失。
所以,宜家家居北美市场的发言人在得知心理学家的研究数据后马上向人们解释说,建议情侣去宜家购买之前先就家具风格达成一致。意思是,你们决定买我们宜家的家具,就得准备好组装,别把分手的事情推到我们家居店身上。
其实,事情可真的没有那么糟糕。一旦人们的心理问题解决掉,就没有那么可怕。许多大数据下的迷信也并非不可破。
比如,在中国的宜家家居店,就有专门的作人员上门组装。如果喜欢自己动手,你可以将板材拉回家,按照图示体验组装家具的乐趣,如果用户天生就懒,或者没有时间组装,有专业人员收费为他做这一切。这样一来,再难组装的家具也不会引起情侣间的争吵与分手。
心理学家也同时配合宜家家居发布了另外一组大数据说,如果能够“相安无事”地完成宜家家具的组装,这会标志着情侣关系更健康。
一件坏事恰到好处地变成了好事。两组不同的数据,让人们把恐惧变成测试。以前说逛宜家会分手,现在成了组装宜家家具,关系更健康。
如果是你,逛还是不逛?
这件事再次说明,有恐惧便有迷信。解铃还需系铃人,大数据能制造迷信,大数据也能破除迷信。知道了迷信从哪里来,就能找到破除迷信的方法。
从这一点上来说,宜家家居真的聪明,他们巧妙借助大数据制造的迷信,进行了一次成功的营销。
所有的迷信都有一个特征,它强调一种不知所以的因与果。
换句话说,迷信是你只知道结果,并不明白原因,但你却坚信不疑。
大数据也会告知你结果,但只能告诉你A和B的相关性,也并不明白原因。
比如,前一段时间,谷歌的一款搜索具告诉人们,美国波士顿地区要爆发流感。果不其然,很快,这个地区,就因为流感,进入全区的公共卫生紧急状态。
这个具的作原理是这样的:当人们感到自己有流感症状时,就会自觉地上网搜索相关条目。只要用户输入了一些关键词,比如疼痛,打喷T,流鼻涕,等等,系统就开始展开分析跟踪,创建流感图表和流感地图。
《大数据时代》的作者舍恩伯格说,在大数据时代,人们只知道是什么就行,不必要知道为什么。
比如,吸烟有害健康这件事。对于吸烟是否真的致癌,有大量数据已经证明了相关性,没必要证明吸烟一定会致癌。
但有些人认为,如果没有充分的理由证明吸烟致癌,那就是一种迷信。
美国有一位名叫达莱尔·哈夫的自由撰稿人,专门写过一本书叫作《统计数字会撒谎》。 他在一次听证会上担任证人说,虽然吸烟与肺癌之间也许有关系,但两者并不存在已被证明了的、令人信服的因果关系。
达莱尔·哈夫还因此举了个例子:丹麦流传着一种说法,婴儿是鹳鸟送来的。因为丹麦人根据一家人房子上的鹳窝数量可以判定这家人能生几个孩子。事实是,大房子使鹳鸟和孩子有更大的生存空间,鹳鸟与孩子数量间也许有相关性,但很显然,孩子不是鹳鸟送来的。
意思是:房子大,鹳鸟的窝就多,孩子也可能就多(孩子少了没必要住大房子嘛)。但如果说孩子是鹳鸟送来的,就是迷信。
他的意思是,你知道吸烟的人有的得了癌症,就得出结论说吸烟一定致癌,那可以判定为一种迷信。
这位自由撰稿人说出了他对大数据的不满:人们从来没有放弃对于因果的追求。如果只知道果,而不知道因,这对于人类这种理性动物而言,显然远远不够。
但随着大数据应用的发展,人们普遍已经形成了一种共识:虽然大数据还不能提供具体的因果,但人们应该尊重相关性。比如吸烟致癌这件事,人们虽然还无法证明吸烟一定致癌,但在对于因果的研究中已经发现,不吸烟的人患肺癌的比例明显低于吸烟者。
再比如,许多商家普遍选择周二降价。在世界上许多大城市,周二的折扣要好于平时。难道周二降价就比平时好吗?
人们并不知道因果,但这是大数据根据人们的消费数据得出的结论,也就姑且信之吧。
当然,大数据时代的新迷信与真正的“迷信”完全不同。所谓“迷信”是完全不知晓原因地相信某件事。比如未曾谋面的人怎么就知道了你的一切。而大数据提供的果虽然不知确切的因,但却知道相关性是从哪里来的。
知道了相关性,就可以找到破局的方法。“破除迷信”也就成为可能。比如前面提到的宜家的巧妙公关。比如知道流感要来,提前准备防卫用药等等。
这正是:
是非因果知不易,大千世界多奇迹。
你言东来他言西,信人不如信自己。