我们应该担心愚蠢的大数据吗?
2018-08-19黄耀鹏
黄耀鹏
“数据是新石油。”多年前克莱夫·休比(Clive Humby)写下这句话,此后被不少媒体引用。自从“大数据”的概念诞生以来,更奉之为圭臬。就算一个中等城市,行驶在路上的十几万辆车,每分钟都产生数GB的数据,似乎我们正在守着金碗要饭吃。
自以为是的推送
说实话,数据的价值不应被怀疑,应该怀疑的是我们的变现能力。数据挖掘的第一个应用就是定向广告,IT公司迫不及待地使用并变卖它们,其历史可追溯到互联网普及的那一年。实际上如何,每个用户都熟知并都对这种笨拙的推送不以为然。
当你在搜索引擎或者购物网站上搜索过某件商品或者服务,那你要做好在此后不短的一段时间内接受类似商品持续推介的准备,也许6周,也许半年,直到它们被新的数据发现所取代。
问题是你早已下单或者已经转移兴趣,但电商似乎没有得到最新的数据。一种解释是,掌握你私人数据的公司,没有将数据整合为有用的行动。他们只是机械地贩卖,不动脑子。另外一种解释是,数据采集拥有某种神奇的AI,比你更了解你自己。如果你从未搜索过某种商品,也未跟朋友在社交媒体上谈论过,偏偏就有神秘的IP,孜孜不倦地向你推介它,可能是儿童英语课程,也可能是相隔半个地球的旅游景点,或者一个看上去又丑又贵的包包。
在大数据眼里,你可能就是那种审美层次堪忧又挥金如土的。不用担心,哪怕最粗陋的车联网搭建成功,你在车内收到的第一条信息,很可能一则推送广告。巨大的建设资金压力,导致用户成为迫不及待的变现对象。
隐私堪忧
这种情况下,你的隐私就像泳衣的变迁史,不断缩水,直到再也无法变小。
自动驾驶配备的收集车辆运行和周边情况数据的各种传感器,它们感知外部环境、路况,收集来自其他车辆和云的信息,以便根据信息预测并采取行动。
自然也能收集车内使用者的信息。假定L5级自动驾驶实现,在车内使用者不介入车辆驾驶的情况下,使用者状态与道路安全的关联不大。监测方更感兴趣的是车内信息,诸如监测使用者的健康状况、衣着、情绪以及服务需求。显然,服务商希望推送更精准的广告。
当你希望播放特定的音乐、寻找合适的饭馆的时候,你的需求偏好和个人信息都会记录在案,没人知道这些信息将被保留多久。很可能地,还有后台AI,自认为洞悉你的“潜在”需求,在你毫无意向的时候,推送莫名其妙的玩意。
自动驾驶将不可避免地收集使用人的个人信息、位置、行驶方向、历史路线、平均速度和里程数,这些与个人生活轨迹密切相关。根据海量数据,足以勾勒出一个人的完整生活。从纵向看,可能覆盖他/她的一生。
用户当然担心,他们的个人信息在他们不知情、不知用于何种目的或对用户自身带来什么后果的情况下就被收集和使用。我们有理由懷疑,一旦寄居在云端或其他什么地方的AI,搜集到你可资变卖的信息,它会蠢蠢欲动起来,向你推送不合时宜的信息,让你困惑乃至恼怒。
巧合的是,汽车制造商也因此对IT企业深怀戒惧。他们担心车辆数据被滥用,或者被竞争对手获悉。
立法的尝试
当技术已经展现出实力,隐私权有被践踏的可能时,监管机构已经发出警示,并制定了规则或者法律,避免隐私“过度”泄露。当然,底线就像比基尼——比你认为的更短,但还能更低更短。
美国法律做了一点尝试。去年,参议院讨论了《汽车安全与隐私法案》(简称“SPY”法案)。
大体而言,SPY法案针对信息搜集者制定一些限制,诸如提前告知信息收集范围;消费者有权选择或终止数据收集和存储,除非是为了事故、案件调查;经营者不得为营销目的收集车辆信息,除非用户同意。
同年,众议院也公布了《确保车辆演化的未来部署和研究安全法案》(“自动驾驶法案”)。其中包含了对数据隐私的保护和使用、加密方法。
两个法案都将保护消费者隐私作为汽车制造商应承担的责任。如此看来,立法者似乎认为汽车制造商而非电信公司是自动驾驶汽车收集数据的主体——未来的事实很可能并非如此。而这已经是全球领先的立法尝试。
车联网和自动驾驶大规模商业应用后,我们应该对自己的隐私抱有担心。它们不但会被滥用,而且还可能以唐突鲁莽的方式入侵。在自动驾驶和车联网场景下,对数据的收集和使用,监管方还拿不定主意,是否要更严厉一些。这才是需要真正担心之处。