我该相信谁?大数据说了算
2018-02-09瑞秋·博茨曼
瑞秋·博茨曼
若想请一个保姆,你会相信谁:直觉还是算法?
轻信陌生人会有危险,我第一次得到这方面的教训是在1983年。那时我刚刚5岁多,一个名叫多丽丝的陌生女子来到我家做保姆。她来自格拉斯哥,将近30岁,是我的母亲从一本名为《女士》的时尚杂志上找到的。
多丽丝穿着一身救世军军装来到我们家,还戴着军帽。“我记得她有很重的苏格兰口音,”母亲回忆说,“她说,她曾经照看过像你当时那么大的孩子,还喜欢帮助别人,所以加入了救世军。老实说,一见面我就很喜欢她。”
多丽丝在我们家待了10个月,绝大多数时间里,她都是个好保姆——开朗、可靠、乐于助人。除了有几个周末不知所踪外,她没有表现出任何异样。
当时,我们的邻居卢森堡夫妇请了一位保姆,她常与多丽丝腻在一起。一天晚上,卢森堡先生来到我家,说他发现他家的保姆和多丽丝在贩毒。“她们甚至参与持枪抢劫,”父亲后来讲述,“多丽丝是负责接应的司机。”而事发后我们得知,她用来接应的车子,是我们家那辆沃尔沃Estate轿车。
父母随即决定搜查多丽丝的房间。在其床下的一个鞋盒里,塞满了一沓沓外国货币钞票,都是从我父母的家庭办公室里偷来的。那天晚上,我父亲手持棒球棍守在家门口,以防多丽丝突然回来。谢天谢地,她没回来。
“哪怕再次说起这件事情,我都觉得后怕,”母亲说,“我们竟然把你交给一个罪犯照看,而且过了那么长时间才看清她的真面目。真希望一开始能对她多一些了解。”
我的父母算是比较聪明且理性的那种人。在当今这个用数字连接的世界中,他们是否会犯当年那样的错误呢?或许不会,因为不管是雇保姆、出租房屋或者叫出租车,正有越来越多的科技公司致力于帮我们决定该相信谁,不该相信谁。当今的科技让我们能更深入地了解自己是谁,那么,在判断“谁真的可信,谁是骗子”这方面,算法是否真的可以比人类表现得更好呢?
一个干冷的秋日上午,我来到位于硅谷北部的安静小城洛斯阿图斯,参观了Trooly公司装修简单的办公室。该公司CEO萨维·巴维迦很想向我展示他们的信用审查软件有多强大,“我要是用Trooly开发的软件来审查你,你猜猜会有什么结果出来?”他面带笑容地说道,语气中透着鼓励之意。
我脸一红,努力回想自己曾经做过的所有糟糕事或尴尬事:(能查出我)收到的大量超速及违停罚单,长时间浏览的那些怪异网站(当然是出于研究目的),还是那些老照片?
想到这里,我尴尬地笑了笑。巴维迦说:“别担心,我们可以把审查过程投影到大屏幕上,这样你就能实时观看了。”可这话并没让我感到些许轻松。
安尼什·达斯·萨尔玛是Trooly的首席技术官,谷歌公司的前高级研究员。他把我的姓名输入到名为InstantTrust的程序中,接着输入我的邮件地址,就完事了。不需要出生日期,也不需要电话号码、职业或住址。
“Trooly的机器学习软件目前可以挖掘3个公共的和获得许可的数据源,”巴维迦解释说,“首先是像出生证、结婚证、洗钱监察名单以及性犯罪者登记簿等公共记录,全球范围内任何公共的、数字化的登记簿都可以为我们所用。”其次是对深网的挖掘,“它仍然是互联网,只不过是隐藏的网络,其页面没有被常规的搜索引擎编入索引。”是谁在用深网呢?“反社会人群、恋童癖、枪支买卖者……总之,活跃在深网的是形形色色诡异的人。”
最后的数据来源是社交媒体,比如脸书和Instagram。官方医疗记录是禁区,但如果你在推特上发消息说,“我刚做完了一个可怕的背部手术”,它就会被归类为法律许可的数据且可被使用。
巴维迦和他的团队花了9个月时间来评估哪些数据可以使用,哪些不可以使用。未成年人的数据就不可以使用。他说:“在有些国家,法律明确规定了‘私人信息和‘敏感私人信息之间的区别——后者包括医疗记录、种族、信仰、工会会员身份等。我们在使用数据时,会止步于后一类信息,并十分清楚越界的可怕后果。”
大约过了30秒钟,我的审查结果出现在大屏幕上。“瞧,你是其中之一!”巴维迦说。个人资料从1到5分为5个等级,其中1级最值得信赖。“仅有大约15%的人位列1级,他们是我们的‘超级好人群。”
这番话让我感到轻松,并油然生出一股自豪感。那么又有多少“超级坏”的人呢?巴维迦给出了答案:“在Trooly覆盖的国家中,包括英国和美国,大约有1%—2%的人口位列4级和5级。”
巴维迦曾是贝恩咨询公司(Bain & Company)的合伙人。他最长久的客户之一是某“知名在线市场”,这使得他开始考虑信用在数字世界中的重要性。“我们的这家客户需要使用他们全部预算中的6%——也就是数亿美元——来应对其市场上发生的意外情况。这让我开始思考,现有的星级评分体系根本不足以防止大量在线欺诈事件。”
当时,巴维迦的妻子在经营一家小型牙科诊所,时而会有顾客拒绝支付费用或威脅给差评,周末时甚至还有人打来电话说要买毒品。“这让我突然意识到,比起大公司来,小公司对他们的客户了解得更少。如果有办法能帮他们剔除潜在的不良客户,那岂不是很酷?”
为了得出我的信用分数,Trooly的软件在不到30秒钟内,爬取了8000多个网站的30多亿个网页。数据被合并成3大块,最基本的是验证我的身份,看看“我是不是我”,这通过扫描完成,比如说将我的个人网站与读大学时的信息比对一下,看看是否一致。接下来是筛查非法、危险或欺诈活动。但最令人着迷的是第三部分,在这部分,我被按照“黑暗三合一”进行评估。所谓“黑暗三合一”,即3种助骗子老手大行其道的无情人格特征——自恋(过度渴望受到关注的自我中心主义)、精神病(缺乏同情心或懊悔感)以及马基雅维利主义(一种不受道德支配的,极度想控制他人的天性)。遗憾的是,巴维迦无法单独给出这部分的分数,但好在我通过了这部分的评估。
两年前,Trooly为这款能“确定一个人的可信度与亲和度”的软件申请了美国专利。软件的算法也融入了上世纪80年代研究人员广泛采纳的五大人格特征——开放性、自觉性、外向性、随和性以及情绪稳定性。
“通过从某个人的在线浏览记录中挖掘的数百个特点,Trooly开发了复杂的模型来预测这些人格特征,”巴维迦说,“这些浏览记录可能帮助我们预测出某人是否神经质或粗鲁无礼。如果你查看某人的推特账户,要是发现上面充斥着可疑的、可能影射出其负面人格特征的信息和骂人的话,这个人很有可能具有反社会倾向。”
这让我想起了自己18岁那年跟父亲之间的一场激烈争论。我在eBay上面看中了一辆颜值颇高的二手标致车,父亲却说,卖家网名叫“隐身的巫师”,这让人不敢信任他。就这样,我们最后还是从当地一家汽车经销商那里买了车。
那些日子,即便谨慎如我父亲,也开始沉迷于eBay。在这个社会中,随着我们越来越多地通过科技与他人进行亲密互动——通常是完全不认识的人,或者是晒我们的住宅和汽车,或者是在网上寻找伴侣或保姆,但当第一次接触某个人时,你怎样才能知道他们是否会对你构成威胁?他们是否真如自己所说的那样?或者,跟你对话的是否是人类?
这些都是诸如UrbanSitter等公司需要回答的问题。这家美国网站将家庭与保姆联系在一起,已有逾35万名家长和30多万名保姆在网站上注册。和许多在线服务一样,他们都必须通过脸书或领英加入。正如43岁的公司创始人琳恩·帕金斯所说,其结果就是,正当你打算预订时,你可以看到多少“好友”之前也预订过这位保姆,或者与这位保姆有何种关联。
在UrbanSitter的网站上,保姆和家长需要列出详细的个人资料。人们愿意公开的资料数量及类型多得让人吃惊,帕金斯回忆说:“有一对父母长篇大论地描述了他们的大肚皮宠物猪,想以此来确保保姆对他们的宠物有好感。这事尽管听上去怪怪的,却是预期管理的一种很好的体现。”
审查保姆是否可靠的最后一道防线,则由Trooly或与其是竞争关系的其他信用评级服务公司负责,比如Checkr。审查的内容包括:该保姆是否真的有南泰晤士学院的保育文凭,是否曾在网上使用不当语言,是否为登记在册的性犯罪者等等。
在这个平台上开启注册的保姆当中,只有25%的人注册成功,剩下的75%要么注册被拒,要么中途放弃注册,因为他们不愿按照平台的要求乖乖接受审查。
在这个华丽的新世界中,糟糕的事情依然不时发生。但是像帕金斯这样的创业者绝对不会告诉你,在其平台上发生过的不良事故、轻微事故或严重事故的准确数量。她只会说:“这类事情确实会发生,但非常少。”
今年6月,民宿租赁网站爱彼迎收购了Trooly,具体交易金额不详。此举是爱彼迎为解决信用危机采取的举措之一,该公司还在2015年聘请前中情局办公室副主任尼克·夏皮罗担任公司的全球信用及风险管理总监。“在一个正常运转的社会中,获得并保持信用将永远是核心部分,”夏皮罗说,“改变的只是信用的交换地点与方式。以往只要建立对大公司、媒体或政府等大型机构的信任即可,如今则不同,人与人之间的信任正变得越来越重要。”
夏皮罗的职责之一就是为爱彼迎制定出危机应对措施。就拿戴维·卡特的事例来说,2014年3月的某个周末,他预订了纽约的一套豪华公寓,还对房東阿里·特曼说,他是在为哥哥嫂子找住处,他们准备在城里举行婚礼。然而事实上,卡特口中所谓的“嫂子”是他的一群客人,他们在特曼的公寓里举行以肥妞和毛绒玩具为特色的派对,纵情狂欢。直到特曼返回公寓取自己的行李时,才发现里面竟然在举行限制级社交晚会。
卡特有经过验证的爱彼迎账户,得到的也多是好评。夏皮罗说:“我们有责任审视过去,看看之前是否应该采取另一种方法来解决某些问题,是否犯下了错误。”换句话说就是,怎样才能将卡特这种人彻底剔除掉?
“其实很容易就能看出这类糟心事会发生,”巴维迦说,“你根本不需要深入研究卡特这个人的精神状态,来判断他到底是不是一个性派对的专业组织者。”在谷歌上随便搜一搜他的电子邮件地址,你就会发现一堆跟色情有关的在线广告,如“偷女生内衣行动”“肥妞内衣劫掠派对”等,有人甚至将住址发布在推特上,以换取参加“色情狂欢盛宴”的资格。
“即使想一想,就足够让人面红耳赤了。”巴维迦说。
我跟巴维迦说了多丽丝的事情。如果多丽丝申请注册UrbanSitter的话,系统能不能把她揪出来呢?会的!那样我的父母就会知道她其实并没有加入救世军,也没有照顾小孩子的经验,却有一连串斑驳的犯罪记录。这些,多丽丝都掩饰不掉。
这么说来,我们是否应该接受这些新的信用算法吗?巴维迦和夏皮罗都认为,在尝试采取伦理决策并将其转化为代码的同时,责任也会随之而来。我们究竟愿意将多少个人数据交给算法进行测试?让算法来判断谁值得信赖,我们对此是否感到心安?
在接受Trooly的软件测试时,我发现自己十分担心一些小错误或很久以前的过失会被当众呈现,此类公司是否会注意到这些呢?
“没有人喜欢被评判,不管是被机器还是被别人,但对一个人做出评判并非我们开发筛查程序的目的,”夏皮罗强调,“我们的目的是发现严重的风险,如仇恨团体的成员,有暴力犯罪记录或虚假身份的人。我们一点也不关心你是否在推特上发过愚蠢的内容,还是曾因违章停车被贴罚单。”
然而这些事情可能会对雇主产生影响。正有越来越多的招聘者使用数字足迹和机器学习来过滤求职者。诸如Belong、Talview以及SocialIndex等招聘工具,正在提供能够收集和分析在线数据进而判断求职者是否适合公司文化的产品。
还有其他问题。比如我的丈夫,从来没有使用过推特、脸书以及领英,他的“少量信息”是否会降低其可信度呢?
“有那么10%—15%的人,我们给不出确信的分数,”巴维迦坦承,“这部分人要么缺乏足够的线上浏览数据,要么没有足够的准确信息。”
在像爱彼迎这样的网站上,“看不见”并非必然对你不利。“我们寻找的是贬损信息,缺乏信息并不会对你产生不良影响。”夏皮罗说。
在这个我们点几下手机就能找个人来解决煤气泄漏,或者开车送你回家,或者约会的世界中,线上信用值势必将变得更快捷、智能及普及。比如说,起初在交友软件Tinder上寻找约会对象时,人们会感到一丝不安,甚至觉得有些危险,但这种交友理念很快变得稀松平常。
科技能否彻底消除我们与陌生人打交道的风险?
绝对不可能!UrbanSitter的帕金斯说道。人类是复杂的道德生物,评判一个人时彻底将第一印象摒除是愚不可及之事。“如果一个保姆站在你面前,你感到不放心,那么不管她是否通过了审查,不管她收到的评价有多高,也不管在网络上你对她有何印象,你都会听从直觉,不雇佣这个保姆。”
[译自英国《卫报》]