APP下载

数据、算法都有“两面性”

2022-11-18

大众科学 2022年9期
关键词:两面性直觉球员

过去10年间,学者们挖掘了史无前例的庞大数据。依靠这些数据,人类过去在生活、商业、学术等各方面的诸多难题被一一解决。相比于数据对人类社会的解释和判断,人类直觉已经显得不再那么“可靠”。数据和算法正在取代直觉,成为人类赖以生存的重要工具。

近日,经济学家、数据科学家塞思·斯蒂芬斯·达维多维茨所著的新书《不要相信你的直觉》正式出版。

作者在书中表示,过去10年间,学者们挖掘了史无前例的庞大数据。依靠这些数据,人类过去在生活、商业、学术等各方面的诸多难题被一一解决。

在此基础上,作者更是进一步指出,相比于数据对人类社会的解释和判断,人类直觉已经显得不再那么“可靠”。数据和算法正在取代直觉,成为人类赖以生存的重要工具。

AI既能做“球探”也能当“红娘”

达维多维茨在其新书中表示,虽然我们总是自认为知道如何使自己做出最优选择,但近年来的事实证明,数据在这件事上能够做得更好,甚至纠正了我们过去一些错误的直觉。

作者在书中引用了一部经典体育电影《点球成金》中的故事。电影主人公在组建棒球队的过程中通过建立数学模型,采用量化分析的方法,发现球员的上垒率指标与比赛胜负之间存在某种关联,即上垒率越高,比赛获胜的可能性越大。该指标在过去一直不被专业球探所重视,但主人公选择相信数据的判断,于是他以此为根据,寻找他认为合适的球员。也正是因为这一指标在过去不为专业球探所重视,所以该指标表现优秀的球员往往身价低廉,主人公也因此以远低于市场平均值的成本成功建队,并且带领这支球队一举夺得冠军。

这个由真实事件改编的故事揭示了数据在挖掘运动员潜在价值方面的巨大作用,数据已变成选材的重要工具。2021年,英格兰超级联赛球队伯恩利为了更好地辅助球探筛选并挖掘有天赋的年轻球员,决定与AI人才识别平台进行合作——运用AI技术在全球公开招募14岁以上的潜力球员。球员们只需要把自己的足球训练视频或者比赛视频上传到平台,平台便会自动分析球员特征,生成360度的球员展示图,详细列出球员在技术、认知和心理能力等方面的数据,供球探参考。通过这种方式,球队能够以极低的成本在全世界挖掘优秀球员,并且更有可能发现那些被传统挑选方法所埋没的人才。

当然远不止于体育,数据的作用早已渗透我们的日常生活。尤其是在那些过去曾被认为不可能被准确量化的领域。根据日本《读卖新闻》报道,2021年初,为了应对少子化趋势,提升结婚率。日本政府推进一项AI婚介项目,应用人工智能筛选婚配对象。参与者需要提供自身与婚恋有关的各项数据,包括年龄、学历和收入条件等。随后人工智能系统会对数据进行深入分析,然后在所有报名者中为人们筛选匹配出“可能对你抱有好感的人”。即使有时不符合双方提出的条件,系统也会给出相应推荐。

2019年该系统在日本埼玉县试运行时,在所有通过政府婚介服务成功结婚的38对情侣中,有21对是通过AI推荐系统成功配对结婚的,超过了总数的一半。可见数据和算法有时或许比红娘更懂人类姻缘。

数据、算法都给力,决策才能更正确

如今,AI已经开始进入我们的生活,科学家也会利用AI从事科研活动。AI会利用大量的数据,再通过一定的算法,验证过去学者们依靠观察、访谈等传统社会科学方法所得到的有关人类社会的认识理论,但有时也会给出一些令人“大跌眼镜”的观点,貌似违反了过去我们对于人类社会的认知常识。

在相关专家看来,如果通过数据、算法得出的结果违反直觉或者常识,这不仅是常见的,而且是应该的。“直觉、常识本身就不一定是正确的,如果靠数据、算法得出的结论全都是符合直觉、常识的,那么这个数据、算法还有什么价值呢?大数据很大的一个优点就是帮助我们寻找出一些靠人类直觉无法得到的结论。”

但随着数据的种类、数量越来越多,人们不禁要问,是否所有数据都有价值?专家认为,如果想要依靠数据和算法对人类社会进行理解、解释,乃至帮助人们进行抉择,数据就必须具备一定条件。首先是数据规模要足够大,即使无法做到全样本数据,也应尽量实现数据来源的随机性,选择的数据要有代表性;其次则是数据质量应尽量可靠,数据的准确性和完整性要有所保证;此外,如果有统一的数据接口标准,算法的复杂性也能够大大降低。

如果上述要求能够得到满足,那么当我们利用AI进行决策时,将更有可能得到更加准确的结果。但相关专家也强调,人类社会高度复杂,并且时刻都在变化。相对固定的算法很难做到长久有效。同时,也认为以互联网上运行的推荐算法为例,可能几小时就会迭代一次。算法的不断更新、修正,也是保证大数据应用能够取得可靠结果的重要因素。

还需认清数据、算法的两面性

信息获取方式的变化毫无疑问是近年来数据和算法给大众带来的最大改变之一。因此,也不断有批评者对信息推荐算法导致“信息茧房”效应加剧的问题进行批判。有研究表明,“信息茧房”是算法和受众认知偏好共同作用下的结果,两者缺一不可。

专家认为,算法归根结底是受人控制的,算法的规则是人制定的。人完全可以写出一个“走向另外一个极端”的算法,让大家的选择多样化,远离“信息茧房”,但是这种算法不符合商业利益,所以没有人去做。

所以,人与大数据、算法之间不存在固有矛盾。大数据的应用是为了提高人类某些行为的效率,是为人类服务的,总体上是需要拥抱的。同时,如果大数据被别有用心的人利用,当然也会产生负面效果。数据和算法就像菜刀,它既可以是工具,也可能会成为凶器。但我们不能因噎废食,就因为它可能会成为凶器就再也不生产菜刀了。

那么,我们应如何合理、恰当地应用大数据,使其更好地为人类服务?专家认为,应努力推动数据共享,使数据成为储存在个人设备里的私有财产,而非互联网平台的财产,并在有偿的前提下实现数据共享;此外,则是要避免数据被别有用心的人用于不利于社会发展的用途,比如大数据杀熟、大数据售假等,而这则需要有关部门提高监管水平,营造一个良好的互联网环境。

猜你喜欢

两面性直觉球员
林文月 “人生是一场直觉”
你的直觉靠谱么?
课堂的“生命”在于“活动”
从赤壁之战看《三国演义》中周瑜的双重形象
论太宰治《奔跑吧,梅勒斯》中人性的两面性
昆虫料理,你敢吃吗?