存活五天的“退休小姐姐”识别程序
2019-06-19胡卜文
胡卜文
5月27日,一名身居德国的中国程序员“@将记忆深埋”(以下简称“深埋”)发布微博称,他和他的团队开发出了一个能够识别“从事不可描述行业的小姐姐”的程序。据称,他们通过从1024、91、sex8、PronHub、xvideos等色情网站上抓取照片或视频并进行数字画像,再与Facebook、Instagram、TikTok、抖音、微博等社交媒体上的数据进行交叉比对,已经成功在全球范围内识别出十万多“退休小姐姐”。
开发这一程序的想法始于去年。“鉴于很多人都在说程序员是各种小姐姐的接盘侠”,“为码农朋友们做一个初步过滤”。
“深埋”强调,为防止源数据的滥用和规避法律风险,这一程序“全程采用eID认证身份和只进行查询者人脸识别认证后查询本人信息”。在他看来,该程序的社会价值远远大于入侵特定人群隐私所带来的风险。
然而,根据欧盟2018年5月25日实施的《通用数据保护条例》(GDPR),个人数据的收集需要事先征得本人同意,且必须合法、透明、有特定目的地处理数据。《MIT科技评论》援引一位德国律师的说法,上述程序如收费使用,开发者可能面临长达三年的监禁。
因承受不了舆论压力,“深埋”最终在5月31日发布微博,声称自己已经执行该程序的数据删除命令。他将本次事件归咎于自己的低情商,“如果删掉去年那条微博,或如同一些网友说的那样换个说法,比如‘看看你有没有被渣男偷拍之类的(可能就不会引起这么大的争议)。”目前,他删除了有关这一程序的所有微博。
实际上,这并不是第一个被认为是监视和控制女性身体的程序。在此之前,就有人开发出了将AV演员和女明星换脸的deepfakes算法,还有人专门建立了性工作者的数据库。程序员群体成为“厌女症 ”的高发区,很大程度上是因为女性难以在计算机技术领域获得话语权,性别刻板印象和性别歧视在该领域长久存在。
2013年,在一次计算机行业女性年会上,Facebook首席运营官谢丽尔·桑德伯格首次公开提到女性在科技行业的困境以及性别差异越来越大这一事实,并且警告称科技行业女性人数正在下降。隨后,尽管支持女性参与计算机技术领域工作的项目不断涌现,改变科技行业性别不公平状况的进展仍然缓慢。
此事在全球网络社区引发关注和质疑。一些男性网民赞颂神奇的技术和“英雄”开发者,但更多人谴责这种由算法驱动的性别暴力和骚扰。对此,“深埋”反复辩称,其最初的意图是为了寻找那些滥交的女性,但在项目真正启动后,他意识到可以用这个程序来帮助那些被迷奸、诱奸并被拍下画面后发布到色情网站的受害女性,从而为她们要求色情网站删除信息提供可能。
谷歌2019年的多元化报告显示,其全球范围内的女性员工比例为33.2%,技术人员中女性占比为25.7%,相比2015年提升了3.6%。苹果发布的多元化报告则显示,从2014年到2018年,公司雇佣的女性员工占比从30%增加到33%,技术人员中女性占比从20%增加到23%。将范围缩小至中国,Codeforge发布的2015上半年中国程序员调查报告显示,女性程序员占比仅有不到20%。
近年来,人们惊讶地发现,AI“学会了”性别歧视:性别偏见在数据库里普遍存在,如果没有数据洞察和纠偏,它只会被人工智能进一步放大。
Amazon的一个团队自2014年开始一直在尝试使用人工智能审查求职者的简历,结果发现它对男性应聘者的评分更高。原来,AI深度学习的样本来自Amazon公司过去10年内收到的所有简历,其中原本男性申请者就偏多,最终录取者也以男性居多。这使得AI形成了男性应聘者比女性更优秀的认知。由于无法保证在性别、种族等方面做到公平,Amazon最终解散了这一团队。
“没有事实上的技术中立。对机器来说,中立的就是占统治地位的。”剑桥大学未来研究所教授鲁恩·奈如普(Rune Nyrup)如是说。