“码”不停蹄
2021-01-12李波整理
◆李波 整理
“验证码不匹配,请重新输入。”这是一句令很多人十分苦恼的话。文字、算术题、字母、图片……花样百出的验证码虽然给我们带来了诸多不便,但是它维护了网络安全,甚至有时候,我们填写验证码是在为人类文明和技术进步作贡献。
提到验证码,有的同学可能会问:“短信验证码和图片、字母、文字等类型的验证码有什么不同?”其实,它们虽然都叫作验证码,但有很大差别。
当我们点击获取短信验证码后,网站或App 后台会生成验证码内容,将它和我们的手机号等数据发给短信服务商和运营商,最后以短信形式发至手机。短信验证码不仅可以作为用户的身份凭证,还能够保证账户安全,防止恶意注册。而包含图片、字母、文字等的验证码系统更复杂。
网络安全卫士
在验证码系统出现之前,还没有微信、QQ 等社交软件,人们都用电子邮件沟通。当时,一个问题深深困扰着大家:黑客开发出一种程序,能够批量注册账号,并用这些账号进行违规操作。想象一下,如果网站上满是垃圾评论和广告,支付宝密码被轻松破解,成千上万的垃圾账号操纵网络投票……那多么令人抓狂!更崩溃的是,就连互联网公司也无法分辨注册账号的到底是人还是机器。
解决这一问题的计算机天才名叫路易斯·冯·安,来自危地马拉。2000 年,年仅21 岁的他提出了一个革命性解决方案:在注册账号的过程中设置一个判定环节,让用户识别一串扭曲、重叠、不完整的字母或者数字,然后输入。这项工作在人类看来相当简单,但对那时候的机器来说,根本无法完成。这个系统叫作全自动区分计算机和人类的公开图灵测试(Completely Automated Public Turing test to tell Computers and Humans Apart),简称CAPTCHA,就是我们现在常用的验证码。
验证码背后的贡献
阻止黑客恶意注册账号的问题暂时得到解决,但又产生了一个新问题:填写验证码太耗费时间。假设一天中每人只需花10 秒填写验证码,2000 年全球互联网用户约4 亿人,所有用户每天要耗费的时间加起来约127 年,路易斯·冯·安心想:能不能把这些时间利用起来呢?
路易斯·冯·安把目光投向了需要被电子化的纸质图书。如果让人工录入这些图书需要耗费很大精力,而电子扫描又很难保证质量,为了解决这一问题,他重新设计了验证码系统,并将其命名为reCAPTCHA。这套系统分为两个部分:第一部分和之前的相似,是自动生成的内容,用来判定被测试者是否为人类;第二部分是机器无法识别的文本。如果第一部分输入正确,reCAPTCHA 就会假设第二部分同样能输入正确,通过验证,然后把录入结果返回给主机。为了确保不出错,主机会把第二部分内容发给多个用户进行交叉验证。2007 年,reCAPTCHA 系统成功数字化了《纽约时报》20 年的报纸。
随着技术进一步发展,验证码系统也参与到人工智能的优化当中。谷歌公司把用户识别的图片变成标注好的数据,用来优化人工智能算法模型,如标注车辆边框的验证码是为了训练智能摄像头的识别能力。这些数据越准确,数量越多,模型效果就越好。
图片验证码
不断升级的验证码系统
在验证码进阶之路上,黑客也想出了各种办法对付验证码,比如聘用工人填写验证码、使用人工智能破解。在与黑客斗智斗勇的过程中,验证码系统也不断升级更新。
2009 年,谷歌收购了reCAPTCHA系统。5 年之后,谷歌推出了一种不需要验证码的验证方法:让用户点击“I'm not a robot”的按钮。这种验证方法看起来简单,但是背后离不开强大的人工智能。它会监测用户的操作习惯如移动鼠标的速度和轨迹、反应时间等,收集大量信息,以此来进行判断。
了解验证码背后的故事后,我们在填写验证码时,是不是心情没那么糟糕了?验证码的发明离不开人类非凡的创造力。也许以后会出现更厉害的破解验证码的方法,但人类一定能想到方法来应对,将网络秩序拉回正轨!