“码”不停蹄

2021-01-12李波整理

发明与创新 2021年3期

◆李波整理

“验证码不匹配，请重新输入。”这是一句令很多人十分苦恼的话。文字、算术题、字母、图片……花样百出的验证码虽然给我们带来了诸多不便，但是它维护了网络安全，甚至有时候，我们填写验证码是在为人类文明和技术进步作贡献。

提到验证码，有的同学可能会问：“短信验证码和图片、字母、文字等类型的验证码有什么不同？”其实，它们虽然都叫作验证码，但有很大差别。

当我们点击获取短信验证码后，网站或App 后台会生成验证码内容，将它和我们的手机号等数据发给短信服务商和运营商，最后以短信形式发至手机。短信验证码不仅可以作为用户的身份凭证，还能够保证账户安全，防止恶意注册。而包含图片、字母、文字等的验证码系统更复杂。

网络安全卫士

在验证码系统出现之前，还没有微信、QQ 等社交软件，人们都用电子邮件沟通。当时，一个问题深深困扰着大家：黑客开发出一种程序，能够批量注册账号，并用这些账号进行违规操作。想象一下，如果网站上满是垃圾评论和广告，支付宝密码被轻松破解，成千上万的垃圾账号操纵网络投票……那多么令人抓狂！更崩溃的是，就连互联网公司也无法分辨注册账号的到底是人还是机器。

解决这一问题的计算机天才名叫路易斯·冯·安，来自危地马拉。2000 年，年仅21 岁的他提出了一个革命性解决方案：在注册账号的过程中设置一个判定环节，让用户识别一串扭曲、重叠、不完整的字母或者数字，然后输入。这项工作在人类看来相当简单，但对那时候的机器来说，根本无法完成。这个系统叫作全自动区分计算机和人类的公开图灵测试（Completely Automated Public Turing test to tell Computers and Humans Apart），简称CAPTCHA，就是我们现在常用的验证码。

验证码背后的贡献

阻止黑客恶意注册账号的问题暂时得到解决，但又产生了一个新问题：填写验证码太耗费时间。假设一天中每人只需花10 秒填写验证码，2000 年全球互联网用户约4 亿人，所有用户每天要耗费的时间加起来约127 年，路易斯·冯·安心想：能不能把这些时间利用起来呢？

路易斯·冯·安把目光投向了需要被电子化的纸质图书。如果让人工录入这些图书需要耗费很大精力，而电子扫描又很难保证质量，为了解决这一问题，他重新设计了验证码系统，并将其命名为reCAPTCHA。这套系统分为两个部分：第一部分和之前的相似，是自动生成的内容，用来判定被测试者是否为人类；第二部分是机器无法识别的文本。如果第一部分输入正确，reCAPTCHA 就会假设第二部分同样能输入正确，通过验证，然后把录入结果返回给主机。为了确保不出错，主机会把第二部分内容发给多个用户进行交叉验证。2007 年，reCAPTCHA 系统成功数字化了《纽约时报》20 年的报纸。

随着技术进一步发展，验证码系统也参与到人工智能的优化当中。谷歌公司把用户识别的图片变成标注好的数据，用来优化人工智能算法模型，如标注车辆边框的验证码是为了训练智能摄像头的识别能力。这些数据越准确，数量越多，模型效果就越好。