初显身手的智能识别技术

2000-04-02邵旭

知识窗 2000年5期

邵　旭

在目前让人眼花缭乱的计算机外部设备的大家庭中，稳坐泰山几十载的键盘，在新世纪却面临着“退居二线”的危机。用智能识别技术武装起来的语音输人和手写输入系统正咄咄逼人，蚕食着键盘输入——近几十年来唯一的人机交互输入手段的领地。不只是语音输入和手写输入识别技术，触摸屏识别输入、商品条码识别、指纹识别等一系列信息识别新技术在近几年内也蓬勃地发展起来了。它们无外乎就是通过扫描仪或麦克风等这些传感器设备，把形、音等相关信息载体录入计算机，然后利用一种特殊的识别软件对其进行加工处理，从而提取其中蕴含的信息内容。而所有识别技术的进步，都得益于近年来人工智能理论的蓬勃发展。

让电脑变“聪明”的理论

人类几千年的文明史，是数学高度发展的历史。人们陆续建立了代数学、几何学、微积分、概率论等一系列经典数学学科体系。现代的信息处理学科，其核心往往就是利用先进的计算工具——计算机，去求解复杂的数学问题。一个数学家过去靠手工计算上亿年才能得出结果的数学计算问题，如今普通计算机可能在几秒钟之内就可以轻易地给出精确答案。然而，一个1岁左右的婴儿，可以轻而易举地通过外貌、声音甚至气味辨认出他的父母，如果让计算机来做这些，它可能要解一堆数学方程，进行一系列数学变换，相关工作量可能会是天文数字，而结果还可能是个笑话。可以说，在简单的识别和逻辑判断方面，恐怕依靠经典数学理论求解答案的计算机充其量只有半岁婴儿的智力。让计算机去拥有像人一样的思维甚至感情，目前看来，还是遥远的科学童话。

人的大脑有着传统计算机无法比拟的优势，是自然界长期进化的结晶，它由约150亿个神经细胞构成。每个神经细胞周围有1000多根像树枝一样的突起，能够同时接收感觉器官或其他神经细胞传来的信息。此外，神经细胞还有一根细长的突起，能够向周围发送信息，指挥相应器官的动作。大脑神经细胞之间密切联系，形成了密密麻麻的一张信息网，这种结构人们称之为神经网络。

科学家们发现，大脑神经网络结构对信息的处理，与计算机有着本质的不同：计算机工作主要靠中央处理器，它要处理的信息必须排队挨个进行，因而它的运算速度再快，处理信息的能力也是有限的；而人的神经网络由于细胞之间有着千丝万缕的联系，因而各种信息可以同时处理。更何况，不是任何求解的问题都可以归结为简单的数学模型，人脑在数学运算的同时，更多的是利用了其逻辑思维的优势。

于是，科学家们开始研究大脑的构成和思维方式，从而发现了新的算法并创造出了新的计算机体系结构。神经网络理论连同二战后兴起的模糊数学理论、分形分维等非线性科学，构成了人工智能理论的基础。也许用人工智能理论去模拟复杂的人的思维还为时尚早，但其实用成果已经在相对简单的识别技术领域得以淋漓尽致地发挥出来。

神奇的智能识别技术

语言是人通过发声器官表达相关信息的工具，它是由不同频率和高低的声调合成的。人们利用频谱特征可以实现不同发音的识别，语音识别技术因而拥有广泛的应用前景。最基本的应用是通过语音输入，将其与相应的文字内容一一对应，从而大大加快了输入速度，简化了输入方式。目前，出售的语音输入软件的功能大多就停留在这个阶段。尤其要解决好的问题是，不同人的发音差异很大，有些人还带有方言，这就需要电脑的识别算法要具备学习能力。俗话说：“一回生、两回熟”，开始听不懂的发音，通过几次训练，就应该记忆下来。没有“听”清楚的单字或词组，可以通过联想的方式，尽可能在误差最小的情况下进行猜测。这些都体现了人工智能理论在语音识别算法中的应用。

文字识别技术的关键是将包含在文字中的信息提取出来。英文只有26个字母，外加一些常用标点符号、数字和希腊字母，相对较易识别。而汉字是表形文字，结构复杂，识别起来比英文困难得多。目前的文字实用算法，对于规范的汉字印刷体有较高的识别率。手写汉字，由于个人书写风格、大小等特征的千差万别，识别率普遍不高。但是如果外加一支电子笔，人们用电子笔写字时，计算机软件就能够记录相应汉字的书写笔顺，这一重要特征的引入，对提高识别率帮助很大。这也是为什么目前汉字识别软件普遍支持手写联机输入的重要原因。同语音识别一样，相应软件还得配合使用学习、记忆、联想等智能算法。

当然，目前的语音和文字识别软件的功能还相当有限，它们还仅仅停留在键盘鼠标替代物的阶段，智能水平还比较低下。然而，随着人工智能理论的发展和对识别技术研究的深入，未来的识别软件的功能将今非昔比。那时的软件不仅要知道说了什么，写了什么，还要理解其内涵，明白自己该去做什么。比如人们对着计算机说：“请把我上个月写的那篇文章打印出来。”相应软件不仅可以理解其语义，遇到不明白之处，还可以通过语言的方式提出质疑，比如计算机主动会问：“请说明文件名称”。待彻底理解用户的指令之后，计算机便会自动调出相应的文档，启动打印机并将文件打印出来。

商品条码识别和指纹识别都可以看作是图形图像技术的识别典范。在超级市场购物时，收银员只需通过扫描商品条码，就能读出商品的名称、产地、价格等相关信息，目前已经得到广泛应用。指纹识别是一种行之有效的侦察手段，但仅靠人工的方法，绝对不能胜任在成千上万个指纹样本中发现目标的任务。应用人工智能技术，去精确地识别指纹特征，将拥有非常广阔的应用空间。据科学家的广泛调查发现，人的指纹特征千差万别，世界上60多亿人，即存在着60多亿种各不相同的指纹。而目前人的姓名、身份证编号以及随身携带的各种证件及证件上的照片，其本质和核心就是在不同场合能确定某一个体。其实，小小的指纹完全可以解决这些问题，它就像一个人的姓名，一个人终生区别于他人的唯一标志。或许不久的将来，一卡通也要让位于一“纹”通，如今风风火火的“金卡工程”也要被“指纹工程”所取代了。但这一切的前提，就是人工智能理论的发展为指纹识别技术提供足够高的识别率，足够小的误差率，否则，一切都是天方夜谭。

日渐成熟的智能识别技术

在21世纪，智能识别技术必将得到前所未有的大发展。但是，它必须依赖于人工智能理论和相关技术点点滴滴的进步，同时，人们必须谨慎地思考和解决智能识别技术对社会所带来的冲击及负面影响。

到目前为止，电子计算机已经经历了电子管、晶体管、集体电路、大规模集成电路四代的发展，人们早已预料到了下一代计算机将是智能计算机的天下。1982年，日本政府、产业界和学术界组成了专门的研究机构，并筹资100亿日元，计划用10年时间研究开发出智能计算机，美国和欧洲也不甘落后，先后在这一领域倾注了大量的心血。然而，1992年夏季，日本宣布，中止第五代电子计算机的研制计划。日本专家承认，虽然人们在人工智能方面已经取得了一定成果，但还远未成熟，在短短10年内完成这样高智能的系统是不可能的。到现在，又是10年过去了，人类在各领域，尤其是在信息领域已经又有了突飞猛进的发展，但智能计算机依然是可望而不可及。

此外，智能识别技术虽然还停留在相当原始的应用水平，但由此对人的劳动造成的排挤和冲击，却已经开始凸现出来。美国AT&T;公司1992年5月曾宣布将逐步采用电脑语音识别装置代替接线员电话接转和信息查询的工作，此决定立即在该公司1．8万接线员中引起了极大的恐慌，并遭到了通信工人的强烈反对。

如果说机器代替了人的体力劳动，可以将人从繁重的体力劳动中解脱出来，更多地进行脑力劳动的话，那么，功能日益完善、丰富的智能识别技术，则在一点点地排挤着办公室秘书、职员甚至是翻译这类传统脑力劳动者的就业空间。如果未来人工智能技术进一步得到发展的话，谁敢担保不会有许多人对这一类具有相当智能的机器感到恐惧，而把它当作对立物加以排斥呢?