浅尝人工智能

2018-05-14商政淳

科技风 2018年2期

商政淳

摘要：人工智能是继互联网革命之后的又一次人类文明重大进步，将极大的改变人们生活的各个方面，本文尝试对人工智能科学和技术做一个深入浅出全貌梳理，以加深对其本质的认识。

关键词：人工智能；数理逻辑；机器学习

一、引子

人工智能在科学上不是一个生疏的名词，由于近期阿尔法围棋机器人在与人类顶级职业棋手的对决赛事上，战绩斐然，从而再次唤起了公众对人工智能的高涨热情。不仅如此，考试答题、新闻写作、无人驾驶汽车、人脸识别等等，人工智能涉足众多领域，发展前景令人期待。人工智能究竟是什么？这是一个广阔且深邃的话题，这里尝试着做一个简明的阐述。概括地讲：人工智能的目标是实现计算机像人类一样思考和行动。

二、从计算谈起

人类一直梦想把自己的思维数学化，即实现思维过程可计算，这是早期人工智能萌芽。计算分为：“运算”和“推理”，人工智能借助于后者。从自然语言中提炼知识，主要包括概念和推理。当然不是所有的自然语言都能用来思考，选择能够判断非真即假的陈述句作为基本概念的描述，例如：“雪是白的”、“1+1=2”，叫做“命题”。大量陈述句可以被继续分解为两个部分，例如：“张三是学生”（主体身份）、“张三和李四是兄弟”（主体间关系），叫做“谓词”。最终用非、和、或等进行组合搭配，形成接近现实社会的复杂概念。

概念之间存在从前提到结论的因果关系，语言实践总结出三类推理关系。

（1）必要不充分：“地面潮湿（前提），下雨了（結论）”；

（2）充分不必要：“如果天不下雨（前提），我就去（结论）”；

（3）充分且必要：“触犯刑律，当依刑法论处（互为前提和结论）”。

提取充分不必要为推理形式，即前提为真，结论必为真。

在直观、不严谨、非形式化的基础上，完成重要升华——数学化，主要包括形式化和公理化。

所谓形式化就是用符号替代自然语言。例如： P替代陈述句； P（x）替代谓词，其中P代表属性和关系，x代表主体；┐、∧、∨替代非、和、或；→替代推理等等。所谓公理化就是从最少的几条公理出发，使用规则，进而得出所有结论。即用最少的符号、规则、公理、推理表达完整体系。至此就初步建立了一套数理逻辑的系统方法，模拟人脑的思考过程。

专家系统就是以数理逻辑为基础开发的早期人工智能典型产品，它只需给出初始和约束条件，根据规则，就可以由计算机自动演绎得出结果。这个阶段的人工智能非常初级，完全是以人的先验知识为化身，没有学习能力，理论上也存在重大缺陷，根据哥德尔不完全定理，存在既不能证明为真，也不能证明为假的命题。一句话，存在数理逻辑人工智能范畴无法求解的问题。

三、知识从哪里来

早期人工智能还存在一大问题，知识系统的开发需要领域专家和人工智能专家一同介入，这给大规模应用普及带来极大障碍，如何实现计算机自我学习——机器学习，成为下一代人工智能的迫切任务。

机器学习目标是研究知识的形成，参照人类经验：海量外部感知+人脑思考=知识，由此假想出机器学习技术组成是：输入训练数据+学习算法=输出知识模型，学习算法是核心。

人类存在两种主要学习方式：对已有知识的学习（监督、半监督学习）和自我学习（无监督学习）。

（一）监督学习

监督学习是有参照学习。例如：西瓜包括色泽、根蒂、敲声、重量、产地等一系列“特征”，每个特征又包括一系列“值”，如色泽：青绿、乌黑、浅白……；根蒂：卷缩、稍卷、硬挺……；敲声：浊响、沉闷、清脆……；产地：南方瓜、本地瓜、北方瓜……。每个西瓜都有一组数据，一堆西瓜构成一组输入训练数据。参照标准可以是简单的“好瓜”、“坏瓜”，也可以是复杂的“沙瓤瓜”、“水瓤瓜”……。依据参照标准进行分类（算法），当很多组训练数据反复训练之后，就得到一个选择西瓜的“模型”。

（二）无监督学习

无监督学习是无参照学习。例如：一堆西瓜，分别测量每个西瓜的指标，如“密度”、“含糖率”、…，反复对比西瓜之间的数据，最后将相似度高的放在一类。

（三）人工神经元网络

为了深度模拟人类思考，机器学习人工智能干脆直接移植了人脑神经元网络机制，也称“深度学习”。神经元由细胞体和细胞突组成，细胞突又分为树突和轴突，树突接收外来刺激（多个），轴突发出刺激（一个），无数神经元相互对接，连接成神经元网络。参照建立人工神经元网络模型：用突触（可赋权值的多路输入）替代树突；用替加法器代细胞体；用激活函数替代轴突。由于“模型”先定，训练数据是逆向传播（输出到输入），核心算法是“加权取合”，最后正向求解（输入到输出）。例如：选西瓜从神经元网络的输出端反向训练，每个西瓜都在多路输入上留下“权值”：青绿（色泽）、卷缩（根蒂）、浊响（敲声）……反复训练数据后得到具体问题的神经元网络。

四、实践出真知

神经元网络几乎涵盖了所有震撼应用！激发了对人类原始智能进化的空前兴趣，探索低级智能机制——行为人工智能，成为人工智能研究的又一大亮点。

遗传算法是行为人工智能的典型代表。与人工神经元网络一样，行为人工智能直接移植了自然生物进化机制。

自然生物进化的机理是：物竞天择。种群中优质个体有机会胜出是“物竞”，实际胜出则是“天择”。

参照建立人工遗传算法机制：确定初始种群；适应度计算替代物竞；选择、交叉和变异替代天择。

人工遗传算法的步骤是：计算出种群中所有个体接近未来目标的系数（适应度计算）；用概率选出优秀个体（选择）；个体间大概率成对交叉复制重组（交叉）；个体内小概率突变（变异）；在没有外界干预下反复迭代完成进化。

五、智慧之光伸向远方

数理逻辑、机器学习、行为智能是三个发展阶段，是从高、中、低三个层次模拟人类智能，也是一个整体。数理逻辑是自上而下的方法，把先验知识存储在“黑箱”中，不必知道黑箱内部构造。优点是：用接近人类自然语言的形式表达知识和推理。不足是：应用繁杂，无法普及，没有学习能力。

机器学习是自下而上的方法，设计“黑箱”内部结构，基于部分先验知识，自我训练。优点是：应用简洁，效率突出，具备学习能力。不足是：知识表达隐含晦涩。行为智能也是自下而上的方法，借鉴人类智慧历经漫长实践进化而来的事实，模拟身体的运作机制，物竞天择。优点是：擅长解决适应性、行为反应等问题。不足是：无法解决高级智能问题。

总之，人工智能无论在理论和实践上还都相当初级，只是借助计算机技术的鼎力相助，使原始的人工智能得以在应用中大放异彩，人工智能的未来充满坎坷，但无限美好。