浅尝人工智能
2018-05-14商政淳
商政淳
摘 要:人工智能是继互联网革命之后的又一次人类文明重大进步,将极大的改变人们生活的各个方面,本文尝试对人工智能科学和技术做一个深入浅出全貌梳理,以加深对其本质的认识。
关键词:人工智能;数理逻辑;机器学习
一、引子
人工智能在科学上不是一个生疏的名词,由于近期阿尔法围棋机器人在与人类顶级职业棋手的对决赛事上,战绩斐然,从而再次唤起了公众对人工智能的高涨热情。不仅如此,考试答题、新闻写作、无人驾驶汽车、人脸识别等等,人工智能涉足众多领域,发展前景令人期待。人工智能究竟是什么?这是一个广阔且深邃的话题,这里尝试着做一个简明的阐述。概括地讲:人工智能的目标是实现计算机像人类一样思考和行动。
二、从计算谈起
人类一直梦想把自己的思维数学化,即实现思维过程可计算,这是早期人工智能萌芽。计算分为:“运算”和“推理”,人工智能借助于后者。从自然语言中提炼知识,主要包括概念和推理。当然不是所有的自然语言都能用来思考,选择能够判断非真即假的陈述句作为基本概念的描述,例如:“雪是白的”、“1+1=2”,叫做“命题”。大量陈述句可以被继续分解为两个部分,例如:“张三是学生”(主体身份)、“张三和李四是兄弟”(主体间关系),叫做“谓词”。最终用非、和、或等进行组合搭配,形成接近现实社会的复杂概念。
概念之间存在从前提到结论的因果关系,语言实践总结出三类推理关系。
(1)必要不充分:“地面潮湿(前提),下雨了(結论)”;
(2)充分不必要:“如果天不下雨(前提),我就去(结论)”;
(3)充分且必要:“触犯刑律,当依刑法论处(互为前提和结论)”。
提取充分不必要为推理形式,即前提为真,结论必为真。
在直观、不严谨、非形式化的基础上,完成重要升华——数学化,主要包括形式化和公理化。
所谓形式化就是用符号替代自然语言。例如: P替代陈述句; P(x)替代谓词,其中P代表属性和关系,x代表主体;┐、∧、∨替代非、和、或;→替代推理等等。所谓公理化就是从最少的几条公理出发,使用规则,进而得出所有结论。即用最少的符号、规则、公理、推理表达完整体系。至此就初步建立了一套数理逻辑的系统方法,模拟人脑的思考过程。
专家系统就是以数理逻辑为基础开发的早期人工智能典型产品,它只需给出初始和约束条件,根据规则,就可以由计算机自动演绎得出结果。这个阶段的人工智能非常初级,完全是以人的先验知识为化身,没有学习能力,理论上也存在重大缺陷,根据哥德尔不完全定理,存在既不能证明为真,也不能证明为假的命题。一句话,存在数理逻辑人工智能范畴无法求解的问题。
三、知识从哪里来
早期人工智能还存在一大问题,知识系统的开发需要领域专家和人工智能专家一同介入,这给大规模应用普及带来极大障碍,如何实现计算机自我学习——机器学习,成为下一代人工智能的迫切任务。
机器学习目标是研究知识的形成,参照人类经验:海量外部感知+人脑思考=知识,由此假想出机器学习技术组成是:输入训练数据+学习算法=输出知识模型,学习算法是核心。
人类存在两种主要学习方式:对已有知识的学习(监督、半监督学习)和自我学习(无监督学习)。
(一)监督学习
监督学习是有参照学习。例如:西瓜包括色泽、根蒂、敲声、重量、产地等一系列“特征”,每个特征又包括一系列“值”,如色泽:青绿、乌黑、浅白……;根蒂:卷缩、稍卷、硬挺……;敲声:浊响、沉闷、清脆……;产地:南方瓜、本地瓜、北方瓜……。每个西瓜都有一组数据,一堆西瓜构成一组输入训练数据。参照标准可以是简单的“好瓜”、“坏瓜”,也可以是复杂的“沙瓤瓜”、“水瓤瓜”……。依据参照标准进行分类(算法),当很多组训练数据反复训练之后,就得到一个选择西瓜的“模型”。
(二)无监督学习
无监督学习是无参照学习。例如:一堆西瓜,分别测量每个西瓜的指标,如“密度”、“含糖率”、…,反复对比西瓜之间的数据,最后将相似度高的放在一类。
(三)人工神经元网络
为了深度模拟人类思考,机器学习人工智能干脆直接移植了人脑神经元网络机制,也称“深度学习”。神经元由细胞体和细胞突组成,细胞突又分为树突和轴突,树突接收外来刺激(多个),轴突发出刺激(一个),无数神经元相互对接,连接成神经元网络。参照建立人工神经元网络模型:用突触(可赋权值的多路输入)替代树突;用替加法器代细胞体;用激活函数替代轴突。由于“模型”先定,训练数据是逆向传播(输出到输入),核心算法是“加权取合”,最后正向求解(输入到输出)。例如:选西瓜从神经元网络的输出端反向训练,每个西瓜都在多路输入上留下“权值”:青绿(色泽)、卷缩(根蒂)、浊响(敲声)……反复训练数据后得到具体问题的神经元网络。
四、实践出真知
神经元网络几乎涵盖了所有震撼应用!激发了对人类原始智能进化的空前兴趣,探索低级智能机制——行为人工智能,成为人工智能研究的又一大亮点。
遗传算法是行为人工智能的典型代表。与人工神经元网络一样,行为人工智能直接移植了自然生物进化机制。
自然生物进化的机理是:物竞天择。种群中优质个体有机会胜出是“物竞”,实际胜出则是“天择”。
参照建立人工遗传算法机制:确定初始种群;适应度计算替代物竞;选择、交叉和变异替代天择。
人工遗传算法的步骤是:计算出种群中所有个体接近未来目标的系数(适应度计算);用概率选出优秀个体(选择);个体间大概率成对交叉复制重组(交叉);个体内小概率突变(变异);在没有外界干预下反复迭代完成进化。
五、智慧之光伸向远方
数理逻辑、机器学习、行为智能是三个发展阶段,是从高、中、低三个层次模拟人类智能,也是一个整体。数理逻辑是自上而下的方法,把先验知识存储在“黑箱”中,不必知道黑箱内部构造。优点是:用接近人类自然语言的形式表达知识和推理。不足是:应用繁杂,无法普及,没有学习能力。
机器学习是自下而上的方法,设计“黑箱”内部结构,基于部分先验知识,自我训练。优点是:应用简洁,效率突出,具备学习能力。不足是:知识表达隐含晦涩。行为智能也是自下而上的方法,借鉴人类智慧历经漫长实践进化而来的事实,模拟身体的运作机制,物竞天择。优点是:擅长解决适应性、行为反应等问题。不足是:无法解决高级智能问题。
总之,人工智能无论在理论和实践上还都相当初级,只是借助计算机技术的鼎力相助,使原始的人工智能得以在应用中大放异彩,人工智能的未来充满坎坷,但无限美好。