基于机器视觉的智能人机交互技术分析
2019-04-25万昌武汉科技大学
万昌 武汉科技大学
引言
机器视觉技术已经在各领域得到了广泛应用,并在不断进行技术开发的过程中,展现出了优势性的功能。但在当前的技术条件下,大多数的可视化程序,都作为固定的工序内容发挥作用。而本文提出的技术条件,则呈现出更加明显的动态性特征,在接收与感知信息内容的同时,使机器视觉的功能近似率人工的视觉效果,人机交互式的动态工作。
1 机器视觉模块
1.1 设计思路
视觉识别系统中,对物体的分辨是最为核心的内容。对机器视觉的优化目标,就是利用科技条件,完成机器对人类识别能力的模仿。在内容上,需要对相关的硬件系统、计算方法、知识体系等内容进行完善,在保证图像处理技术的同时,加强对已知特征条件的识别能力。
对机器视觉系统的设计,应将技术发展分为图像的处理与识别两个阶段。处在图像处理阶段时,需集中整理采集的数据信息,在剔除噪音、环境等干扰调价的同时,进行区域图像的分割处理[1]。而在进行图像识别阶段时,应将重点放在尺寸、形状等关键的内容上,通过取值范围的确定,过滤出图像中的非关键信息条件,然后再对相应的模板进行匹配,完成目标对应管理。
1.2 实践案例
Alpha Go系统,是智能化人际围棋对弈的典型案例。在一次执白对弈比赛的过程中,系统通过采集黑子的位置信息,摄像器材采集的图像进行整理,校正拍照角度中的畸变,并对周围的环境条件与边框进行剪裁。当完成整理后,并将图像进行二值化处理,通过黑白色亮度对比的内容,完成伽马值的调整,使图像的显影更加清晰。然后再利用0/1的二值化位置图,形成完整的坐标系统。在转换格式与阈值的基础上,带入围棋运算核心的19×19直方图分析,通过直角坐标系的确认,定位并捕捉自己白棋的棋盘定位。
2 人工智能模块
人工智能技术是当前学术研究与应用实践的重点的方向,受到高速率硬件处理技术影响,在整合大量企业与科研研究成果内的基础上,此项技术已经可以在较低的成本条件下,达到提升应用条件的效果。
延续上一部分中的围棋应用案例,在智能AI技术的开发中,针对围棋的对弈规则,技术人员研发出了Alpha Go系统的核心运算内容。将完全博弈与MCTS算法作为基础,形成了三层神经网络环境下的运算系统,在对预测策略网络、判断策略网络、价值网络的整合中,使用量化评估与加权计算的方法得到最优化的计算结构,满足运算与对弈的基本需要。而在运算模型中,整合形成的运算系统中,会使用APV-MCTS系统对棋局的每条边线,从决策收益——Q(s,a)、访问次数——N(s,a)、先验概率——P(s,a),这三个状态进行阈值选择,并最终得到公式:
以此达到执行系统计算的效果,保证人机对弈的进行。
而在人工智能系统中,还需组建其完整的硬件平台,通过对CPU的特性设计,增加其中的浮点运算能力,保证对层次的神经网络计算内容。以此,使人工智能系统在在计算优势的保证下,不断进行深入的内容学习,对海量运算数据进行整合,提高技术条件下的运算结果利用率[2]。通过在围棋人机对弈过程中积累的样本,完成记录数据积累,使人工智能系统的围棋水平,赶上甚至是超越人类棋手。
3 机器智能模块
在完成感知与运算的内容后,就需要相应的机器设备,完成智能人机交互的最终步骤。自从1961年美国的Unimate公司推出第一台商用机器人以来,在此项领域持续半个世纪的发展中,机器人技术已经得到了广泛且全面的应用,并在进行工业化生产的过程中积累了丰富的技能内容,从基础的焊接、搬运等技术内容中,逐渐演化出了多种类型的高级能力。而在与感知、分析系统的配合下,可以更加全面的提升数据信息的应用条件,通过动态化的信息处理,自主的完成预定工作内容。在进行机器人人机对弈设计的过程中,可以将这一动作内容作为执行整体功能的终端,完成对弈程序的功能需要。
3.1 机器人选择
为了更加精确的完成技术处理,首先要对机器的应用条件与技术内容进行分析,以此确定执行过程中应用机器人的具体类型。在内容上,应从以下四个方面展开分析,最终确定机器人的型号与工作方式。其一,需对控制模式进行选择,将点位控制与连续控制作为基本的选择类型;其二,在驱动条件上,应对液压、气压、电力等多种类型的技术条件进行讨论;其三,需在使用环境与应用空间的内容上,分析机器人的负重条件;其四,应从经济性状上,选择市场环境中通用的大众型号机器人,还是专业化较强的定制型机器人。
以围棋的对弈为例,可以结合应用特征,使用点位控制模式的机器人,并在综合分析视觉采集模型的内容,将摄像头、吸附盘等用于配合的功能设备总重量控制在5kg以内,以此保证机型构建的执行功能的高效率条件。同时,可以为其增添电控式的机械臂,使其长度条件可以覆盖整个棋盘,以此保证人机互动过程中能正常的进行对弈。
3.2 主机通信
通信系统,是为了保证机器人设备与图像、计算系统连接的重要条件,在通信端口,可以施工RS232型号的串口,通过网络或是线路的形式完成控制。以RS232串口为例,在就执行通信过程中,可以直接对其中的波特率、数据位、停止位、校验参数等内容进行确认与合适,以此保证机器人端口与计算数据端口的同步性条件,以高匹配度完成人际互动。而为了更好的执行这一内容,还需细致且全面的完成信息编写内容,在使用特定程序协议的基础上,执行AI计算机的内部序列,并在执行指令的基础上,确定放置棋子与提取棋子的动作指令。
4 总结
将机器视觉、人工智能、机器智能这三个模块进行整合,可以更好的完成动态化的机器视觉应用,并在加强人际交互过程的同时,提高智能化水平。通过对智能围棋对弈系统的分析,可以从简单的技术模型基础上,加深机器视觉的交互研究内容,并在拓展应用条件的基础上,扩大适用范围,使机械视觉背景下的人机交互展现出更加明显的示范作用,推进技术的持续发展。