多维度数据组合的人工智能系统性能优化分析
2020-12-09辛强伟唐云凯
辛强伟 唐云凯
摘要:信息存储、传输、处理等能力的增强为充分大范围利用大数据提供了可能。大数据是人工智能的重要基础之一,需要将大量数量进行合理的处理,通过对大量数据的选择、整合和分析,找出其中的正确规律加以运用。人工智能系统的可靠性或精度需要得到保障,特别是一些实际应用中对可靠性或精度要求极高。多维度数据组合可以降低数据的片面性和潜在的隐患,从而提升人工智能系统的可靠性和精度。
关键词:人工智能;大数据;多维度;组合
中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2020)10-0000-00
0引言
人工智能即人造智能,指用机器(计算机)模拟或实现人类的智能。人工智能并非一个新概念,“人工智能”一词最早是在1956年Dartmouth学会上提出的,它是研究和开发用于模拟、延伸和扩展人的智能的科技。人工智能企图了解智能的实质,对人的意识、思维过程进行模拟,产生出能以人类智能相似的方式做出反应的智能设备,该设备能像人那样思考。人工智能领域的研究包括机器人、图像识别、语言识别处理和专家系统等。
人工智能自诞生以来,应用领域不断扩大,近些年由于大数据、通信技术、传感器等技术的快速发展使人工智能又上了一个台阶,也使人工智能新的应用有了基础和可能[1-2]。例如计算机视觉和图像处理、机器翻译和自然语言理解、专家系统、智能搜索引擎、数据挖掘和知识发现、自动驾驶、人像识别、文字识别、图像识别、车牌识别和语音识别等[3]。
1分析
人工智能系统特点是快速计算与海量存储能力,具有自主学习的能力,各模块之间互相依赖并且可以同时学习,具有实时的学习能力。人工智能系统的认知可分为三个步骤:首先获得数据,然后对数据进行加工整合得出结果,最后自我学习自我完善。人工智能系统要达到类人思考,像人一样思考,代替人取代人,特别是在一些重复性、很繁重或者说很危险的工作当中代替人,这样可以降低成本、提高效率和安全性。
机器学习是大数据的分析方式之一,也是人工智能的主要研究方向之一,有些大数据研发人员就是通过机器学习转入了人工智能领域。机器学习涉及统计学、概率论、逼近论、算法复杂度理论等多门学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
此外,人工智能还涉及到模式识别。模式识别研究模式的自动处理和判断,根据样本的特征将样本划分到一定的类别中去,使设备具有模仿人类通过感官接受外界信息、识别和理解周围环境的感知能力,即用计算机来模拟人的各种识别能力,当前主要应用在人工智能领域的图形识别和语音识别。然而,有些场景中对人工智能的应用提出了严苛的要求,人工智能系统的可靠性或精度需要得到保障。比如在无人驾驶中对数据获取的速度、精度以及数据通信传输的速度,都有很高的要求。因此需要进一步提出多种多样的方法来不断提升人工智能系统的可靠性或精度。
2多维度数据组合
反馈校正方式是一种提升系统性能的方法。反馈校正的基本原理是校正系统中对动态性能改善有重大妨碍作用的某些环节,恰当选择反馈校正的形式和参数,使系统的性能满足给定的指标要求。但在反馈校正方式和多种学习训练方法(如机器学习)之外需要另外的方法。
大数据作为人工智能发展的重要基础之一,与人工智能存在紧密的联系。正是基于大数据技术的快速发展,通过人工智能结合大数据,近些年人工智能才取得了诸多突破。数据的价值如何体现出来,其中一个重要方面是数据要应用到智能控制方面,智能控制是自动控制,不是人工控制。智能化的实现要依靠数据,数据量越大,那么它所反映出来的概率越准确。
统计学、概率论、组合学都可以在人工智能当中发挥重要的作用,特别是将三者结合起来使用。以往人工智能运用较多的是统计学、概率论,并没有明确地引入组合的思想,没有与组合学充分结合。人工智能与组合学相结合可以有效地提高人工智能系统的性能。人工智能的实现需要大量的数据,对于所取得的信息进行科学的分析,以便作为决策或控制的依据,这些都需要统计的支持。数据是人工智能的重要参考和依据。人工智能离不开对数据的分析,其中要用到大量的统计方法,以便对未来的状况进行预测。统计学应用广泛,例如,企业要对自己产品的市场潜力作出预测,以便及时调整生产计划,这就需要利用市场调查取得数据,并对数据进行统计分析;經济学家在预测通货膨胀时,运用有关生产价格指数、生产能力、失业率等统计数据,然后用统计模型进行预测。统计学能让人们正确地认识事物,避免或减少错误发生。概率论是研究随机现象的统计规律的数学学科。结果具有多种可能性,而且在之前可以确定所有可能的结果,但不能准确预言会出现哪种结果。概率是衡量事件发生的可能性的量度。在随机情况下某个事件的发生具有偶然性,但在相同条件下大量重复的随机试验却常常表现出明显的规律。组合学也称组合数学,它研究的是满足各种附加条件的有限个对象的集合。组合学所研究的问题有:计数问题、存在性问题、构造和算法问题、优化问题等。组合学分为图论、组合计数、组合设计、组合最优化和组合几何等。根据组合学研究与发展的现状可分为五个分支:经典组合学、组合序、组合设计、图与超图和组合多面形与最优化。组合学不仅在软件技术中有重要的应用价值,在企业管理、金融分析、交通规划等领域都有重要的应用。例如,在美国有一家公司用组合学的方法来提高企业管理的效益,取得了很大的成功。
数据按照获取时间大致可以分为实时数据和过往数据,过往数据的作用是根据以往的数据来判断和推理将来和未知。数据的获取主要可以通过传感器来完成,例如空调中的温度和湿度传感器,电视机的红外遥控器,电冰箱、电饭煲中的温度传感器,照相机中的光传感器,汽车的燃料计和速度计等,不胜枚举。许多人工智能设备获取信息是通过多种不同功能的传感器来收集各种不同性质的信息,例如温湿度、红外、震动、气体、气压、速度、加速度等数据。对于信息的理解则是通过对传感器信息的处理来实现的。如果用人体来类比,计算机相当人的大脑,执行机构相当人的肌体,传感器相当于人的五官和皮肤,对外界或周边环境进行感知,将感知到的信息转化为电信号并进行传输。世界已经进入信息时代,构成现代信息技术的三大支柱是:传感器技术、通信技术和计算机技术,三者在信息系统中分别起到“感官”、“神经”和“大脑”的作用。运用传感器技术进行信息采集,运用通信技术进行信息传输,运用计算机技术进行信息处理。在利用信息的过程中首先要获取准确可靠的信息,而传感器是获取信息的主要途径和手段。目前传感器已经在众多的领域得到应用,除了工业、农业、商业外,还广泛用于自动化生产、环境监测、交通、医疗诊断、现代办公设备、航空航天、智能楼宇和家用电器等领域。
人工智能学科是计算机科学中涉及研究、设计和应用智能机器的一个重要分支,研究如何使机器具备智能的科学和技术,通过使机器模拟和执行人的大脑的某些智力功能,能在各类环境中执行各种拟人任务的机器,并探索相关的理论和技术。人类智能指的是人类所具有的智力和行为能力,包括感知能力、记忆能力、思维能力、归纳与演绎能力、学习能力和行为能力。所有的这些能力都与人的大脑相关。人的大脑包括端脑和间脑,端脑包括左右大脑半球,端脑由约140亿个细胞构成,巨量的脑细胞之间存在着复杂的联系。如果用网络来表示,大脑毫无疑问是一个超大规模的复杂网络。脑细胞的数量动态变化,每天要死亡约10万个,越不用脑,脑细胞死亡越多,因此要勤于用脑。人脑中的主要成分是血液,血液占到80%,大脑虽只占人体体重的2%,但耗氧量达全身耗氧量的25%,血流量占心脏输出血量的15%,一天内流经脑的血液为2000升。到目前为止,人类大脑依然是最复杂最神秘的科学难题,存在着大量的未知之谜。研究人工智能有助于人类对自身大脑的认识。现在计算机的智能水平还相对低下,人们研究人工智能的远大前景是让计算机同人脑一样,甚至超越人脑。用机器代替人,可以代替人从事繁重的工作,提高效率或品质,降低成本,也适合于一些危险或艰苦的场合。人脑是一个动态的、开放的、高度复杂的庞大信息系统。目前往往采用结构模拟的方法,即根据人脑的生理结构和工作机理实现计算机的智能,由于还不能对人的大脑做到真正和完全模拟,只是对它进行局部或近视模拟。具体地说,就是用人工神经网络作为信息和知识的载体,用神经计算的方法实现识别、学习、联想和推理等功能,从而来模拟人类大脑的智能,使计算机表现出某种智能。结构模拟法基于人类大脑的生理模型进行数值计算,从微观上模拟人类大脑以实现机器智能。这种方法先通过神经网络的自学习获得知识,然后利用知识来解决问题实现智能化。
人工智能依赖于大数据,人工智能以数据为基礎,往往通过数值计算进行问题求解而实现智能。数据的类型大致可分为三类:传统数据、机器和传感器数据、社交数据。传统数据包括各种调查数据、统计数据、销售数据、库存数据以及记录数据等。机器和传感器数据包括查询记录、浏览记录、呼叫记录、智能仪表、工业设备传感器、设备日志、交易数据等。社交数据包括用户行为记录、反馈数据等,如微信这样的社交媒体平台。数据的种类是多种多样的,数据的来源也是多种多样的,人工智能结合大数据需要去伪存真,去除错误数据、虚假信息和离群值。从大数据中可以提取多种数据和多个数据源,运用组合(协同)降低风险。采用多维度数据组合以提升人工智能系统性能,应用概率论和数理统计,根据应用场景的不同选择多种类型的数据加以组合。多维度数据组合可以避免单一数据或低维度数据可能存在的片面和隐患,从而提升人工智能的可靠性和精度。
3结语
未来的世界人工智能将扮演重要的角色,其中的关键因素包括数据处理速度和通信速度的大幅提升。随着5G技术的推广和普及,使人工智能在人类生产和生活的各个方面会发挥越来越重要的作用。人工智能系统性能至关重要,多维度数据组合的方法有助于人工智能系统性能的提升。
参考文献
[1] 林海伦,王元卓,贾岩涛,等.面向网络大数据的知识融合方法综述[J].计算机学报,2017,40(1):1-27.
[2] 林培光,周佳倩,温玉莲.SCONV:一种基于情感分析的金融市场趋势预测方法[J].计算机研究与发展,2020,57(8):1769-1778.
[3] 秦晨光,王海,任杰,等.基于多任务学习的方言语种识别[J].计算机研究与发展,2019,56(12):2632-2640.
收稿日期:2020-08-25
作者简介:辛强伟(1980—),男,陕西西安人,博士,讲师,研究方向:物联网。
Performance Optimization Analysis of Artificial Intelligence System Based on
Multi Dimensional Data Combination
XIN Qiang-wei,TANG Yun-kai
(School of Computer, Xianyang Normal University, Xianyang Shaanxi 712000)
Abstract: The enhancement of the ability of information storage, transmission and processing makes it possible to make full use of big data. Big data is one of the important foundations of artificial intelligence. It is necessary to deal with a large number of data reasonably. Through the selection, integration and analysis of a large number of data, we can find out the correct rules and apply them. The reliability or accuracy of artificial intelligence system needs to be guaranteed, especially in some practical applications. Multi dimensional data combination can reduce the one sidedness and potential hidden danger of data, so as to improve the reliability and accuracy of artificial intelligence system.
Key words: Artificial intelligence; Big data; Multi dimensional; Combination