APP下载

数据挖掘与人工智能决策

2017-08-21刘恒竹

魅力中国 2017年22期
关键词:数据挖掘人工智能

摘要:科学技术的不断前进使人工智能受到了更多人的注重。作为一种高尖端技术,其前期开展较为缓慢,可是就近几年的开展状况来说,人工智能的理论研究与实践使用已取得了长足前进。而这一前进,虽不能完全归功于信息技术与大数据技术,可是这两种技术为人工智能技术的开展起到了极大的推进效果。因而,对数据发掘在人工智能上的使用进行深入研究显得尤为重要。

关鍵词:数据挖掘;人工智能;决策

一、数据挖掘技术

(一)数据挖掘简介

数据挖掘(Datamining),主要是指对数据库中数据进行探索的一个过程。一般而言,数据挖掘从概念而言,包含3个方面的内容,即数据源数据的收集、对于数据源数据的处理以及最终的有效数据的表示。数据挖掘技术的应用领域主要集中在数据分析、模式识别和情报检索等方面,同时人工智能技术以及数据库技术都与其有着紧密的联系。随着数据信息爆发式的发展,从海量的数据中挖掘分析出对于管理决策、生产控制有用的数据是非常必要的,数据挖掘正是基于这样的需求日益被人们所重视。传统的数据挖掘更加侧重计算机技术的应用而未来数据发掘必然是信息科学、电子科学、计算机技术、建模技术、统计技术的大融合,随着大数据处理技术的应用、云计算的飞速发展以及数据挖掘算法的不断提升,数据挖掘必将迈向大有作为的舞台。

(二)数据挖掘步骤

源数据的收集阶段、数据预处理阶段、数据挖掘阶段、数据评估以及知识表示阶段。

(三)数据挖掘常见的方法

数据挖掘中大部分方法都不是专为解决某个问题而特制的,方法之间也不互相排斥。数据挖掘的方法主要有:关联分析、聚类分析、预测、时序模式分析和偏差分析等。常见和应用最广泛的算法和模型有:

1.传统统计方法:抽样技术、多元统计分析和统计预测方法等。

2.可视化技术:用图表等方式把数据特征直观地表述出来。

3.决策树:利用一系列规则划分,建立树状图,用树形结构来表示决策集合,可用于分类和预测,常用的算法有CART,CHAID,ID3,C4.5,C5.0等。

4.人工神经网络:模拟人的神经元功能,从结构上模仿生物神经网络,经过输入层、隐藏层、输出层等,对数据进行调整、计算,最后得到结果,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征挖掘、回归分析等多种数据挖掘任务。

5.遗传算法:基于自然进化理论,在生物进化的概念基础上设计的一种优化技术,它包括基因组合、交叉、变异和自然选择等一系列过程,通过这些过程以达到优化的目的,模拟基因联合、突变、选择等过程的一种优化技术。

6.关联规则挖掘算法:关联规则是描述数据之间存在关系的规则,形式为“A1∧A2∧…∧An→B1∧B2∧…∧Bn”。一般分为两个步骤:第一步,求出频繁数据项集;第二步,用频繁数据项集产生关联规则。

7.最近邻技术:这种技术通过已辨别历史记录的组合来辨别新的记录,它可以用来做聚类和偏差分析。每一种数据挖掘技术都有其自身的优势和不足,在进行具体技术选择的时候应根据数据特点以及用户需求进行合理的选择。

二、人工智能的发展情况

人工智能技术研究的主要方向是计算与知识,其将会通过研究计算与知识之间的关系,从而生产与发明一些适应人们生活的“科技物品”。那么我们就可以简单将人工智能技术的基本实质概括为以下这一观点:人工智能技术的实质是通过智能系统与智能机器,将人类的一些基本功能进行延伸、模拟、发展。人工智能技术是在多种学科理论的支持下所形成的新技术。我们可以将人工智能技术看作是信息化时代的必然产物,也可以将其看作是信息化社会的必然需求。例如,人工智能技术在互联网、信息化教育、信息化高速公路等方面,都将会发挥很大的作用。

人工智能理念最早是由McCarthyJ等正式提出的,在随后的几年时间里,人工智能受到了广泛关注,并且人工智能技术的快速发展,已经取得了很多引人注目的成就。例如在1956年出现的跳棋程序,这一人工智能程序在随后的六年时间里,战胜了一个州的跳棋玩家。在1958年,美籍华人王浩在IBM2704计算机上用3~5分钟,佐证了技术内部有关命题演算所涉及的全部定理。1959年,人工智能模式识别程序诞生。1977年,FeigenbaumEA在国际人工智能联合会议中,首次提出了“知识工程”概念,应用知识为人工智能的研究与体系构建起到了重要作用。1997年,IBM和公司所制作的“深蓝”计算机人工智能系统战胜了国际象棋大师卡斯帕罗夫等人。

就人工智能技术的发展来说,其早期涉及领域主要有专家系统、自动定理系统、机器人学、博弈、人工神经网络等。而为了应对日益复杂的社会环境,现阶段的人工智能研究领域还涉及数据挖掘、职能决策等。其中数据挖掘对于人工智能技术的发展来说,具有鲜明的现实意义。主要原因在于20世纪80年代初期,美国、欧洲、日本的人工智能技术研究都面临着很大程度的数据问题,而这些问题一方面是交叉问题,另一方面则是扩展问题。

三、数据挖掘与人工智能之间联系以及技术展望

数据挖掘与人工智能技术有着密切联系,甚至许多关键的技术都彼此一致,尤其在数据推理和数据搜索方面具有高度的一致,无论是传统的与或非逻辑推理、归纳推理过程,还是模态、多值推理过程基本原理都是一致的,其推理的正确性对于数据挖掘有效性以及人工智能数据处理都有着重要的意义。而搜索应用方面在数据挖掘过程中得到了充分的体现,都是根据用户需求不断探寻可利用路径,构造花费较少的推理计算过程,数据搜索的效率直接决定着数据挖掘的快慢。例如,在属性约简中,如果我们发现某一列属性的取值完全一样或区分能力不大,则可以提前删去。另外,在挖掘关联规则时,如果发现频繁K项集的任一(K21)项候选集不存在,则终止搜索剩余的(K21)项候选集,就可以判断“频繁K项集是不存在的”;等等。搜索机制提高了数据挖掘的效率,这对解决人工智能中的NP难问题是一个积极的探索。由此可见,数据挖掘技术与人工智能技术有着诸多的联系,具体表现为技术的交叉性。

对于数据挖掘以及人工智能技术分析,可以看出其未来发展都朝着集成化、网络化以及复杂化方向发展,集成化主要是指多种技术手段的不断融合,跨学科、跨领域现象明显,网络化则是充分发挥网络的关键作用,可以将终端设备处理能力无限拓展,形成强有力的管理控制能力,复杂度主要指各种技术解决难题不仅仅局限于计算机领域,在商业模式、工业控制、金融决策等都可能得到有效应用。

结语

就人工智能技术本身来说,其发展还应结合人们的生活实际,然后不断提升现有的技术。数据挖掘技术作为大数据技术的一种,虽然其自身具有一定的局限性,但是仍然可以为当下的人工智能发展提供必要的动力。

参考文献

[1]尹云飞,张师超,徐章艳.一种实用的软件数据挖掘模型[J].计算机应用.2016(06).

[2]尹云飞,钟智.一种聚类挖掘软件数据的方法[J].河南科技大学学报(自然科学版).2016(02).

[3]凌志泉.搜索引擎中的网络数据挖掘技术[J].计算机工程与设计.2016(09).

作者简介:刘恒竹,女,(1996-),山东人, 本科学历。

猜你喜欢

数据挖掘人工智能
数据挖掘技术在内河航道维护管理中的应用研究
人工智能之父
2019:人工智能
人工智能与就业
数读人工智能
数据挖掘综述
软件工程领域中的异常数据挖掘算法
下一幕,人工智能!
下一幕,人工智能!
基于R的医学大数据挖掘系统研究