人工智能背景下的大数据技术及其应用分析
2020-11-28聂芊冰
聂芊冰
2020年的春运即将到来。而回顾2019年的春运大数据,将会对新春运的运营带来很大的启示作用:2019年春运的旅客发行量超过30亿人次,其中道路客运、铁路和民航的旅客发行量位列前三,而铁路和民航的人数均有大幅度增长。从2019年的数据来看,“反向春运”已经成为越来越多旅客的选择。所谓“反向春运”,即节前从沿海流动到内陆、从城市流动到农村,而节后再反向流动。“北上深”和天津、南京、厦门等一线、二线城市成为了反向春运的目的地。2019年的反向春运主要体现在父母到子女的城市探亲。以上数据均是由大数据统计分析得来的。那么大数据的发展趋势如何,有哪些应用场景,又会给我们的日常生活带来怎样的影响呢?
1 人工智能发展历程
回顾人工智能的发展历程,可大致分为四大时期:1956年以前为孕育期,图灵提出“机器也能思维”的观点。1956年夏天,在美国的达特茅斯举办的研讨会,讨论了用机器模拟人脑进行运算和分析的可能性,史称“达特茅斯会议”。会议的召开标志着人工智能的诞生。随着专家系统等技术的提出,人工智能由孕育期进入了第一次飞速发展。而20世纪70年代,由于经济形势下滑所导致的政府和科研机构对人工智能的投入降低,使得人工智能的发展进入了黯淡期。而近十几年来,大数据、计算机视觉、深度学习等新兴技术的诞生,以及谷歌、苹果、阿里巴巴、腾讯等互联网公司在人工智能领域的深耕,使得人工智能进入了新的飞速发展时期。
2 大数据分析技术介绍
2.1 大数据介绍
2005年,Hadoop 项目诞生,其本身由多个共同实现全面功能和灵活的大数据分析的软件产品组成。这一事件也标志着大数据分析技术的诞生。随后,大数据技术进入了飞速发展的“快车道”:从2012年阿里巴巴设立“首席数据官”,到2014年“大数据”写入中国《政府工作报告》,从2016年大数据成为“十三五”重点规划项目,到2018年大数据已经进入应用阶段。
随着科学水平的日益提高,海量数据不断产生,并具有数据量大、种类繁多、价值密度低、速度快、时效高等特点,这就要求深入研究大数据,并从中找出隐藏着巨大的价值。而现如今,大数据已经成为国家和各大企业发展、运营的重要资产,在各行各业的重要性逐渐显现。
随着大数据的发展,数据挖掘技术也在不断成熟。数据挖掘由数据的选取、预处理、转化、建模、分析结果并改进几个部分组成,是分析并提取重要数据的有效技术,能挖掘感兴趣对象间的结构关系、分析非关系型数据并推理,实现数据挖掘和移动计算的结合。数据挖掘的方法包括决策树法、CART 算法、K-Means 算法和SVM 算法,满足了不同的数据要求。同时,如何在保证信息安全、保护个人隐私的同时又不破坏数据的一致性,为数据挖掘提供真实可靠的原材料并挖掘出有价值的结果也成为数据挖掘研究人员面临的重要问题。
2.2 数据可视化
通过图像处理技术,计算机可将数据转换成图表、图形或者图像,在交互界面上直观地呈现出来,这一过程就是数据可视化。通过数据可视化技术,可以直观地对数据进行分析和理解,进而综合运用大数据。
而数据可视化可以根据空间维度、面向领域、可视化对象、方法论角度等不同原则进行分类。其主要技术包括数据信息的符号表达技术、数据可视化渲染技术、数据可视化交互技术、数据可视化表达模型技术、可视化设计与开发模型。
虚拟化技术将计算机的软硬件、数据、网络等都相互隔开,帮助数据网络构架实现动态化,对物理资源、虚拟资源都可以进行一体化管理与使用。存储虚拟化技术的运用主要通过3个层次完成:以主机为基础进行虚拟化,该系统主要应用于做数据镜像保护,但存在应用和操作系统的兼容问题且占据主机的大量资源;以存储设备为基础进行虚拟化,多用于高端点的存储设备,便于管理但成本过高,中小型企业难以普及;以网络为基础进行虚拟化,利于数据的统一化管理,且不占用主机资源但成熟性较低,仍需完善。虚拟化技术为企业进一步发展提供安全保障,因此在与企业相互促进的过程中发展迅猛。
2015年,随着“互联网+”战略的提出,大数据在教育方面的应用越来越广泛。“互联网+大数据”的教育模式主要指在未来一到五年有潜在使用价值的新兴技术。它要实现的主要是利用教育技术对获得的大数据进行分析整理,并据此调整教育计划。基于“互联网+大数据”的教育技术主要可分为5类:自适应技术、增强现实以及虚拟现实技术、机器人技术、自然用户界面以及人工智能。这5类技术旨在帮助学生更好的体验课程。激发学生学习兴趣、更好的帮助老师了解学生学习水平及制定教学计划,从而有效提升教学效果。
3 大数据的应用分析
3.1 大数据在医疗领域的应用
医疗大数据的来源主要分为3类:制药企业或从事生命科学研究的单位、临床医疗以及实验数据、费用报销以及费用信息的利用率。而在未来,医疗大数据的发展与普及将进一步提高临床诊断的准确率,这将会使医务人员的决策变得更加科学而不是依靠经验弥补不足。医务工作者也许能够进一步挖掘病症的特点、患者的喜好,基于此便能够对治疗方案进行优化调整,实现个性化的治疗。而在新药研发工作中,借助大数据能够对药品需求进行精确分析,实现优化资源配置的目标。然而,目前数据的存储与处理、医务人员对于医疗大数据的应用等问题仍需解决。所以,在医疗大数据的发展过程中,我们应重视信息孤岛问题并优化人才培养模式,从而使大数据在医疗方面得到更广泛的应用。
3.2 大数据在经济领域的应用
随着互联网技术的不断发展,大数据为互联网经济带了许多方面的影响。首先,它降低了互联网经济的交易成本。对于卖家来说,网上交易省去了开实体店所需要的水电费、房租等费用,而对于买家来说,商品的评价、价格一目了然,既方便又省时。其次,它拓宽了互联网经济的交易空间。它打破了传统交易的地域限制,扩宽了信息传播的范围。企业可以将产品销往全国各地甚至全世界,而消费者也有了更多的选择而不是被动接受产品。最后,它改善了互联网经济中的用户交易体验。商家可以通过大数据的整理与分析掌握客户的兴趣所在,从而向顾客推送产品。而顾客对于这些推送信息往往也比较感兴趣,而不是把它们当作广告而感到厌烦。当然,这其中也存在着陷阱和隐患,需要我们去不断改进。因此在利用大数据的过程中要更为谨慎小心,才能使其长久发展下去。
4 结语
人工智能经历及几十年的发展,涌现了以大数据为代表的可赋予计算机“智能”的技术。随着计算机技术的进步以及设备运算和存储能力的提高,海量数据的处理和运算,需要用到常规数学手段之外的处理方式。数据可视化使得大数据分析可呈现出一种直观可见的形式。而大数据在医疗和教育等领域的应用,也让大数据的实际价值得以凸显。但是随着海量数据的产生和存储,不可忽视的就是数据安全问题,如何在充分利用数据价值的同时,维护数据的安全性,成为大数据技术的新难点。