APP下载

大数据技术解析及其安全建设研究

2019-11-12冯丽

电脑知识与技术 2019年25期
关键词:数据格式大数据技术数据源

冯丽

摘要:大数据技术并不是指数据量很大,而是指数据源头、数据格式和数据渠道的多样性及相关汇总分析。简称为“三多一分析”。大数据分析和其他计算机分析技术的差别在于它所分析的不是单一源头、单一渠道、单一格式数据,而是多样性数据,大数据安全是传统数据安全特性的和新安全特定的结合。针对新安全特性,采用发布干扰消息、风险预警和防范、大数据反分析等技术进行安全建设。

关键词:大数据技术;数据源;数据格式;数据渠道;多样化;数据分析;大数据安全

中图分类号: TP399        文献标识码:A

文章编号:1009-3044(2019)25-0013-02

1 大数据技术的特征

大数据技术是近些年来比较热门的话题,很多机构和人员都在研究。但是,相当一部分人员对大数据技术的认识并不清晰。仅仅从字面将它理解为信息量很大的数据,这是典型的以偏概全。信息量很大的数据被称为海量数据。海量数据与大数据技术并不是一回事,根据笔者的分析和认识,大数据技术有如下几个显著特点:

数据格式多样:结构化数据、非结构化数据;文字、图片、影像、声音等等各种各样格式的数据,均可以被统称为大数据技术的数据格式。

数据来源多样:电脑、手机、传感器均可以作为大数据技术的数据源。

通信方式多样:网站、邮件、手机短信、即时聊天工具、影音播放器都可以作为大数据技术的通信方式。

着重数据分析:通过多个源头、多种渠道收集到的多种格式数据,要根据某一个计算模型,进行计算分析,并得到某一个有价值的结论。

用一句话概括:大数据技术就是“三多一分析”。

以一个真实案例来说明大数据的特性。根据钉钉软件的考勤统计报告,某男性A近期出现很多缺勤记录。通过手机监视程序发现,该A男性近期经常光临淘宝、京东等电商平台,查看婴儿床、婴儿纸尿裤等用品;同时,该男性所在城市的妇幼保健医院摄像头显示,A男性有若干次出入医院的记录。由此我们可以分析出,A男性的老婆、姐妹或者其他女性亲属是孕妇,并且将要临产。如果保险公司得到该结论,并获得该男性联系方式,可以向该男性推荐生育保险。当然,我们的分析是人工完成的,在真实的应用环境当中,数据分析主要通过程序或者人机结合的方式获得,这就是大数据技术的典型应用。

根据这个案例,我们可以知道,大数据技术的涵盖面非常广,它可能是涵盖面最广的计算机技术,所有电子数据内容、数据源和通信方式,都是大数据技术的输入。此外,大数据技术的弹性非常大,少到分析一个人的一条短信和一段视频,多到分析一个国家全年的医疗影像和用药记录,虽说规模差别巨大,但都从属于大数据技术。大数据技术这个名称,本身没有明确指出大数据技术的本质特点,所以才会被简单理解为海量数据。

2 大数据分析技术与其他数据分析技术的区别

数据加分析,是很多计算机技术的特性,比如模式识别技术、自然语言处理技术、人工智能技术,那么大数据技术与这些技术的区别是什么?

大数据技术最突出的特征,是数据的源头、格式和渠道的多样性。大数据技术的数据分析与其他计算机技术的数据分析差别不大,甚至还要弱一些,即使数据分析有差别,也是因为原始数据的源头、渠道和格式的多样化造成的。

3 大数据典型应用

由于数据源头、格式和渠道的多样性,大数据涵盖面广。凡是涉及数据的地方,都能应用大数据技术。典型应用就是预测技术:用户行为预测、市场物价预测、人体健康预测、疾病疫情预测、交通行为预测、灾害灾难预测。

4 大数据安全

大数据安全是个笼统的概念,可以有如下三种解释:一、利用大数据技术保护传统信息系统安全。二、如何保护大数据技术本身的安全。三、如何防止基于大数据技术的破坏活动。

第一个解释,属于大数据技术的一个应用,应用对象是传统信息系统安全。从多个角度、多种技术收集数据,并针对安全问题进行分析,得到有价值的结论。问题的关键是数据源、数据渠道和分析模型,通过充足的数据源和数据渠道,迅速收集到有价值的数据,并根据模型分析出有效的安全结论。

第二解释,属于大数据技术自身的安全,针对的目标是大数据本身。问题的关键是大数据基础设施如服务器、网络设备、是否具备有效的安全防护措施,数据源、数据渠道是否被屏蔽、数据内容是否真实。分析模型是否有效。分析结论是否被窃取或者篡改。

第三种解释,指如何防范基于大数据技术的入侵行为。针对目标是基于大数据技术的入侵行为。

三种解释当中,第二、第三种会带来安全问题,第二种属于传统安全问题,第三种属于新安全问题。因为犯罪分子利用大数据技术这一新技术进行破坏,传统的安全防护措施,不能有效抵挡这种新型进攻,要专门制定新的模型和安全措施。为了陈述方便,将第三种解释重命名为基于大数据技术的入侵行为。

为了防范基于大数据技术的入侵行为。要根据大数据技术“三多一分析”的特点,制定防范措施。防护措施分为数据源防护、数据渠道防护、数据内容防护,数据分析阻断四个角度。其中数据源防护、数据渠道防护、数据内容防护未脱离传统信息安全领域,可以采用传统的身份鉴别、访问控制、安全审计、通信加密等技术。数据分析不在我方进行,而是在不法贩子方進行,较难阻断,我方可以采用发送干扰数据的方法,干扰不法分子的数据分析结论。

大数据技术本身可以作为防护手段,防范基于大数据技术的入侵行为。大数据技术的一个重要应用就是预测技术,我方采用大数据技术构造风险预警平台,提前预知可能发生的基于大数据技术的入侵行为。

同时,可以对不法分子的攻击行为大数据分析,即反向大数据分析。通过多源头、多渠道采集不同格式的犯罪分子数据,并做关联分析,为捕获不法分子创造可能。

5 总结

科学技术是把双刃剑,大数据技术也不例外,它既可以为我们创造价值,也可以被不法分子利用并进行破坏,我们要慎重合理对待大数据技术,不可以过于乐观,也不可以盲目悲观。要以平和端正的态度,从客观事实出发,一分为二地看待问题,充分利用大数据技术的优势,积极抵御大数据技术带来的危害,为人类造福。

【通联编辑:唐一东】

猜你喜欢

数据格式大数据技术数据源
在智能交通系统中PLC数据格式转换方法的研究
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
基于真值发现的冲突数据源质量评价算法
论子函数在C语言数据格式输出中的应用
DWG与SHP数据格式互转换方法研究——以龙岩规划测绘数据为例
分布式异构数据源标准化查询设计与实现
基于ArcGIS的规划数据格式转换研究