试析大数据与传统安全统计数据的比较及其应用展望
2019-03-01孙跃
孙跃
一、大数据与传统的安全统计数据比较
大数据与传统的安全统计数据相比较,首先在理论知识方面具有极大的不同,传统的安全统计数据维数是单维的;数据收集重点是非场景化数据;数据之间具有因果关系的模型,采用描述性的数据使用方式;数据组织和存储方式是关系型数据库;面向对象的数据结构;SQL数据库数据存储管理方法;数据生命周期随研究过程的结束而终结。但是大数据具有多维的数据维数;数据收集重点是场景化数据;数据之间具有相关关系的模型,采用预测性的数据使用方式;数据组织和存储方式采用关系型数据库;面向主题的数据结构;NOSQL数据库数据存储管理方法;数据生命周期不随研究过程的结束而终结。
二、大数据在安全统计学中的应用
在处理事故方面,通过在安全统计的过程中使用大数据的技术,对于不同的数据进行分析,得出安全事故发生的一些规律性的结论,可以有效地更有针对性的对于相关的事故进行防范,安全科学领域使用大数据技术,如对安全科学数据存储和分析,找出事故发生的规律和特点,可以看到所有的数据将被忽略,捕获潜在风险信息之间的关系,控制情况,提前对于相关的事故进行排查和预防,降低安全事故的發生率,在事故的处理过程中,利用大数据可以实时地统计到安全事故的发生情况,对于发生的原因,解决的方法,采用不同的方法可以达到的效果均可以通过仿真得到结果,使得工作人员更容易从不同的解决方案中通过智能化的算法得到最优的解决方案。
海量数据的出现给传统的安全统计工作带来了冲击。采用先进的信息技术对数据进行录入,既可以避免人为数据记录的缺陷,又可以提高数据统计的价值。传统的安全统计分析思路是从“假设”到“验证”,在大数据背景下,分析思维从“探究”转变为“总结”。它可以直接从数据中探索规则,不受任何假设限制,然后进行归纳总结,得出结论。这些变化极大地拓宽和丰富了统计分析的理论和思路。
三、大数据在安全统计学中的应用展望
在安全统计学的学习过程中应该加强相关软件的学习,EXCEL、Eviews、SPSS等是目前统计学课程使用的主要教学软件。除了要求学生掌握基本的统计软件操作外,学生还应考虑先选修与大数据分析相关的计算机专业课,如数据库开发设计、Hadoop、Hive等计算工具,以处理大规模的多源异型数据和脚本语言Python。
数据的采集向着更加智能化的方向发展,传统的安全统计数据是通过简单的调查报告,单纯的访问和了解而获得的比较片面的统计结果,结果中有很多数据不具有代表性,所以在安全事故的防护过程中不能很好的完成任务,但是后期对于结果的处理将会花费更多的人力和物力,此时大数据的智能算法就体现出来了他的优势,能够在信息的收集阶段就排除被采访者答案主观性的影响。
对于传统的安全统计数据发布进行完善,工作人员的工作方式在这个过程中起着举足轻重的作用,对于统计数据的公开必须经过工作人员提前的审核,确保统计数据的正确性和对于行业趋势的引导作用,提升用户对于公开数据使用的满意度,争取获得用户的广泛好评,满足用户的各种要求,从而成为用到这些数据的工作人员工作过程中的得力助手,工作人员在工作的过程中也可以利用大数据的软件,捕获准确的最新的数据,将这些数据及时提供给相关的部门,提升安全统计部门的信息及时性和准确性。
当然,大数据时代并不意味着传统的安全统计方法不重要。从必要性、安全性和经济性的角度来看,并不是所有的数据都可以或者需要从大数据中获取。即使是大数据,也必须辅以传统统计分析才能得出相应的结论。