概率论与数理统计在大数据分析中的应用
2021-07-12梁龙龙
梁龙龙
(蚌埠工商学院,安徽 蚌埠 233000)
概率学知识在人们日常生活与生产中体现得淋漓尽致。 人们认识世界,经过运用概率学与数理统计工具,可以让人们科学合理的分析各种复杂问题与数据,进而明显提升人们的生活质量,同时可以依据现有数据精准预测事情发展的规律与趋势。 由于其具有这些优点,促使概率论和数理统计成为很多复杂问题地指引方向。 当前,人们非常需要大数据分析,同样人们还需要一种适合大数据分析的更好办法处理实际生产生活中存在的各种疑难问题。 鉴于这种情况,本文主要研究了概率论和数理统计在大数据分析中的具体运用,期望可以为人们日常生产与生活过程中冷静科学地进行大数据分析提供一定的借鉴。
1 相关概述
1.1 大数据分析
从总体方面来看,大数据分析是社会不断进步与发展产生的一种新型词语。 人们的生活水平得到明显提高,在很多非常复杂的学科中之所以可以广泛应用大数据分析,是因为把其进行了系统整合。 从某个方面来看,实际上是分析庞大的数据,其自身具有很多特点,如分析速度快、储存量较大、准确度高等,因此,在拥有顾客需求、用户特征等方面的数据分析中得到广泛应用;首先从企业发展方面来看,通过大数据分析可以为企业产生更多的经济利益;其次,从消费者方面来看,运用大数据分析可以使消费者感受到更加优质的购物体验。
1.2 概率论与数理统计
概率论与数理统计是高等数学教育中非常重要的一门学科,其体现出分析鲜明的特点,尤其是从研究对象方面来看,彰显出其具有独特性思维分析的特点,概率论与数理统计这门学科和其他学科之间具有直接关系,以经济学方面为主。 概率论和数理统计这门学科拥有丰富的内容,其实这是其成为高等数学这门学科重要组成元素的主要原因之一。 就目前来看,在我国各行各业中广泛应用了概率论与数理统计。 从教学实际方面来看,可以把概率论与数理统计单独当作一门学科展开教学,无论是在工业领域,还是其他领域运用概率论与数理统计,均对信息技术提出了非常严格的要求,可以真正彰显出概率论与数理统计在大数据分析中具有的优势,在人们生产与生活方面同样发挥着积极性的作用;从另一个角度来看,概率论与数理统计也不能当作单独的学科,究其原因是其和其他学科之间具有直接关系, 发挥着相互渗透的作用。
2 概率论与数理统计与大数据分析的联系
随着大数据时代的不断进步与发展,人们需要在基于计算机与科学技术的基础上, 在大数据分析中应用概率论与数理统计, 在一定程度上拉近了概率论与数理统计和大数据分析之间的关系。 它们之间存在的联系如下:
一是研究方向一致。 概率论与数理统计和大数据分析均是为了更加精准地分析和探索数据, 以便于寻找大数据的内部关联和规律分布, 这样可以看出二者之间的研究方向相同。
二是大数据发展速度的加快, 促使大数据分析为统计学开拓路新的领域与空间, 同时为概率论与数理统计的探究指明了方向。基于大数据分析的前提下,概率论与数理统计得到迅猛发展。
三是大数据分析不是统计学知识范围中的一个分支,其与统计学知识范围相脱离。 大数据分析同样不只受限于概率论与数理统计的关系,其还能够被应用于其他生活与生产领域,是这个领域引导方向发现规律的主要方法,如云储存等。
3 概率论与数理统计在大数据分析中的具体应用
3.1 在经济数据分析中的应用
经济数据是大数据时代的多种数据中经常见到的一种类型,经济数据在经济市场中起着至关重要的作用。 通过精准地分析经济数据,有利于加快社会经济的发展,然而由于经济数据是以低密度的方式存在于互联网中,因此,在分析经济数据时具有更高的难度。 然而在经济数据分析过程中运用概率论与数理统计方法,可以使经济数据分析工作更加地简单,同时其还是目前经济数据分析方法中非常简单而有效的方法。 在经济数据分析中应用概率论与数理统计时,经常使用的分析方法是正态概率分布,然而由于正态概率分布方法可以精准地预测与描述连续性随机变量的概率,因此,在经济金融管理领域中得到广泛普及与运用。 正态概率分布方法可以使用概率论与数理统计精准、有效地分析关于概率的全部信息,与此同时,按照分析结果可以动态掌握经济情况,这样可以保证人们充分了解市场经济规律,同时精准地分析经济信息,最终利用精准的信息更好地拟定于调整后期的决策。 尽管经济市场呈现出千变万化形势,但是经济市场的改变同样体现出一定的规律与趋势,所以在分析经济数据过程中,既需要估测经济市场的变化规律与发展形势, 同时需要全面考量经济市场中的风险。 在经济市场中的风险与利益是一种互相存在的关系,然而通过精准地分析经济数据,既可以降低风险的发生率,同时还可以发现规避风险的手段,最终实现解决经济市场风险的效果。 在经济数据分析中应用概率论与数理统计方法,同样是当前人们避免经济风险经常使用的一种方法。
3.2 在商业数据分析中的应用
在大数据时代背景下,商业数据同样对企业的发展产生着直接影响,商业数据和经济数据之间具有一定的关联。 企业分析商业数据过程中经常使用概率论与数理统计方法。 将商业数据中的大客户流失概率作为例子,讨论了概率论和数理统计在商业数据中的具体运用。
一是需要构建相应的研究模型,在模型建立过程中,首先,需要将大客户的基本属性相近作为基本条件,同时还需要保证流失数据符合相同的流失函数,即f0(t)。其次,流失数据的分布条件均是根据流失函数指数项exp(c,zi)T所得到的,接着寻找影响大客户流失概率的因素,划分数据的类型,同时设置指定时间段,接着归纳指定情况中大客户流失的情况,同时得到流失情况的形势图, 精准计算流失形势图的标准函数,为从而得到某个确定客户在某个时间中流失的概率和其在流失函数中占据的位置,客户在[0,T]阶段中的流失概率是p=其中p 维回归参数的向量是c,p维协变量向量是同时把这个协变量界定为一种影响因素,从而可以实现研究模型的建立。
二是研究模型构建之后, 需要挑选协变量和参数,接着利用最大类似然函数计算挑选的这些回归参数。 因为计算期间有多个方面的因素均对大客户流失造成直接影响,若把全部因素界定为协变量,就会增加模型维数,从而使估测参数的难度大大增加,同样不能有效确保参数的估测精准率。 所以,这就需要选择性使用这些因素,为了明确协变量的数量,需要根据数理统计结果挑选协变量,如此一来才可以防止出现各种错误。
4 结论
通过对以上内容进行研究, 大数据时代背景下,概率论和数理统计不只是大数据分析的辅助性手段,其还属于一种非常简单、有效的数据分析方法,在大数据分析中应用概率论和数理统计时,各种类型的数据过程及效果等均是目前人们分析数据的核心对象。伴随着目前大数据增长速度的加快,在大数据分析中应用概率论与数理统计,可以加快我国社会经济的发展速度,从而推动其向更高的方向前进。