APP下载

统计学的知识架构梳理

2019-09-10林智海

现代营销·理论 2019年12期
关键词:概率架构统计学

林智海

摘 要:统计学是在数据的收集、加工、处理等过程后,描述客观现象的数据特征和关系的方法论学科。由于统计学的定量和定性地研究准确而客观的特点,所以被现代社会广泛应用于自然科学和社会科学的各个领域。在目前的数据时代背景下,研究统计学不单纯只是从经济体系中的数字计算方面入手,研究的意义也远超过了经济学的定义范畴。

关键词:统计学 架构 实验 概率

本文将剖析统计学的知识架构,从时间性上统计学可分古典统计学和现代统计学,从操作特点上实验型统计和计算机数据统计,从数学角度来看可分为精确数学的“=”范畴和模糊数学的“≈”范畴,但无论何种分法,从本质上来看,统计学都是属于数学的学科体系中的一个重要组成部分。本文从现代数据科学的角度阐释统计学为三大部分:实验型的概率分析、精确型统计分析和随机型(模糊型)统计分析。

首先实验型的概率分析是构建在古典概率学基础之上,由排列学、组合学和条件概率部分组成,学生在完成实验型概率模型一般可通过传统的纸质完成分析任务。在区别排列学和组合学时,应注意排列是顺序取,双向式的数学模型,而组合学则是一把抓,单向式的数学模型,另外对有放回和无放回的模型、加法与乘法原理的实验也比较丰富。学生可从N双鞋子,取M只,至少有N只配对成功概率的实验、抛硬币概率实验、摇骰子概率实验、同花顺概率实验等等进行学习和研究。

古典概率的另外一块重要的分支是条件型的实验,学生先从全概率公式,条件概率的理解及贝叶斯公式的推导进入学习,对一些经典条件概率实验如同天生日概率实验、三门概率实验、取M只,至少有N只配对成功概率的实验等进行深入学习,同学们分别从组合学和二项式定理推导出抛硬币实验的结论,加深对概率学的理解和应用,最后由二项式定理到二项式分布,由概率统计到概率分布的初步过渡。

古典概率学本质上是精确数学的领域,是研究客观存在对象在具体量化时的个体与整体之间的权重比例关系。学生学习这方面知识内容一般可通过传统教学和传统学具完成,在学习过程中,可达到强化学生的数理逻辑思维和提高学生的动手能力的目的。

其次,精确统计分析是现代统计学的雏形是以研究平均值为标准的计算机操作型的数据科学,操作的载体由传统纸笔书写升级为现代计算机实验操作,但本质上而言,还是研究的还是数学中的精确型的数据内容。

精确型的统计分析一般由统计中最基本的计数算法进入,计数的导向可分两个方向:

一是计数本质上是位的运算,配合值运算中的求和值,平均值的意义是实现了数值与数位的统一运算,用数形结合的双标法的描述是位于中线位置的值与位。由此延伸到不在中线位置的值与位的统一算法是:坐标轴上“值的比例=位的比例”,这种算法就是加权算法的内在核心,同时也指导了分类变量(也成组数据)运算过程。当然值运算的本身也包含了许多算法:求和、最大值、最小值、取整、求余等等;位运算包含了连续变量的计数、分类变量的频数,众数、中位、分位;位与值的统一运算:算术平均值,中位值、分位值。

二是从连续变量的计数到分类变量的频数,在具体算法中,确定出频率=当前频数/总频数,由频率与概率、权重、比例的本质关系统一。

上述中的计数、频数、连续变量、分类变量、值运算、位运算、值与位统一运算和加权计算都属于绝对分析的范畴,还有相对分析(或称差异分析),其中包含了极差,四分位差,全距,异众比率,平均差(差的绝对值),方差(差的平方),标准差,离散系数等内容,因此由绝对分析和相对分析两大模块内容共同构成了静态平均分析的主体部分。

精确统计分析除了静态的平均分析以外,另一部分则由动态平均分析构成,其研究的主体是以时间序列为主要对象,时间序列的算法本质是还是加权算法,同样可由数形结合的双标法完成分析过程,其中包含了以下几个方面:时期序列的序时平均数、间隔相等的连续时点序列、间隔不等的连续时点序列、间隔相等的间断时点序列、相对时间序列除此之外,动态平均分析还通过相对减法和相对除法方式完成增长分析和速度分析

第三部分,也是现代统计学的核心,建立在研究随机变量上的模糊数学范畴,模糊数学的构建基石是以平均值为入口点,因此我们学习的切入点,从随机变量的稳定性实验中,由差的绝对值(平均差)和差的平方(方差)的几何意义开始导入回归概念,由水平线性的差的平方进入到任意线性的差的平方,即线性回归。

从线性回归进入学习回归分析,在方差的理解上,结合回归核心算法内容:最小二乘法。在具体学习过程中,我们可分别通过公式法、规划求解法、图表展示法和线性函数法来学习最小二乘值的计算,在由一元线性回归转入二元线性回归的学习,其中公式法是学习重中之重,通过公式求自由度df、回归方SSR、残差方SSE、离差方SST、拟合度R、线性关系F检验,线性关系T检验、、置信区间公式计算。

由拟合度R可以转入对相关分析的具体学习模块,由线性关系F检验和线性关系T检验转入对假设检验的具体学习模块,由置信区间的计算转入对参数估计的具体学习模块,由回归方SSR、残差方SSE和离差方SST转入对方差分析的具体学习模块。

总体上看,统计学架构在传统数学和应用数学上,载体分别由纸质和计算机完成。传统的统计学部分分别以组合排列学和条件概率为基础的概率学,案例取自传统的概率经典实验。现代的统计学要基于计算机技术上的应用型数学的研究,分别从精确和模糊數学角度进行展开。在精确数学角度方面,确认以平均值为核心的研究方法,结合绝对与相对的思维,位与值的统一思想,加权算法、数形结合的双标法应用;在模糊数学角度方面,应用型随机数学的开篇从稳定性实验阐释差的绝对值和差的平方进入,以采用最小二乘算法的回归内容为核心,采用了公式法,规划法、图形法和函数法来剖析各个参数的具体操作和意义,并由此进入现代统计的各个模块的学习。最后,在统计学的实际教学过程中,可分上下学期,上学期教授的主要内容以概率学和精确统计分析为研究的主要内容,下学期则以研究随机变量的模糊统计分析进行展开。

猜你喜欢

概率架构统计学
基于云控平台雾计算架构的网联汽车路径控制
概率与统计(1)
概率与统计(2)
大数据的统计学基础分析
统计学教学与实验实践的一体化整合初探
概率与统计解答题集锦
省属地方高校应用统计学专业人才培养模式研究
VIE:从何而来,去向何方
企业架构的最佳实践
难以一致的统计结果