基于配对t 检验计算分差
——Ranney 学校的平均SAT 与官方给出的有无偏差?
2019-10-15高翊玮新泽西州廷顿瀑布兰尼学校
高翊玮 新泽西州廷顿瀑布兰尼学校
一、前言
在申请大学时,SAT 是每个北美高中留学生都会遇到的不可避免的挑战。每年,大学都会提供所有录取申请人的平均SAT 分数,我们想知道这些数据是否符合Ranney 学校的情况以及美国的大学是否会对Ranney 这所优秀的学校降低其SAT 分数标准。
SAT是由美国大学理事会(College Board)开发的标准化测试,并预测学生在大学的学业成功。SAT 的分数范围是400 到1600,根据Fred Zhang 博士的说法,SAT 分数遵循正态分布,全国平均SAT 综合分数为1068。
Ranney 学校是新泽西州的一所独立日制学校,全美私立高中排名前300 名。在Niche 报告的平均SAT 分数是1290,比全国平均值高222 分。我们决定比较和对比Ranney 学生关于SAT 分数的30 个随机学院选择,并比较CollegeBoard 报告的平均SAT 分数与Ranney 申请者的平均SAT 分数有无差异。
二、数据收集和方法
1.通过R 语言将Ranney 学生毕业去向最多的50 所大学以数字代替并用rnorm 公式随机出30 个。在Ranney 简介2018 年的50个录取大学中,将其编号01到50,使用rnorm 随机选择其中30 个(表1)。
2.收集College Board 发表的30 所大学的平均SAT 分数以及对应在Naviance 网站上收集Ranney 学生的平均SAT,其中列出了Ranney 申请人关于大学的所有SAT 分数。
3.计算差异以及使用配对t 检验比对alpha 值(列出所有平均SAT 分数后,计算30 所大学的两个分数之间的差异)
此处我们提出假设:
H0:μdiff= 0
H1:μdiff ≠0(双尾测试)
对于假设中的定义为:
零假设:CollegeBoard 报告的平均SAT 分数与Ranney 申请者的平均SAT 分数之间的真实平均差异为零,这意味着平均分数之间没有差异。
另类假设:CollegeBoard 报告的平均SAT 分数与Ranney 申请人的平均SAT 分之间的真实平均差异不为零,这意味着平均分数之间存在差异。
三、数据分析
使用配对t 检验的条件:
1.配对数据条件:每个大学的平均SAT 分数和Ranney 申请生的SAT 分数相配对,因为每个值是CollegeBoard 网站和Naviance网站上同一所大学的平均SAT 分数。
2.独立性假设:任何大学的平均SAT 分数独立于其他大学,因此差异是相互独立的。
3.随机化条件:从50 所大学中随机选择30 所。
4.接近正常条件:SAT 平均得分差异的直方图是单峰的并且大致对称(如图1)。
图1 平均分差的直方图
由于所有条件都已满足,因此可以进行匹配t 检验。
以下为基于以上数据的计算过程:
四、结论
由于p 值=0.3774 大于α= 0.05 的显着性水平,所以不能拒绝零假设。这里没有足够的证据证明CollegeBoard 报告的30 个大学的平均SAT 分数与本科申请的Ranney 申请者的平均SAT 分数之间存在显着差异。 CollegeBoard 报告的平均SAT 分数与公认的Ranney 申请者的平均SAT 分数之间的真正平均差异为零。在实际意义中,这意味着针对Ranney 学校这所有着良好声誉的私立高中,大学并没有因此而降低其SAT 分数标准。
注:这份研究中,计算过程中的潜在问题是每个样本中包含的数据相对较低。例如,申请宾夕法尼亚大学的申请人只有13 人,这可能会因人口相对较少而导致结果偏差。此外,数据源是准确的,因为它来自Ranney School Naviance 官网和CollegeBoard。结果是合乎逻辑的并且是并被精确计算并验证的。