两样本t检验和置信区间示例

有时在统计学中，看到问题的解决例子是很有帮助的。这些例子可以帮助我们找出类似的问题。在本文中，我们将介绍对两种总体平均数的结果进行推断统计的过程。我们不仅将看到如何对两个总体均值的差异进行假设检验，还将为这种差异构造一个置信区间。我们使用的方法有时称为两样本t检验和两样本t置信区间。...

有时在统计学中，看到问题的解决例子是很有帮助的。这些例子可以帮助我们找出类似的问题。在本文中，我们将介绍对两种总体平均数的结果进行推断统计的过程。我们不仅将看到如何对两个总体均值的差异进行假设检验，还将为这种差异构造一个置信区间。我们使用的方法有时称为两样本t检验和两样本t置信区间。

问题的陈述

假设我们想测试小学生的数学能力。我们可能面临的一个问题是，等级越高，平均考试分数越高。

对27名三年级学生进行简单随机抽样，对他们的答案进行评分，结果平均得分为75分，样本标准差为3分。

对20名五年级学生进行简单随机抽样，进行相同的数学测试，并对他们的答案进行评分。五年级学生的平均分数为84分，样本标准差为5分。

鉴于这种情况，我们提出以下问题：

样本数据是否为我们提供了证据，证明所有五年级学生的平均测试分数超过了所有三年级学生的平均测试分数？
三年级学生和五年级学生的平均考试成绩差异的95%置信区间是多少？

条件和程序

我们必须选择要使用的程序。在进行此操作时，我们必须确保并检查是否满足此程序的条件。我们被要求比较两种人口平均数。可用于实现这一点的一组方法是用于两个样本t程序的方法。

为了对两个样品使用这些t程序，我们需要确保以下条件成立：

我们有两个简单的随机样本，来自两个感兴趣的群体。
我们的简单随机样本不超过人口的5%。
两个样本相互独立，受试者之间没有匹配。
变量是正态分布的。
这两个群体的总体平均值和标准偏差都是未知的。

我们看到这些条件大部分都得到了满足。我们被告知我们有简单的随机样本。我们所研究的人口众多，因为这些年级有数百万学生。

我们无法自动假设的条件是测试分数是否正态分布。由于我们有足够大的样本量，通过t-过程的稳健性，我们不一定需要变量为正态分布。

由于条件满足，我们进行了两次初步计算。

标准误差

标准误差是对标准偏差的估计。对于此统计，我们将样本的样本方差相加，然后取平方根。这给出了公式：

（s1 2/n1+s22/n2）1/2

通过使用上述值，我们可以看到标准误差的值为

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

自由度

我们可以对自由度使用保守近似。这可能低估了自由度的数量，但计算起来要比使用韦尔奇公式容易得多。我们使用两个样本中较小的一个，然后从这个数字中减去一个。

对于我们的示例，两个样本中较小的一个是20。这意味着自由度的数量是20-1=19。

假设检验

我们希望验证一个假设，即五年级学生的平均测试分数大于三年级学生的平均分数。让μ1为所有五年级学生的平均分。同样，我们将μ2作为所有三年级学生的平均分数。

假设如下：

H0：μ1-μ2=0
Ha：μ1-μ2>0

检验统计量是样本均值之间的差值，然后除以标准误差。由于我们使用样本标准差来估计总体标准差，因此测试统计数据来自t分布。

检验统计量值为（84-75）/1.2583。这大约是7点15分。

现在我们确定这个假设检验的p值是多少。我们看一下检验统计量的值，它位于一个具有19个自由度的t分布上。对于这个分布，我们有4.2 x 10-7作为p值。（确定这一点的一种方法是使用Excel中的T.DIST.RT函数。）

因为我们有这么小的p值，我们拒绝了零假设。结论是五年级学生的平均考试成绩高于三年级学生的平均考试成绩。

置信区间

由于我们已经确定平均分数之间存在差异，我们现在确定这两个平均值之间差异的置信区间。我们已经有了很多我们需要的东西。差异的置信区间需要有估计值和误差幅度。

两种平均数之差的估计值很容易计算。我们只需找出样本均值的差异。样本均值的差异估计总体均值的差异。

对于我们的数据，样本均值的差异为84–75=9。

误差幅度的计算稍微困难一些。为此，我们需要将适当的统计数据乘以标准误差。我们需要的统计数据可以通过查阅表格或统计软件找到。

再次使用保守近似，我们有19个自由度。对于95%的置信区间，我们看到t*=2.09。我们可以使用Excel中的T.INV函数来计算该值。

现在我们把所有的东西放在一起，我们的误差范围是2.09 x 1.2583，大约是2.63。置信区间为9±2.63。五年级和三年级学生选择的测试间隔为6.37到11.63分。

发表于 2021-10-08 08:13
阅读 ( 326 )
分类：数学

你可能感兴趣的文章

如何在excel中计算基本统计：初学者指南

...type字段中的“1”创建配对t检验。“2”表示方差相等的两样本检验，“3”表示方差不等的两样本检验。（使用后者时，Excel会进行韦尔奇t检验。） ...

发布于 2021-03-12 03:31
阅读 ( 227 )

t分布定义

...这意味着它倾向于产生远离平均值的值。统计学中使用T检验来估计显著性。 t分布告诉你什么？尾重由称为自由度的T分布参数决定，较小的值表示尾重，较大的值表示T分布类似于标准正态分布，平均值为0，标准偏差为1。T...

发布于 2021-06-04 21:23
阅读 ( 410 )

t检验(t-test)和f试验(f-test)的区别

...要对该样本本身进行假设时，就使用了一个样本t检验。两样本t检验这在场景中比单样本t检验更常见。通常，我们要比较两组的平均值。当我们只得到一个样本并且需要对该样本本身进行假设时，也可以使用两样本t检验。我们...

发布于 2021-07-07 02:30
阅读 ( 1052 )

t检验(t-test)和线性回归(linear regression)的区别

T检验和线性回归是与推断统计有关的术语，推断统计是一种统计方法，它通过对一个群体进行一个小的但说明性的样本来帮助我们对该群体进行概括和预测。三种方法通常用于推断统计-置信区间，假设检验和回归分析。测试(tte...

发布于 2021-07-09 15:30
阅读 ( 2251 )

配对t检验(paired t-test)和非配对t检验(unpaired t-test)的区别

...数据做出有关总体参数的决定。统计推断的实现包括假设检验，并讨论统计学家如何利用这个过程来接受或拒绝总体参数的假设。在这种方**下，T检验及其各种类型的问题，即单样本T检验、独立T检验和配对T检验应运而生。成对...

发布于 2021-07-09 20:14
阅读 ( 3171 )

什么是t检验定义、计算、公式和示例(t-test? | definition, calculation, formula and examples)

...，比较一组观察数据的平均值。独立样本T检验：也称为两样本T检验，它需要比较两组不同的观测数据及其平均值。根据测试导体检查特定方向差异的意图，T测试可分为以下两种类型。单尾T检验：用来检验一个总体平均数是否...

发布于 2021-07-10 09:20
阅读 ( 629 )

excel中具有t分布的函数

...1或2。类型-1表示配对t检验，2表示具有相同总体方差的两样本检验，3表示具有不同总体方差的两样本检验。

发布于 2021-09-08 10:39
阅读 ( 387 )

无偏和有偏估计量

...之一是估计未知的总体参数。该估计通过从统计样本构造置信区间来执行。一个问题是，“我们的估计值有多好？”换句话说，“从长远来看，我们估计总体参数的统计过程有多准确。确定估计值的一种方法是考虑它是否无偏。...

发布于 2021-09-23 21:23
阅读 ( 225 )

引导示例

...的人群中的统计样本开始。我们的目标是样本平均值的90%置信区间。尽管用于确定置信区间的其他统计技术假设我们知道总体的平均值或标准偏差，但自举法只需要样本。在本例中，我们假设样本为1、2、4、4、10。引导样...

发布于 2021-09-23 23:14
阅读 ( 177 )

如何在统计中寻找自由度(find degrees of freedom in statistics)

...中经常被忽略，但却是至关重要的细节置信区间和假设检验的运作。自由度的数量没有一个单一的通用公式。然而，在推理统计中，每种类型的过程都有特定的公式。换句话说，我们工作的环境将决定自由度的数量。下面...

发布于 2021-09-24 12:18
阅读 ( 293 )