均值的置信区间示例

推断统计学的主要部分之一是开发计算置信区间的方法。置信区间为我们提供了一种估计总体参数的方法。我们不是说参数等于一个精确的值，而是说参数在一个值的范围内。这个值范围通常是一个估计值，以及我们从估计值中加上和减去的误差幅度。...

推断统计学的主要部分之一是开发计算置信区间的方法。置信区间为我们提供了一种估计总体参数的方法。我们不是说参数等于一个精确的值，而是说参数在一个值的范围内。这个值范围通常是一个估计值，以及我们从估计值中加上和减去的误差幅度。

每一次间隔都伴随着一定程度的自信。从长远来看，置信水平可以衡量获得置信区间的方法捕捉真实总体参数的频率。

在学习统计学时，看到一些例子是有用的。下面我们将看几个关于总体平均值的置信区间示例。我们将看到，我们用来构建均值置信区间的方法取决于关于总体的进一步信息。具体来说，我们采取的方法取决于我们是否知道总体标准偏差。

问题陈述

我们从25只特定种类的蝾螈的简单随机样本开始，测量它们的尾巴。我们样品的平均尾长为5厘米。

如果我们知道0.2 cm是种群中所有蝾螈尾巴长度的标准偏差，那么种群中所有蝾螈平均尾巴长度的90%置信区间是多少？
如果我们知道0.2 cm是种群中所有蝾螈尾巴长度的标准偏差，那么种群中所有蝾螈平均尾巴长度的95%置信区间是多少？
如果我们发现0.2 cm是样本总体中蝾螈尾巴长度的标准偏差，那么总体中所有蝾螈平均尾巴长度的90%置信区间是多少？
如果我们发现0.2 cm是样本群体中蝾螈尾长的标准偏差，那么群体中所有蝾螈尾长的95%置信区间是多少？

问题的讨论

我们首先分析每一个问题。在前两个问题中，我们知道总体标准偏差的值。这两个问题之间的区别在于#2的信心水平高于#1。

在后两个问题中，总体标准差是未知的。对于这两个问题，我们将使用样本标准偏差来估计该参数。正如我们在前两个问题中看到的，这里我们也有不同程度的信心。

解决

我们将计算上述每个问题的解决方案。

因为我们知道总体标准偏差，所以我们将使用z分数表。对应于90%置信区间的z值为1.645。通过使用误差幅度公式，我们的置信区间为5–1.645（0.2/5）到5+1.645（0.2/5）。（分母中的5是因为我们取了25的平方根）。执行该算法后，我们将4.934 cm至5.066 cm作为总体平均值的置信区间。
因为我们知道总体标准偏差，所以我们将使用z分数表。对应于95%置信区间的z值为1.96。通过使用误差裕度公式，我们的置信区间为5–1.96（0.2/5）到5+1.96（0.2/5）。执行该算法后，我们将4.922 cm至5.078 cm作为总体平均值的置信区间。
这里我们不知道总体标准偏差，只知道样本标准偏差。因此，我们将使用t分数表。当我们使用t分数表时，我们需要知道我们有多少自由度。在这种情况下，有24个自由度，比样本量25小一个。对应于90%置信区间的t值为1.71。通过使用误差裕度公式，我们的置信区间为5–1.71（0.2/5）到5+1.71（0.2/5）。执行该算法后，我们将4.932 cm至5.068 cm作为总体平均值的置信区间。
这里我们不知道总体标准偏差，只知道样本标准偏差。因此，我们将再次使用t分数表。有24个自由度，比25个样本小一个。对应于95%置信区间的t值为2.06。通过使用误差裕度公式，我们的置信区间为5–2.06（0.2/5）到5+2.06（0.2/5）。执行该算法后，我们将4.912 cm至5.082 cm作为总体平均值的置信区间。