推断统计学的主要部分之一是开发计算置信区间的方法。置信区间为我们提供了一种估计总体参数的方法。我们不是说参数等于一个精确的值,而是说参数在一个值的范围内。这个值范围通常是一个估计值,以及我们从估计值中加上和减去的误差幅度。
每一次间隔都伴随着一定程度的自信。从长远来看,置信水平可以衡量获得置信区间的方法捕捉真实总体参数的频率。
在学习统计学时,看到一些例子是有用的。下面我们将看几个关于总体平均值的置信区间示例。我们将看到,我们用来构建均值置信区间的方法取决于关于总体的进一步信息。具体来说,我们采取的方法取决于我们是否知道总体标准偏差。
我们从25只特定种类的蝾螈的简单随机样本开始,测量它们的尾巴。我们样品的平均尾长为5厘米。
我们首先分析每一个问题。在前两个问题中,我们知道总体标准偏差的值。这两个问题之间的区别在于#2的信心水平高于#1。
在后两个问题中,总体标准差是未知的。对于这两个问题,我们将使用样本标准偏差来估计该参数。正如我们在前两个问题中看到的,这里我们也有不同程度的信心。
我们将计算上述每个问题的解决方案。
在比较这些解决方案时,有几点需要注意。第一个是,在每种情况下,随着我们信心水平的提高,我们最终得到的z或t值越大。这样做的原因是,为了更加确信我们确实在置信区间内捕获了总体平均值,我们需要一个更宽的区间。
另一个需要注意的特征是,对于特定的置信区间,使用t的置信区间比使用z的置信区间宽。这是因为t分布的尾部比标准正态分布具有更大的可变性。
正确解决这类问题的关键是,如果我们知道总体标准偏差,我们就使用z分数表。如果我们不知道总体标准偏差,那么我们使用t分数表。
...缺失点的标准方法是插值,它使用缺失点相邻值的加权平均值。这是一个很好的选择,尤其是考虑到它是你唯一的选择。 ...
...析数据时,异常值会使结果产生偏差。例如,数据集的平均值可能真正反映了您的值。Excel提供了一些有用的函数来帮助管理异常值,让我们来看看。 一个简单的例子 在下图中,异常值很容易发现分配给Eric的值2和分配给Ryan的...
...称的,但它有较重的尾部,这意味着它倾向于产生远离平均值的值。 统计学中使用T检验来估计显著性。 t分布告诉你什么? 尾重由称为自由度的T分布参数决定,较小的值表示尾重,较大的值表示T分布类似于标准正态分布,...
...值或表示了一系列值。这两个术语总是以一组测量值的平均值出现。 有趣的是,SE与标准、错误或科学数据的交流无关。 仔细研究SD和SE的起源和解释,就会发现,为什么专业统计学家和那些草率使用它的人都会犯错。 标准差(...
...。 一个种群的正态钟形曲线可以用两个参数来表征,平均值和变异量(用方差和标准差表示)。 这些参数用以下符号表示:µ 对于平均值,σ2表示差异,以及σ 标准偏差。用于指示总体大小的参数由N表示。 这是为了一个群体...
...参数的估计。该估计采用置信区间的形式。例如,总体平均值的估计是样本平均值。估计值也有误差范围,Excel将进行计算。对于这个误差范围,我们必须使用CONFIDENCE.T函数。 Excel的文档说明函数CONFIDENCE.T使用Student的T分布返回...
...数有关的例子。统计数字 (X1+X2+…+Xn)/n 被称为样本均值。我们假设随机变量是来自同一分布的随机样本,平均值为μ。这意味着每个随机变量的期望值为μ。 当我们计算统计数据的预期值时,我们会看到以下内容: E[(X...
...一无所知的人群中的统计样本开始。我们的目标是样本平均值的90%置信区间。尽管用于确定置信区间的其他统计技术假设我们知道总体的平均值或标准偏差,但自举法只需要样本。 在本例中,我们假设样本为1、2、4、4、10。 ...
...95%和99%。 我们将看一个示例,其中我们希望使用样本平均值来推断总体的平均值。假设这导致置信区间在25到30之间。如果我们说,我们95%确信未知总体平均值包含在该区间中,那么我们实际上是说,我们使用一种方法发现了...
...同的总体格式统一起来。一些常见的置信区间是一个总体均值、总体方差、总体比例、两个总体均值之差和两个总体比例之差的置信区间。