置信区间：4个常见错误

置信区间是推断统计的关键部分。我们可以使用概率分布中的一些概率和信息，通过使用样本来估计总体参数。置信区间的陈述方式很容易被误解。我们将研究置信区间的正确解释，并调查与此统计领域相关的四个错误。...

置信区间是推断统计的关键部分。我们可以使用概率分布中的一些概率和信息，通过使用样本来估计总体参数。置信区间的陈述方式很容易被误解。我们将研究置信区间的正确解释，并调查与此统计领域相关的四个错误。

woman looking at misleading information in document

什么是置信区间(a confidence interval)？

置信区间可以表示为一系列值或以下形式：

估计±误差范围

置信区间通常以置信水平表示。一般置信水平为90%、95%和99%。

我们将看一个示例，其中我们希望使用样本平均值来推断总体的平均值。假设这导致置信区间在25到30之间。如果我们说，我们95%确信未知总体平均值包含在该区间中，那么我们实际上是说，我们使用一种方法发现了该区间，该方法在95%的时间内成功给出了正确的结果。从长远来看，我们的方法有5%的时间是不成功的。换句话说，我们将无法捕捉到真正的人口，即每20次中只有一次。

错误#1

现在我们来看看在处理置信区间时可能出现的一系列不同错误。关于95%置信水平的置信区间，有一种不正确的说法，即置信区间包含总体真实平均值的概率为95%。

这是一个错误的原因其实很微妙。关于置信区间的关键思想是，所使用的概率与所使用的方法一起进入画面，在确定置信区间时，它指的是所使用的方法。

错误2

第二个错误是将95%置信区间解释为总体中95%的数据值都在该区间内。同样，95%的人谈到了测试方法。

要知道为什么上述陈述是不正确的，我们可以考虑一个正常的人口，标准偏差为1，平均为5。一个样本有两个数据点，每个数据点的值为6，其样本平均值为6。总体平均值的95%置信区间为4.6至7.4。这显然与95%的正态分布不重叠，因此它不会包含95%的人口。

错误3

第三个错误是说95%的置信区间意味着所有可能样本均值的95%都在区间范围内。重新考虑上一节中的示例。任何大小为2且仅包含小于4.6的值的样本的平均值将小于4.6。因此，这些样本均值将不在该特定置信区间内。与此描述匹配的样本占总数的5%以上。所以说这个置信区间占所有样本均值的95%是错误的。

错误4

处理置信区间的第四个错误是认为它们是唯一的错误来源。虽然置信区间有一定的误差范围，但在统计分析中也存在误差。这类错误的几个例子可能是由于实验设计不正确、抽样存在偏差或无法从人群的某个子集获得数据。

发表于 2021-09-27 06:37
阅读 ( 379 )
分类：数学

你可能感兴趣的文章

利用excel的预测功能将历史数据转化为预测

...一个更持久的图形版本以及一个预测值表。该表还包括95%置信区间（也在图表上表示）。 ...

发布于 2021-03-26 11:44
阅读 ( 574 )

如何在excel中计算风险价值（var）？

...于该投资组合，计算给出了超过某个损失阈值的可能性的置信区间。这些数据被投资者用来做决策和制定策略。简单地说，VaR是一个基于概率的估计，以美元计算，在一段时间内预期的最小损失。风险价值的利弊在风险度量...

发布于 2021-06-14 11:58
阅读 ( 425 )

excel中具有t分布的函数

...的函数。除了使用t分布进行直接计算外，Excel还可以计算置信区间并进行假设检验。关于t分布的函数 Excel中有几个函数可以直接使用t分布。给定沿t分布的值，以下函数都返回指定尾部的分布比例。尾部的比例也可以解释...

发布于 2021-09-08 10:39
阅读 ( 388 )

加上四个置信区间

在推断统计中，总体比例的置信区间依赖于标准正态分布，以确定给定总体的未知参数（给定总体的统计样本）。其中一个原因是，对于合适的样本量，标准正态分布在估计二项分布方面做得非常好。这是值得注意的，因为尽...

发布于 2021-09-23 01:32
阅读 ( 156 )

无偏和有偏估计量

...之一是估计未知的总体参数。该估计通过从统计样本构造置信区间来执行。一个问题是，“我们的估计值有多好？”换句话说，“从长远来看，我们估计总体参数的统计过程有多准确。确定估计值的一种方法是考虑它是否无偏。...

发布于 2021-09-23 21:23
阅读 ( 225 )

引导示例

...的人群中的统计样本开始。我们的目标是样本平均值的90%置信区间。尽管用于确定置信区间的其他统计技术假设我们知道总体的平均值或标准偏差，但自举法只需要样本。在本例中，我们假设样本为1、2、4、4、10。引导样...

发布于 2021-09-23 23:14
阅读 ( 177 )

置信区间在推断统计中的应用

...定未知总体参数的值。我们用来估计此参数的值范围称为置信区间。置信区间的形式置信区间由两部分组成。第一部分是总体参数的估计。我们通过使用一个简单的随机样本得到这个估计。从这个样本中，我们计算与我们...

发布于 2021-09-28 16:19
阅读 ( 316 )

如何计算总体标准差(calculate population standard deviation)

...的平方根。它用于确定得出结论（如接受或拒绝假设）的置信区间。稍微复杂一点的计算称为样本标准偏差。这是一个如何计算方差和总体标准差的简单示例。首先，让我们回顾一下如何计算总体标准偏差：计算平均值（数...

发布于 2021-10-01 13:34
阅读 ( 476 )

置信区间和置信水平

置信区间是定量社会学研究中常用的一种估计方法。这是一个估计值范围，可能包括正在计算的总体参数。例如，我们可以说平均年龄在23到28岁之间，而不是将某一人群的平均年龄估计为25.5岁这样的单一值。这个置信区间包含...

发布于 2021-10-03 03:05
阅读 ( 237 )

均值的置信区间示例

推断统计学的主要部分之一是开发计算置信区间的方法。置信区间为我们提供了一种估计总体参数的方法。我们不是说参数等于一个精确的值，而是说参数在一个值的范围内。这个值范围通常是一个估计值，以及我们从估计值...

发布于 2021-10-06 10:47
阅读 ( 275 )