加上四个置信区间

在推断统计中,总体比例的置信区间依赖于标准正态分布,以确定给定总体的未知参数(给定总体的统计样本)。其中一个原因是,对于合适的样本量,标准正态分布在估计二项分布方面做得非常好。这是值得注意的,因为尽管第一个分布是连续的,但第二个分布是离散的。...

在推断统计中,总体比例的置信区间依赖于标准正态分布,以确定给定总体的未知参数(给定总体的统计样本)。其中一个原因是,对于合适的样本量,标准正态分布在估计二项分布方面做得非常好。这是值得注意的,因为尽管第一个分布是连续的,但第二个分布是离散的。

Businesswoman viewing graphs on digital tablet in business meeting

在构建比例置信区间时,必须解决许多问题。其中一个是所谓的“加四”置信区间,它会导致有偏估计。然而,这种未知人口比例的估计在某些情况下比无偏估计性能更好,尤其是在数据中没有成功或失败的情况下。

在大多数情况下,估计总体比例的最佳尝试是使用相应的样本比例。我们假设有一个群体,其个体的未知比例p包含某个特征,然后我们从该群体中形成一个大小为n的简单随机样本。在这n个个体中,我们统计了其中拥有我们所好奇的特质的Y个个体的数量。现在我们用我们的样本来估计p。样本比例Y/n是p的无偏估计量。

何时使用正四置信区间

当我们使用加四区间时,我们修改了p的估计量。我们通过在观察总数中添加四个来实现这一点,从而解释了短语“加四”。然后,我们将这四个观察结果分为两个假设的成功和两个失败,这意味着我们在成功总数中添加了两个。最终结果是,我们用(Y+2)/(n+4)替换每个Y/n实例,有时这个分数用p表示,上面有一个波浪号。

样本比例在估计总体比例时通常非常有效。然而,在某些情况下,我们需要稍微修改估计量。统计实践和数学理论表明,对+4区间的修改是实现这一目标的合适方法。

一个应该使我们考虑加四区间的情况是一个不平衡的样本。很多时候,由于人口比例太小或太大,样本比例也非常接近0或非常接近1。在这种情况下,我们应该考虑加四区间。

使用+4间隔的另一个原因是如果我们的样本量很小。在这种情况下,与使用比例的典型置信区间相比,加四区间可以更好地估计总体比例。

使用加四置信区间的规则

加上四个置信区间是一种几乎神奇的方法,可以更准确地计算推断统计数据,因为只需将四个虚拟观测值添加到任何给定数据集,两个成功和两个失败,它就能够更准确地预测符合参数的数据集的比例。

然而,正四置信区间并不总是适用于所有问题。只有当数据集的置信区间大于90%且总体样本量至少为10%时,才能使用该方法。然而,数据集可以包含任意数量的成功和失败,尽管在任何给定人口的数据中没有成功或失败的情况下,它确实工作得更好。

请记住,与常规统计的计算不同,推断统计的计算依赖于数据抽样来确定人群中最可能的结果。尽管加上四个置信区间可以纠正较大的误差幅度,但仍必须考虑该幅度,以提供最准确的统计观察结果。

  • 发表于 2021-09-23 01:32
  • 阅读 ( 157 )
  • 分类:数学

你可能感兴趣的文章

利用excel的预测功能将历史数据转化为预测

...以得到更好的数据(我们使用4,因为每个重复周期中有四个点)。以下是自动季节性检测的预测结果: ...

  • 发布于 2021-03-26 11:44
  • 阅读 ( 575 )

如何在gbm中使用montecarlo模拟

...。股票价格遵循一系列步骤,其中每个步骤都是一个漂移加上或减去一个随机冲击(本身是股票标准差的函数): 图1 2.生成随机试验 有了模型规范,我们就可以进行随机试验。为了说明这一点,我们使用microsoftexcel进行...

  • 发布于 2021-06-12 06:33
  • 阅读 ( 163 )

如何在excel中计算风险价值(var)?

...于该投资组合,计算给出了超过某个损失阈值的可能性的置信区间。这些数据被投资者用来做决策和制定策略。简单地说,VaR是一个基于概率的估计,以美元计算,在一段时间内预期的最小损失。 风险价值的利弊 在风险度量...

  • 发布于 2021-06-14 11:58
  • 阅读 ( 426 )

思科股价在盈利之前长期处于阻力位

...加速下行,警告称相对疲弱可能很容易持续到第四季度。加上看跌的短期技术因素,该股现在可能突破区间支撑,并在50个月均线(从40美元上涨)面临考验。 中信建投国际短期图表(2016-2019) 斐波那契网格从2016年的两年...

  • 发布于 2021-06-19 01:03
  • 阅读 ( 98 )

excel中具有t分布的函数

...0.25,16) Excel返回0.1095647。这是误差范围。我们减去,再加上样本均值,我们的置信区间是2.89克到3.11克。 显著性检验 Excel还将执行与t分布相关的假设检验。函数T.TEST返回几个不同显著性测试的p值。T.TEST函数的参数为: ...

  • 发布于 2021-09-08 10:39
  • 阅读 ( 388 )

无偏和有偏估计量

...实际情况下,有偏估计量是有用的。其中一种情况是使用加上四个置信区间来构造总体比例的置信区间。 方法示例 为了了解这个想法是如何运作的,我们将研究一个与平均数有关的例子。统计数字 (X1+X2+…+Xn)/n 被称为...

  • 发布于 2021-09-23 21:23
  • 阅读 ( 225 )

引导示例

...的人群中的统计样本开始。我们的目标是样本平均值的90%置信区间。尽管用于确定置信区间的其他统计技术假设我们知道总体的平均值或标准偏差,但自举法只需要样本。 在本例中,我们假设样本为1、2、4、4、10。 引导样...

  • 发布于 2021-09-23 23:14
  • 阅读 ( 177 )

置信区间:4个常见错误

...将研究置信区间的正确解释,并调查与此统计领域相关的四个错误。 什么是置信区间(a confidence interval)? 置信区间可以表示为一系列值或以下形式: 估计±误差范围 置信区间通常以置信水平表示。​一般置信水平为90%、9...

  • 发布于 2021-09-27 06:37
  • 阅读 ( 379 )

置信区间在推断统计中的应用

... 估计值位于区间的中心,然后我们从该估计值中减去并加上误差幅度,以获得参数的一系列值。 置信水平 每个置信区间都有一个置信水平。这是一个概率或百分比,表明我们的置信区间应具有多大的确定性。如果情况的所...

  • 发布于 2021-09-28 16:19
  • 阅读 ( 316 )

置信区间和置信水平

...可能是21-30岁。 计算置信区间 计算均值的置信水平有四个步骤。 计算平均值的标准误差。确定信心水平(即90%、95%、99%等)。然后,找到相应的Z值。这通常可以通过统计教科书附录中的表格来完成。作为参考,95%置信水...

  • 发布于 2021-10-03 03:05
  • 阅读 ( 238 )
TAN669325679
TAN669325679

0 篇文章

相关推荐