如何构造总体比例的置信区间(construct a confidence interval for a population proportion)

置信区间可用于估计若干总体参数。人口比例是一种可以用推断统计估计的参数。例如,我们可能想知道支持某项立法的美国人口的百分比。对于这类问题,我们需要找到一个置信区间。...

置信区间可用于估计若干总体参数。人口比例是一种可以用推断统计估计的参数。例如,我们可能想知道支持某项立法的美国人口的百分比。对于这类问题,我们需要找到一个置信区间。

Formula for confidence interval for population proportion

在本文中,我们将了解如何为人口比例构建置信区间,并检验其背后的一些理论。

总体框架

我们先看大局,然后再谈细节。我们将考虑的置信区间类型如下:

估计+/-误差幅度

这意味着我们需要确定两个数字。这些值是所需参数的估计值以及误差范围。

条件

在进行任何统计测试或程序之前,务必确保满足所有条件。对于人口比例的置信区间,我们需要确保以下条件成立:

  • 我们有一个简单的随机样本大小n从一个大的人口
  • 我们的个体是独立选择的。
  • 我们的样本中至少有15个成功案例和15个失败案例。

如果最后一项不满意,则可以稍微调整我们的样品,并使用+4置信区间。在下文中,我们将假设上述所有条件均已满足。

样本和人口比例

我们从人口比例的估计开始。正如我们使用样本均值来估计总体均值一样,我们也使用样本比例来估计总体比例。人口比例是一个未知参数。样本比例是一种统计数据。这个统计数据是通过计算样本中成功的人数,然后除以样本中的总人数得到的。

人口比例用p表示,不言自明。样本比例的符号更复杂一些。我们将样本比例表示为p̂,我们将此符号读作“p-hat”,因为它看起来像字母p,顶部有一顶帽子。

这将成为我们置信区间的第一部分。p的估计值为p̂。

样本比例的抽样分布

为了确定误差范围的公式,我们需要考虑p̂的抽样分布。我们需要知道平均值、标准偏差和我们正在处理的特定分布。

p̂的抽样分布是一个二项分布,具有p和n试验成功的概率。这类随机变量的平均值为p,标准偏差为(p(1-p)/n)0.5。这有两个问题。

第一个问题是,二项分布可能很难处理。阶乘的存在会导致一些非常大的数字。这就是条件帮助我们的地方。只要我们的条件满足,我们就可以用标准正态分布估计二项分布。

第二个问题是p的标准差在定义中使用了p。未知总体参数将通过使用该参数作为误差范围来估计。这种循环推理是一个需要解决的问题。

解决这一难题的办法是用标准误差代替标准偏差。标准误差基于统计数据,而不是参数。标准误差用于估计标准偏差。这个策略的价值在于我们不再需要知道参数p的值。

公式

为了使用标准误差,我们将未知参数p替换为统计量p̂。结果是人口比例置信区间的以下公式:

p̂+/-z*(p̂(1-p̂))/n)0.5。

这里z*的值由我们的置信水平C决定。对于标准正态分布,标准正态分布的准确C%在-z*和z*之间。z*的常用值包括1.645表示90%置信度,1.96表示95%置信度。

实例

让我们通过一个例子来看看这个方法是如何工作的。假设我们希望以95%的信心了解一个自称民主的县的百分之九十五的选民。我们对该县100人进行了简单的随机抽样,发现其中64人是民主党人。

我们看到所有条件都得到满足。我们的人口比例估计为64/100=0.64。这是样本比例p̂的值,它是置信区间的中心。

误差范围由两部分组成。第一个是z*。正如我们所说,对于95%的置信度,z*的值=1.96。

误差裕度的另一部分由公式(p̂(1-p̂)/n)0.5给出。我们将p̂=0.64,并计算标准误差为(0.64(0.36)/100)0.5=0.048。

我们将这两个数字相乘,得到0.09408的误差幅度。最终结果是:

0.64 +/- 0.09408,

或者我们可以将其改写为54.592%到73.408%。因此,我们有95%的信心,民主党的实际人口比例在这些百分比的范围内。这意味着从长远来看,我们的技术和配方将捕获95%的人口比例。

相关理念

有许多想法和主题与这种类型的置信区间有关。例如,我们可以对人口比例的值进行假设检验。我们还可以比较两个不同群体的两个比例。

  • 发表于 2021-10-07 19:15
  • 阅读 ( 486 )
  • 分类:数学

你可能感兴趣的文章

如何在excel中计算风险价值(var)?

风险价值(VaR)是风险评估和风险管理中最广为人知的度量方法之一。风险管理的目标是识别和理解风险敞口,衡量风险,然后应用知识应对这些风险。 风险价值(var)解释 VaR度量显示了过去损失的正态分布。该度量通常应...

  • 发布于 2021-06-14 11:58
  • 阅读 ( 424 )

excel中具有t分布的函数

...及人口参数的估计。该估计采用置信区间的形式。例如,总体平均值的估计是样本平均值。估计值也有误差范围,Excel将进行计算。对于这个误差范围,我们必须使用CONFIDENCE.T函数。 Excel的文档说明函数CONFIDENCE.T使用Student的T分...

  • 发布于 2021-09-08 10:39
  • 阅读 ( 387 )

加上四个置信区间

在推断统计中,总体比例的置信区间依赖于标准正态分布,以确定给定总体的未知参数(给定总体的统计样本)。其中一个原因是,对于合适的样本量,标准正态分布在估计二项分布方面做得非常好。这是值得注意的,因为尽...

  • 发布于 2021-09-23 01:32
  • 阅读 ( 156 )

无偏和有偏估计量

...总体比例的置信区间。 方法示例 为了了解这个想法是如何运作的,我们将研究一个与平均数有关的例子。统计数字 (X1+X2+…+Xn)/n 被称为样本均值。我们假设随机变量是来自同一分布的随机样本,平均值为μ。这意味着...

  • 发布于 2021-09-23 21:23
  • 阅读 ( 225 )

置信区间:4个常见错误

...使用概率分布中的一些概率和信息,通过使用样本来估计总体参数。置信区间的陈述方式很容易被误解。我们将研究置信区间的正确解释,并调查与此统计领域相关的四个错误。 什么是置信区间(a confidence interval)? 置信区间...

  • 发布于 2021-09-27 06:37
  • 阅读 ( 378 )

置信区间在推断统计中的应用

...一人群进行推断。推断统计学的一个具体目标是确定未知总体参数的值。我们用来估计此参数的值范围称为置信区间。 置信区间的形式 置信区间由两部分组成。第一部分是总体参数的估计。我们通过使用一个简单的随机样...

  • 发布于 2021-09-28 16:19
  • 阅读 ( 314 )

如何计算总体标准差(calculate population standard deviation)

...区间。稍微复杂一点的计算称为样本标准偏差。这是一个如何计算方差和总体标准差的简单示例。首先,让我们回顾一下如何计算总体标准偏差: 计算平均值(数字的简单平均值)。 对于每个数字:减去平均值。将结果平方...

  • 发布于 2021-10-01 13:34
  • 阅读 ( 474 )

如何求解比例以调整配方(solve proportions to adjust a recipe)

比例是一组相互相等的两个分数。本文重点介绍如何解决比例问题。 比例在现实世界中的应用 修改从3个地点扩展到20个地点的餐饮连锁店的预算根据蓝图建造摩天大楼计算小费、佣金和销售税 使用比例修改配方 星期...

  • 发布于 2021-10-05 02:19
  • 阅读 ( 203 )

当你知道西格玛时,计算平均值的置信区间

...说明与您的置信区间相关的置信水平。 实例 要了解如何构造置信区间,请通过一个示例。假设你知道所有大学新生的智商分数都是正态分布,标准差为15。你有一个100名新生的简单随机样本,这个样本的平均智商分数是120。...

  • 发布于 2021-10-07 01:02
  • 阅读 ( 203 )

两个总体比例之差的置信区间

...投票人口与女性投票人口的百分比差异。 我们将看到如何通过为两个总体比例的差异构建置信区间来进行此类计算。在这个过程中,我们将研究这个计算背后的一些理论。我们将看到,在如何构造单个总体比例的置信区间以...

  • 发布于 2021-10-07 13:03
  • 阅读 ( 310 )
佬啰嗦
佬啰嗦

0 篇文章