总体方差表示如何分布数据集。不幸的是,通常不可能确切知道这个总体参数是什么。为了弥补我们知识的不足,我们使用了一个来自推断统计的主题,称为置信区间。我们将看到一个如何计算总体方差置信区间的示例。
关于总体方差的(1-α)置信区间的公式。由以下一系列不等式给出:
[(n-1)s2]/B<;σ2<;[(n-1)s2]/A。
这里n是样本量,s2是样本方差。数字A是具有n-1个自由度的卡方分布点,此时曲线下面积的α/2正好位于A的左侧。同样,数字B是相同卡方分布点,曲线下面积的α/2正好位于B的右侧。
我们从一个包含10个值的数据集开始。这组数据值是通过一个简单的随机样本获得的:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
需要进行一些探索性数据分析,以表明不存在异常值。通过构建茎叶图,我们发现这些数据可能来自近似正态分布的分布。这意味着我们可以继续寻找总体方差的95%置信区间。
我们需要用样本方差估计总体方差,用s2表示。所以我们从计算这个统计开始。本质上,我们是对平均值的平方偏差之和求平均值。然而,我们不是把这个和除以n,而是把它除以n-1。
我们发现样本平均数为104.2。使用该公式,我们得到了与平均值的平方偏差之和,如下所示:
(97 – 104.2)2 + (75 – 104.3)2 + . . . + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
我们将该总和除以10–1=9,得到277的样本方差。
现在我们来看看卡方分布。因为我们有10个数据值,所以我们有9个自由度。因为我们想要中间95%的分布,所以我们需要两个尾部各有2.5%。我们查阅了卡方表或软件,发现表中2.7004和19.023的值包含了95%的分布面积。这些数字分别是A和B。
我们现在拥有了我们所需要的一切,我们已经准备好集合我们的置信区间。左端点的公式是[(n-1)s2]/B。这意味着我们的左端点是:
(9 x 277)/19.023=133
通过将B替换为A找到右端点:
(9 x 277)/2.7004=923
因此,我们有95%的信心认为人口差异在133到923之间。
当然,由于标准偏差是方差的平方根,因此该方法可用于构建总体标准偏差的置信区间。我们需要做的就是求端点的平方根。结果是标准偏差的95%置信区间。
...降低估计的精度;较低的精度增加了系数估计值偏离正确总体值的可能性。 异质性的基础 在金融学中,股票和债券的价格往往存在条件异方差。这些股票的波动水平在任何时期都无法预测。在讨论具有可识别的季节性变化的...
...正态分布的预测。 最后,VaR计算需要一些统计度量,如方差、协方差和标准差。对于双资产组合,这是相对简单的。然而,对于高度多样化的投资组合来说,复杂性会呈指数增长。 什么是var的计算公式(the formula for var)? VaR...
什么是参数(parameter)? 参数是描述总体某些方面的值。一个参数即使不是不可能也很难确定,特别是在人口众多的情况下。这就是样本和统计数据发挥作用的地方。 然而,一个参数可以在一个非常小的群体中确定,在这个群体...
...及人口参数的估计。该估计采用置信区间的形式。例如,总体平均值的估计是样本平均值。估计值也有误差范围,Excel将进行计算。对于这个误差范围,我们必须使用CONFIDENCE.T函数。 Excel的文档说明函数CONFIDENCE.T使用Student的T分...
...可以使用统计软件程序计算方差和标准偏差。 样本与总体 在进行统计测试时,了解总体和样本之间的差异非常重要。要计算总体的标准偏差(或方差),您需要收集您正在研究的组中每个人的测量值;对于一个样本,您将只...
在推断统计中,总体比例的置信区间依赖于标准正态分布,以确定给定总体的未知参数(给定总体的统计样本)。其中一个原因是,对于合适的样本量,标准正态分布在估计二项分布方面做得非常好。这是值得注意的,因为尽...
推断统计学的目标之一是估计未知的总体参数。该估计通过从统计样本构造置信区间来执行。一个问题是,“我们的估计值有多好?”换句话说,“从长远来看,我们估计总体参数的统计过程有多准确。确定估计值的一种方法...
...间。尽管用于确定置信区间的其他统计技术假设我们知道总体的平均值或标准偏差,但自举法只需要样本。 在本例中,我们假设样本为1、2、4、4、10。 引导样本 我们现在从样本中重新取样并替换,形成所谓的引导样本。每...
...使用概率分布中的一些概率和信息,通过使用样本来估计总体参数。置信区间的陈述方式很容易被误解。我们将研究置信区间的正确解释,并调查与此统计领域相关的四个错误。 什么是置信区间(a confidence interval)? 置信区间...
...一人群进行推断。推断统计学的一个具体目标是确定未知总体参数的值。我们用来估计此参数的值范围称为置信区间。 置信区间的形式 置信区间由两部分组成。第一部分是总体参数的估计。我们通过使用一个简单的随机样...