方差分析计算示例

单因素方差分析(也称为ANOVA)为我们提供了一种对几种总体均值进行多重比较的方法。我们可以同时考虑所有正在考虑的方法,而不是两两进行。为了进行方差分析测试,我们需要比较两种变异,样本均值之间的变异,以及每个样本内的变异。...

单因素方差分析(也称为ANOVA)为我们提供了一种对几种总体均值进行多重比较的方法。我们可以同时考虑所有正在考虑的方法,而不是两两进行。为了进行方差分析测试,我们需要比较两种变异,样本均值之间的变异,以及每个样本内的变异。

The mean lengths of the flower petals of three varieties of a species can be compared using ANOVA. ANOVA answers the question, "Is the variation in these lengths due to chance from the sample, or does it reflect a difference from the population?"

我们将所有这些变化组合成一个单一的统计数据,称为​F统计,因为它使用F分布。我们通过将样本之间的变化除以每个样本内的变化来实现这一点。实现这一点的方法通常由软件处理,然而,看到这样的计算结果是有价值的。

在接下来的事情中很容易迷失方向。下面是我们将在下面的示例中遵循的步骤列表:

  1. 计算每个样本的样本均值以及所有样本数据的均值。
  2. 计算误差平方和。在每个样本中,我们将每个数据值与样本平均值的偏差平方。所有平方偏差之和为误差平方和,缩写为SSE。
  3. 计算治疗的平方和。我们将每个样本平均值与总平均值的偏差平方。所有这些平方偏差的总和乘以我们拥有的样本数。这个数字是治疗的平方和,缩写为SST。
  4. 计算自由度。自由度的总数比我们样本中数据点的总数少一个,即n-1。治疗自由度的数量比使用的样本数量少一个,或m-1。误差自由度的数量是数据点的总数减去样本数,或n-m。
  5. 计算误差的均方。这表示为MSE=SSE/(n-m)。
  6. 计算治疗的均方。这表示为MST=SST/m-`1。
  7. 计算F统计量。这是我们计算的两个均方的比率。因此F=MST/MSE。

软件可以很容易地完成这一切,但最好知道幕后发生了什么。在下面的内容中,我们按照上面列出的步骤计算出一个方差分析示例。

数据和抽样方法

假设我们有四个满足单因素方差分析条件的独立总体。我们希望检验零假设H0:μ1=μ2=μ3=μ4。为了这个例子的目的,我们将从每个被研究的群体中使用三个样本。我们样本的数据如下:

  • 来自人群的样本#1:12,9,12。样本平均数为11。
  • 来自人群的样本#2:7,10,13。样本平均数为10。
  • 来自人群的样本#3:5,8,11。样本平均数为8。
  • 来自人群的样本#4:5,8,8。样本平均数为7。

所有数据的平均值为9。

误差平方和

我们现在计算每个样本平均值的平方偏差之和。这称为误差平方和。

  • 对于来自人群1的样本:(12-11)2+(9-11)2+(12-11)2=6
  • 对于来自人口#2的样本:(7-10)2+(10-10)2+(13-10)2=18
  • 对于来自人群#3的样本:(5-8)2+(8-8)2+(11-8)2=18
  • 对于来自人口4的样本:(5-7)2+(8-7)2+(8-7)2=6。

然后我们将所有这些偏差平方和相加,得到6+18+18+6=48。

处理平方和

现在我们计算治疗的平方和。在这里,我们查看每个样本平均值与总体平均值的平方偏差,并将该数字乘以小于总体数量的1:

3[(11 – 9)2 + (10 – 9)2 +(8 – 9)2 + (7 – 9)2] = 3[4 + 1 + 1 + 4] = 30.

自由度

在进行下一步之前,我们需要自由度。共有12个数据值和4个样本。因此,治疗的自由度为4–1=3。误差自由度为12–4=8。

均方

现在我们将平方和除以适当的自由度,以获得均方。

  • 治疗的均方为30/3=10。
  • 误差的均方为48/8=6。

f统计量

最后一步是将处理的均方除以误差的均方。这是数据中的F统计。因此,对于我们的示例,F=10/6=5/3=1.667。

数值表或软件可用于确定仅凭偶然机会获得与该值一样极端的F统计量值的可能性。

  • 发表于 2021-10-07 10:02
  • 阅读 ( 215 )
  • 分类:数学

你可能感兴趣的文章

如何在excel中进行基础数据分析

...cel的描述性统计数据。这将为您提供有关均值、中位数、方差、标准差和误差、峰度、偏度和各种其他数字的信息。 ...

  • 发布于 2021-03-12 01:13
  • 阅读 ( 478 )

业务分析回归基础

...的工具。我们将从学习回归的核心原则开始,首先学习协方差和相关性,然后继续构建和解释回归输出。流行的商业软件,如microsoftexcel,可以为您完成所有的回归计算和输出,但学习底层机制仍然很重要。 关键要点 例如...

  • 发布于 2021-06-02 15:34
  • 阅读 ( 163 )

t检验

...次抛硬币结果的数据集,将遵循正态分布,可能有未知的方差。t检验被用作假设检验工具,它允许检验适用于人群的假设。 t检验检查t统计量、t分布值和自由度以确定统计显著性。要用三种或三种以上的平均数进行检验,必...

  • 发布于 2021-06-04 13:19
  • 阅读 ( 249 )

样本方差和总体方差

...限的,同样地,它们可以是存在的,也可以是假设的。 方差:方差是一个数值,它显示了一组数据中单个数字的平均分布范围。这就是每个数字离平均值有多远,也就是说每个数字离平均值也有多远。零值的方差意味着所有数...

  • 发布于 2021-06-24 14:54
  • 阅读 ( 206 )

单因素方差分析(one way anova)和双向方差分析(two way anova)的区别

方差分析(anova) 方差分析指两组间的关系分析;自变量和因变量。它基本上是一种统计工具,用于在实验数据的基础上检验假设。我们可以用方差分析来确定两个变量之间的关系;饮食习惯为自变量,健康状况为因变量。 单...

  • 发布于 2021-06-24 15:48
  • 阅读 ( 583 )

方差分析(anova)和无症状(anocva)的区别

...分析给定的数据或样本,无论是一个变量还是多个变量。方差分析(anova) vs. 无症状(anocva)ANOVA和ANOCVA的区别在于ANOVA(方差分析)研究统计数据的方差进行分析,ANOCVA(协方差分析)研究统计数据的协方差进行分析。也就是说,如...

  • 发布于 2021-07-07 04:47
  • 阅读 ( 446 )

样本方差(sample variance)和总体方差(population variance)的区别

...个研究小组的重要组成部分。因此,研究者经常使用样本方差和总体方差来分析数据集的不同度量。尽管表面上这两个过程都使用代数计算公式,但它们的工作原理不同。由于这个原因,许多人对这些过程感到困惑,并且经常相...

  • 发布于 2021-07-09 18:53
  • 阅读 ( 2745 )

t检验(t-test)和方差分析(anova)的区别

...集和计算统计信息总是一个漫长而累人的过程。t检验和方差分析是两种最常用的测量方法。t检验用于检验两个中心或两种方式是否接近或不同。当看到至少三个中间产物或平均值时,方差分析是有利的。另一个工具被使用,这...

  • 发布于 2021-07-11 13:12
  • 阅读 ( 806 )

方差分析(anova)和曼诺瓦(manova)的区别

...表变量分析,MANOVA代表变量的多元分析。用于计算均值的方差分析方法只包含一个因变量,而用于计算均值的MANOVA方法包含多个因变量。它基本上用于确定变量组中是否存在任何差异,或者是否存在多个因变量。这就是它与方差...

  • 发布于 2021-07-11 14:56
  • 阅读 ( 906 )

统计分析中渐近方差的定义

估计量的渐近方差的定义可能因作者或情况而异。Greene第109页等式(4-39)中给出了一个标准定义,描述为“几乎适用于所有应用”。给出的渐近方差定义为: asy var(t_hat) = (1/n) * limn->infinity E[ {t_hat - limn->infinity E[t_hat] }2 ]...

  • 发布于 2021-09-24 22:50
  • 阅读 ( 409 )
rilcqllx
rilcqllx

0 篇文章

相关推荐