标准差(standard deviation)和标准误差(standard error)的区别

介绍...

介绍

标准差(SD)和标准误差(SE)是两个看似相似的术语;然而,它们在概念上千差万别,在统计文献中几乎可以互换使用。这两个术语前面通常都有一个加减符号(+/-),表示它们定义了一个对称值或表示了一系列值。这两个术语总是以一组测量值的平均值出现。

有趣的是,SE与标准、错误或科学数据的交流无关。

仔细研究SD和SE的起源和解释,就会发现,为什么专业统计学家和那些草率使用它的人都会犯错。

标准差(SD)

标准差是描述分布扩散的描述性统计。作为一个度量,当数据是正态分布时,它是有用的。然而,当数据高度倾斜或双峰时,它就不那么有用了,因为它不能很好地描述分布的形状。通常,我们在报告样本特征时使用标准差,因为我们打算描述数据在平均值周围的变化程度。描述数据传播的其他有用统计数据包括四分位间距、第25和第75百分位以及数据范围。

图1.SD是数据扩散的度量。当数据是正态分布的样本时,人们期望三分之二的数据在平均值的1个标准差之内。

方差也是一种描述性统计,它被定义为标准差的平方。在描述结果时通常不报告,但它是一个更易于数学处理的公式(也称为方差平方和),在统计计算中起作用。

例如,如果我们有两个统计P&方差已知的Q var(P)&var(Q),那么P+Q之和的方差等于方差之和:var(P)+var(Q)。现在很明显为什么统计学家喜欢谈论方差。

但标准差对扩散具有重要意义,特别是当数据为正态分布时:区间平均值+/-1 SD可捕获2/3的样本,区间平均值+-2 SD可捕获95%的样本。

SD提供了一个问题的个体回答偏离平均值的程度的指示。SD告诉研究者这些反应是如何分散的——它们是集中在平均值附近,还是分散在很远的地方?你的所有受访者对你的产品的评价都在你的量表中间,还是有些人赞成,有些人不赞成?

考虑一个实验,在这个实验中,受访者被要求对一个产品的一系列属性进行5分制评分。一组10名受访者(下面标记为“a”到“J”)的“物有所值”平均值为3.2,标准差为0.4,“产品可靠性”平均值为3.4,标准差为2.1。

乍一看(只看手段),可靠性似乎比价值更高。但较高的可靠性标准差可能表明(如下面的分布所示),回答是非常两极分化的,大多数受访者没有可靠性问题(将属性评级为“5”),但较小但重要的部分受访者有可靠性问题,将属性评级为“1”。单看平均数只能说明一部分情况,然而,更多的时候,这是研究人员关注的重点。回答的分布是需要考虑的重要因素,SD提供了一个有价值的描述性度量。

答辩人 物有所值 产品可靠性
A 1
B 1
C 1
D 1
E 4 5
F 4 5
G 5
H 5
5
J 5
中庸 3.2 3.4
标准偏差。 0.4 2.1

第一次调查:受访者用5分制对产品进行评级

两个非常不同的分布对一个5分评分量表的反应可以产生相同的平均数。考虑下面显示两个不同评级的响应值的示例。

在第一个例子(评级“A”)中,SD为零,因为所有的回答都是平均值。个体的反应完全没有偏离平均值。

在评级“B”时,即使组平均值与第一次分布相同(3.0),标准差也较高。标准差为1.15表明,平均而言,个人回答与平均值相差略大于1点。

答辩人 评级“A” 评级“B”
A 1
B 2
C 2
D
E
F
G
H 4
4
J 5
中庸 3 3
标准偏差。 0 1.15

第二项调查:受访者用5分制对产品进行评级

另一种观察SD的方法是将分布绘制成响应的直方图。低SD分布将显示为高窄形状,而大SD将显示为宽形状。

SD通常并不表示“对或错”或“更好或更坏”——SD越低并不一定越可取。它纯粹用作描述性统计。它描述了相对于平均值的分布。

与SD相关的技术免责声明

将标准差视为“平均偏差”是从概念上理解其含义的一个很好的方法。然而,它实际上并不是作为平均值来计算的(如果是的话,我们称之为“平均偏差”)。相反,它是“标准化”的,一种使用平方和计算值的有点复杂的方法。

在实际应用中,计算并不重要。大多数制表程序、电子表格或其他数据管理工具都会为您计算SD。更重要的是要了解统计数字所传达的信息。

标准误差

标准误差是一种推断统计,用于比较不同人群的样本均值(平均值)。它是样本平均值精度的度量。样本平均数是从具有潜在分布的数据中得出的统计数据。我们不能用与数据相同的方式将其可视化,因为我们只进行了一个实验,只有一个值。统计理论告诉我们,样本均值(对于一个“足够”的大样本,在一些规则性条件下)近似正态分布。这个正态分布的标准差就是我们所说的标准误差。

图2.底部的分布代表数据的分布,而顶部的分布是样本平均数的理论分布。SD为20是数据扩散的度量,而SE为5是样本平均值周围不确定度的度量。

当我们想要比较治疗a和治疗B的两个样本实验的结果平均值时,我们需要估计我们测量平均值的精确程度。

实际上,我们感兴趣的是如何精确地测量这两种方法之间的差异。我们称之为差的标准误差。当您得知样本均值差异的标准误差是均值标准误差的函数时,您可能不会感到惊讶:

既然你已经了解了均值的标准差(SE)和分布的标准差(SD)是两个不同的野兽,你可能会想知道他们最初是怎么搞混的。虽然它们在概念上不同,但在数学上有一个简单的关系:

标准差(standard deviation)和标准误差(standard error)的区别

,其中n是数据点的数量。

请注意,标准误差取决于两个分量:样本的标准偏差和样本的大小n。这是很直观的:样本的标准差越大,我们对真实均值的估计就越不精确。

而且,样本量越大,我们掌握的关于人口的信息就越多,我们就越能准确地估计出真实的平均数。

SE表示平均值的可靠性。小的SE表示样本平均值更准确地反映了实际总体平均值。较大的样本量通常会导致较小的SE(而SD不受样本量的直接影响)。

大多数调查研究都涉及从人群中抽取样本。然后,我们根据从该样本获得的结果来推断人口。如果抽取第二个样本,结果可能与第一个样本不完全匹配。如果评级属性的平均值对于一个样本是3.2,那么对于相同大小的第二个样本可能是3.4。如果我们要从我们的总体中抽取无限数量的样本(大小相等),我们可以将观察到的平均数显示为一个分布。然后我们可以计算所有样本平均值。这个平均数等于真实的人口平均数。我们还可以计算样本均值分布的标准差。样本均值分布的SD是每个样本均值的SE。

因此,我们有最重要的观察结果:SE是人口平均数的标准差。

样品 中庸
第一 3.2
第二 3.4
第三 3.3
第四 3.2
第五 3.1
…. ….
…. ….
…. ….
…. ….
…. ….
中庸 3.3
标准偏差。 0.13

说明SD和SE之间关系的表格

现在很清楚,如果这个分布的SD帮助我们理解样本平均值与真实人口平均值之间的距离,那么我们可以用这个来理解任何单个样本平均值与真实平均值之间的精确程度。这就是SE的本质。

实际上,我们只从我们的人群中抽取了一个样本,但是我们可以用这个结果来估计我们观察到的样本均值的可靠性。

事实上,SE告诉我们,我们可以95%确信我们观察到的样本平均值是正负大约2(实际上是1.96)个标准误差。

下表显示了我们用于研究的第一个(也是唯一一个)样本的回答分布。相对较小的SE值为0.13,表明我们的平均值与总体人口的真实平均值相对接近。我们的平均值的误差范围(95%置信度)是(大约)该值的两倍(+/-0.26),告诉我们真实的平均值很可能在2.94和3.46之间。

答辩人 评级
A
B
C
D
E 4
F 4
G
H
J
中庸 3.2
标准误差 0.13

摘要

许多研究者未能理解标准差和标准差之间的区别,尽管它们通常包含在数据分析中。虽然标准差和标准误差的实际计算看起来非常相似,但它们代表了两个非常不同但互补的度量。SD告诉我们分布的形状,单个数据值与平均值的接近程度。SE告诉我们我们的样本平均值与总人口的真实平均值有多接近。它们共同提供了一个比平均数更完整的图像。

  • 发表于 2021-06-24 19:20
  • 阅读 ( 1272 )
  • 分类:通用

你可能感兴趣的文章

剩余标准差

什么是剩余标准差(residual standard deviation)? 残差标准差是一个统计术语,用于描述观察值与预测值的标准差差异,如回归分析中的点所示。 回归分析是统计学中用来显示两个不同变量之间关系的一种方法,用来描述如何从一个...

  • 发布于 2021-06-10 07:52
  • 阅读 ( 318 )

标准差(standard deviation)和标准误差(standard error)的区别

介绍 标准差(SD)和标准误差(SE)是两个看似相似的术语;然而,它们在概念上千差万别,在统计文献中几乎可以互换使用。这两个术语前面通常都有一个加减符号(+/-),表示它们定义了一个对称值或表示了一系列值。...

  • 发布于 2021-06-24 19:20
  • 阅读 ( 1272 )

方差(variance)和标准差(standard deviation)的区别

...n=数据集中的值数,则 σ2 = ∑ (x–M)2/n   什么是标准差(standard deviation)? 标准差简单地定义为给定数据集中值与其平均值之间的离散度。它测量数据的传播,周围的平均值被计算为方差的平方根。斯坦σ 标准偏差用希腊字母sigm...

  • 发布于 2021-06-25 15:38
  • 阅读 ( 1654 )

贝塔(beta)和标准差(standard deviation)的区别

...据定义,P指数基金的贝塔系数为1.0。   什么是标准差(standard deviation)? 标准差是最广泛使用的利差统计指标,基本上反映了基金的波动性。单个股票的波动性通常由其最近一段时间内收益的标准差来衡量。股票投资组合的标...

  • 发布于 2021-06-26 05:28
  • 阅读 ( 863 )

标准化(standardization)和滴定法(titration)的区别

主要差异标准化(main difference standardization) vs. 滴定法(titration) 标准化和滴定是两个相关的化学术语。尽管它们使用相同的技术来获得测量值,但它们的应用却各不相同。标准化用于确定配制溶液的准确浓度。滴定法用于测定样品...

  • 发布于 2021-06-29 17:26
  • 阅读 ( 373 )

标准差(standard deviation)和方差(variance)的区别

标准差和方差是数据离散度的统计度量数据也就是说,它们表示与平均值有多大的差异,或者值通常“偏离”平均值的程度平均值. 方差或标准差为零表示所有值都相同。方差是方差平方的平均值(即值与平均值的差值)...

  • 发布于 2021-07-06 05:11
  • 阅读 ( 1028 )

方差(variance)和标准差(standard deviation)的区别

...将包括计算中的步幅的可比性。方差(variance) vs. 标准差(standard deviation)方差和标准差的区别在于,标准差不过是方差理论的平方根。这两个术语被用来决定信息收集的传播。标准差和方差都是数学度量,它们从平均值确定信息的...

  • 发布于 2021-07-10 05:23
  • 阅读 ( 326 )

β偏差(beta deviation)和标准差(standard deviation)的区别

...也可以报告基金的波动性。β偏差(beta deviation) vs. 标准差(standard deviation)贝塔和标准差的区别在于,贝塔差衡量的是整个市场的风险,而标准差法往往衡量的是个股所产生的风险。与整个股票市场的变化有关的股票价格的计量是...

  • 发布于 2021-07-10 11:35
  • 阅读 ( 751 )

如何计算标准差(calculate standard deviation)

标准偏差(通常用小写希腊字母σ表示)是多组数据的所有平均值的平均值或平均值。标准差是数学和科学的一个重要计算方法,尤其是实验室报告。科学家和统计学家使用标准差来确定数据集与所有数据集的平均值的接近程度...

  • 发布于 2021-09-06 22:47
  • 阅读 ( 217 )

如何计算总体标准差(calculate population standard deviation)

标准偏差是一组数字的离散或变化的计算。如果标准偏差是一个小数字,则表示数据点接近其平均值。如果偏差较大,则意味着这些数字分散开来,距离平均值或平均值更远。 有两种类型的标准偏差计算。总体标准偏差是指...

  • 发布于 2021-10-01 13:34
  • 阅读 ( 471 )