标准差(standard deviation)和方差(variance)的区别

标准差和方差的公式通常表示为:...

标准差方差是数据离散度的统计度量数据也就是说,它们表示与平均值有多大的差异,或者值通常“偏离”平均值的程度平均值. 方差或标准差为零表示所有值都相同。

方差是方差平方的平均值(即值与平均值的差值),标准差是方差的平方根。标准差用于识别数据中的异常值。

对比图

标准差与方差比较图
标准差 方差
数学公式 方差平方根 样本中每个值与平均值的偏差平方的平均值。
符号 希腊文字母西格玛-σ 无专用符号;用标准差或其它值表示。
与给定数据集相关的值 与给定数据集中的值相同的标度;因此,用相同的单位表示。 比例尺大于给定数据集中的值;不是用与值本身相同的单位表示的。
值是负值还是正值? 总是非负的 总是非负的
实际应用程序 人口抽样;识别异常值 统计公式,金融。

重要概念

  • 平均值:数据集中所有值的平均值(将所有值相加,再除以值的个数)。
  • 偏差:每个值与平均值的距离。如果平均值为3,则值5的偏差为2(从值中减去平均值)。偏差可以是正的,也可以是负的。

符号

标准差和方差的公式通常表示为:

  • 十̅ = 问题中所有数据点的平均值
  • X=单个数据点
  • N=数据集中的点数
  • ∑ = [偏差的平方]之和

公式

一组n个等概率值的方差可以写成:

\operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2.

标准偏差是方差的平方根:

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}.

带有希腊字母的公式看起来令人望而生畏,但这并不像看上去那么复杂。简单来说:

  1. 求所有数据点的平均值
  2. 找出每个点离平均值有多远(这是偏差)
  3. 每个偏差的平方(即每个值与平均值的差值)
  4. 平方和除以点数。

这就是方差。取方差的平方根求标准差。

这段来自Khan Academy的精彩视频解释了方差和标准差的概念:

例子

假设一个数据集包括6个蒲公英的高度:3英寸、4英寸、5英寸、4英寸、11英寸和6英寸。

首先,找出数据点的平均值:(3+4+5+4+11+7)/6=5.5

所以平均身高是5.5英寸。现在我们需要偏差,所以我们找到了每种植物与平均值的差异:-2.5,-1.5,-.5,-1.5,5.5,1.5

现在求每个偏差的平方和:6.25+2.25+0.25+2.25+30.25+2.25=43.5

现在将平方和除以数据点的数量,在本例中为植物:43.5/6=7.25

所以这个数据集的方差是7.25,这是一个相当任意的数字。要将其转换为实际测量值,请取7.25的平方根,以英寸为单位计算标准偏差。

标准偏差约为2.69英寸。这意味着对于样本来说,任何在平均值2.69英寸(5.5英寸)以内的蒲公英都是“正常的”。

为什么要平方偏差?

偏差是平方的,以防止负值(低于平均值的偏差)抵消正值。这是因为负数的平方变成了正值。如果你有一个简单的数据集,与+5、+2、-1和-6的平均值有偏差,如果这些值不是平方的(即5+2-1-6=0),那么这些偏差的总和将变成零。

实际应用程序

方差表示为数学离散。由于它是相对于数据集原始测量值的任意数字,因此很难在现实世界中可视化和应用。求方差通常只是求标准差之前的最后一步。方差值有时用于金融和统计公式中。

以数据集的原始单位表示的标准差更直观,更接近原始数据集的值。它最常用于分析人口统计学或人口样本,以了解人口中什么是正常的。

发现异常值

标准差(standard deviation)和方差(variance)的区别

在正态分布中,大约68%的总体(或数值)在1个标准差(1)之内σ) 约94%落在2%以内σ. 与平均值相差1.7的值σ 一个或多个通常被认为是异常值。

在实践中,像六西格玛这样的质量体系试图降低错误率,使错误成为异常值。术语“六西格玛过程”来自这样一个概念,即如果一个人在过程平均值和最近的规范极限之间有六个标准偏差,那么实际上没有任何项目不符合规范要求

样品标准差

在实际应用中,使用的数据集通常表示总体样本,而不是整个总体。如果要从部分样本中得出总体范围的结论,则使用稍微修改的公式。

如果您只有一个样本,但您希望对抽取样本的总体标准偏差进行说明,则使用“样本标准偏差”

s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}.

样本标准偏差公式与标准偏差公式的唯一区别是分母中的“-1”。

以蒲公英为例,如果我们只采集了6个蒲公英,但想用这个样本来说明整个领域几百个蒲公英的标准差,就需要这个公式。

平方和现在将被5除而不是6(n-1),这将给出8.7(而不是7.25)的方差和2.95英寸的样本标准偏差,而不是原始标准偏差的2.69英寸。此更改用于查找样本中的误差范围(本例中为9%)。

参考文献

  • 计算标准差的简单示例-AppSpot
  • 标准差公式-数学很有趣
  • 绝对偏差和方差-拉尔德统计量
  • 标准差和方差-数学很有趣
  • 维基百科:标准差
  • 维基百科:方差特性
  • 作为离散度度量的范围、方差和标准差-可汗学院
  • 模式、中介和手段:一个统一的视角

  • 发表于 2021-07-06 05:11
  • 阅读 ( 1031 )
  • 分类:科学

你可能感兴趣的文章

用excel计算历史波动率

...天数(365)。通过取结果的平方根得出年化标准差: Variance = σ²daily = [Σ (r (t)) ² / (n - 1)] 对于年化方差,假设一年365天,每天都有相同的日方差,σ²每天,我们获得: Annualized Variance = 365. σ²daily Annualized Variance = 365. [Σ ...

  • 发布于 2021-06-11 13:10
  • 阅读 ( 385 )

如何在excel中计算风险价值(var)?

...z\text{-score\ of\ the\ confidence\ interval}\\&amp\quad\times\\text{standard\deviation\of\the\portfolio)]}\\&amp\quad\times\\text{portfolio\value}\\\end{aligned}VaR​=[投资组合的预期加权收益− (置信区间的z分× 投资组合的标准差× 投资组合总市值​ 通常...

  • 发布于 2021-06-14 11:58
  • 阅读 ( 425 )

标准差(standard deviation)和标准误差(standard error)的区别

介绍 标准差(SD)和标准误差(SE)是两个看似相似的术语;然而,它们在概念上千差万别,在统计文献中几乎可以互换使用。这两个术语前面通常都有一个加减符号(+/-),表示它们定义了一个对称值或表示了一系列值。...

  • 发布于 2021-06-24 19:20
  • 阅读 ( 1278 )

方差(variance)和标准差(standard deviation)的区别

...n=数据集中的值数,则 σ2 = ∑ (x–M)2/n   什么是标准差(standard deviation)? 标准差简单地定义为给定数据集中值与其平均值之间的离散度。它测量数据的传播,周围的平均值被计算为方差的平方根。斯坦σ 标准偏差用希腊字母sigm...

  • 发布于 2021-06-25 15:38
  • 阅读 ( 1656 )

贝塔(beta)和标准差(standard deviation)的区别

...据定义,P指数基金的贝塔系数为1.0。   什么是标准差(standard deviation)? 标准差是最广泛使用的利差统计指标,基本上反映了基金的波动性。单个股票的波动性通常由其最近一段时间内收益的标准差来衡量。股票投资组合的标...

  • 发布于 2021-06-26 05:28
  • 阅读 ( 865 )

标准差(standard deviation)和方差(variance)的区别

标准差和方差是数据离散度的统计度量数据也就是说,它们表示与平均值有多大的差异,或者值通常“偏离”平均值的程度平均值. 方差或标准差为零表示所有值都相同。方差是方差平方的平均值(即值与平均值的差值)...

  • 发布于 2021-07-06 05:11
  • 阅读 ( 1031 )

样本方差(sample variance)和总体方差(population variance)的区别

...这些过程感到困惑,并且经常相互交换。样本方差(sample variance) vs. 总体方差(population variance)样本方差与总体方差的区别在于,样本方差是一个估计过程,通过这个过程,任何特定样本数据的指标都可以通过一个系统的过程进行...

  • 发布于 2021-07-09 18:53
  • 阅读 ( 2745 )

方差(variance)和标准差(standard deviation)的区别

...将包括计算中的步幅的可比性。方差(variance) vs. 标准差(standard deviation)方差和标准差的区别在于,标准差不过是方差理论的平方根。这两个术语被用来决定信息收集的传播。标准差和方差都是数学度量,它们从平均值确定信息的...

  • 发布于 2021-07-10 05:23
  • 阅读 ( 331 )

β偏差(beta deviation)和标准差(standard deviation)的区别

...也可以报告基金的波动性。β偏差(beta deviation) vs. 标准差(standard deviation)贝塔和标准差的区别在于,贝塔差衡量的是整个市场的风险,而标准差法往往衡量的是个股所产生的风险。与整个股票市场的变化有关的股票价格的计量是...

  • 发布于 2021-07-10 11:35
  • 阅读 ( 756 )

如何计算标准差(calculate standard deviation)

标准偏差(通常用小写希腊字母σ表示)是多组数据的所有平均值的平均值或平均值。标准差是数学和科学的一个重要计算方法,尤其是实验室报告。科学家和统计学家使用标准差来确定数据集与所有数据集的平均值的接近程度...

  • 发布于 2021-09-06 22:47
  • 阅读 ( 220 )