如何计算方差(calculate variance)

什么是方差?方差是对一个数据集的分散程度的衡量,我们通过找到每个数据点与平均值的平方差的平均值来计算它。它在创建统计模型时非常有用,因为低方差可能是你过度拟合数据的一个标志。一旦你掌握了这个公式,你只需要插入正确的数字就可以找到答案。继续阅读一个完整的分步教程,它将教你如何计算样本方差和群体方差。...

方法1 方法1的2:计算样本方差

  1. 1如果你正在处理一个部分数据集,请使用样本方差公式。在大多数情况下,统计学家只能接触到一个样本,或者他们所研究的人口的一个子集。例如,统计学家不是分析 "德国每辆汽车的成本",而是可以找到几千辆汽车的随机样本的成本。他可以用这个样本来获得对德国汽车成本的良好估计,但很可能与实际数字不完全一致。例子。分析一家食堂每天售出的松饼数量,你随机抽出六天的样本,得到这些结果。38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9.这是一个样本,而不是一个群体,因为你没有食堂每一天的数据。如果你有一个群体中的每一个数据点,可以跳到下面的方法。
  2. Image titled Calculate Variance Step 1
  3. 2写下样本方差公式。一个数据集的方差告诉你数据点的分布情况。方差越接近于零,数据点就越紧密地聚在一起。在处理样本数据集时,使用以下公式计算方差: s2{displaystyle s^{2}} = ∑[(xi{displaystyle x_{i}} - x̅)2{displaystyle ^{2}}]/(n - 1)s2{displaystyle s^{2}}为方差。方差总是以平方为单位。xi{displaystyle x_{i}}代表你的数据集中的一个项。∑,意思是 "总和",告诉你为xi{displaystyle x_{i}}的每个值计算下列项,然后把它们加在一起。x̅是样本的平均值。
  4. Image titled Calculate Variance Step 2s^{2}x_{i}^{2}s^{2}x_{i}x_{i}
  5. 3计算样本的平均数。符号x̅或 "x-bar "指的是样本的平均数。像计算任何平均值一样计算:把所有的数据点加在一起,然后除以数据点的数量。例子。首先,把你的数据点加在一起。17+15+23+7+9+13=84接着,用答案除以数据点的数量,在这种情况下是6个:84÷6=14.样本平均值=x̅=14.你可以把平均值看作是数据的 "中心点"。如果数据聚集在平均值周围,方差就很低。如果数据分散在离平均值很远的地方,方差就会很高。
  6. Image titled Calculate Variance Step 3
  7. 4从每个数据点中减去平均值。现在是时候计算xi{displaystyle x_{i}}了。- x̅,其中xi{displaystyle x_{i}}是你数据集中的每个数字。每个答案都告诉你这个数字与平均值的偏差,或者用简单的语言说,它离平均值有多远。例子:x1{displaystyle x_{1}}。- x̅ = 17 - 14 = 3x2{displaystyle x_{2}}。- x̅ = 15 - 14 = 1x3{displaystyle x_{3}}。- x̅ = 23 - 14 = 9x4{displaystyle x_{4}}。- x̅ = 7 - 14 = -7x5{displaystyle x_{5}} x̅ = 9 - 14 = -7x5{displaystyle x_{5}}.- x̅ = 9 - 14 = -5x6{displaystyle x_{6}} x̅ = 13 - 14 = -1x6{displaystyle x_{6}}.- x̅ = 13 - 14 = -1很容易检查你的工作,因为你的答案加起来应该是零。这是由于平均数的定义,因为负的答案(从平均数到小数字的距离)正好抵消了正的答案(从平均数到大数字的距离)。
  8. Image titled Calculate Variance Step 4x_{i}x_{i}x_{1}x_{2}x_{3}x_{4}x_{5}x_{6}
  9. 5对每个结果进行平方。如上所述,你目前的偏差列表(xi{displaystyle x_{i}}-x̅)之和为零。这意味着 "平均偏差 "也将始终为零,所以这并不能说明数据的分布情况。为了解决这个问题,找到每个偏差的平方。这将使它们都成为正数,所以负值和正值不再抵消为零。例子。(x1{displaystyle x_{1}}-x̅)2=32=9{displaystyle ^{2}=3^{2}=9}(x2{displaystyle (x_{2}}-x̅)2=12=1{displaystyle ^{2}=1^{2}=1}92 = 81(-)7)2=49(-5)2=25(-1)2=1你现在有你样本中每个数据点的值(xi{displaystyle x_{i}}-x̅)2{displaystyle ^{2}。
  10. Image titled Calculate Variance Step 5x_{i}x_{1}^{2}=3^{2}=9(x_{2}^{2}=1^{2}=1x_{i}^{2}
  11. 6找出平方值之和。现在是时候计算公式的整个分子了。∑[(xi{displaystyle x_{i}}-x̅)2{displaystyle ^{2}}]。大写的西格玛,∑,告诉你对于xi{displaystyle x_{i}}的每个值,要对下面的项的值进行求和。你已经为样本中xi{displaystyle x_{i}}的每个值计算了(xi{displaystyle x_{i}}-x̅)2{displaystyle ^{2}},所以你需要做的就是把所有平方偏差的结果加在一起。例如:9+1+81+49+25+1=166。
  12. Image titled Calculate Variance Step 6x_{i}^{2}x_{i}x_{i}^{2}x_{i}
  13. 7除以n-1,其中n是数据点的数量。很久以前,统计学家在计算样本的方差时只是除以n。这样你就得到了偏差平方的平均值,这与该样本的方差完全吻合。但请记住,样本只是对更大群体的估计。如果你采取另一个随机样本并进行同样的计算,你会得到一个不同的结果。事实证明,除以n-1而不是n,可以更好地估计大群体的方差,这才是你真正感兴趣的。这种修正非常普遍,以至于它现在成为样本方差的公认定义。例子。样本中有六个数据点,所以n=6。样本的方差=s2=1666-1={displaystyle s^{2}={frac {166}{6-1}}=}。33.2
  14. Image titled Calculate Variance Step 7s^{2}={\frac {166}{6-1}}=
  15. 8了解方差和标准差。注意,由于公式中有一个指数,方差是以原始数据的平方单位来衡量的。这可能使它难以直观地理解。相反,使用标准差往往是有用的。不过你并没有浪费你的努力,因为标准差被定义为方差的平方根。这就是为什么样本的方差被写成s2{{displaystyle s^{2}},而样本的标准差是s{displaystyle s}.例如,上面的样本的标准差=s = √33.2 = 5.76。
  16. Image titled Calculate Variance Step 8s^{2}s

方法2 方法2:计算种群差异

  1. 1如果你已经收集了人口中每个点的数据,请使用人口方差公式。术语 "人口 "指的是相关观察的总集合。例如,如果你正在研究德克萨斯州居民的年龄,你的人口将包括每一个德克萨斯州居民的年龄。通常你会为这样的大数据集创建一个电子表格,但这里有一个较小的数据集例子。例子。水族馆的一个房间里正好有六个鱼缸。这六个鱼缸里的鱼的数量如下:x1=5{displaystyle x_{1}=5}x2=5{displaystyle x_{2}=5}x3=8{displaystyle x_{3}=8}x4=12{displaystyle x_{4}=12}x5=15{displaystyle x_{5}=15}x6=18{displaystyle x_{6}=18}。
  2. Image titled Calculate Variance Step 9x_{1}=5x_{2}=5x_{3}=8x_{4}=12x_{5}=15x_{6}=18
  3. 2写下人口方差公式。由于人口包含你所需要的所有数据,这个公式给了你人口的确切方差。为了区别于样本方差(这只是一个估计值),统计学家使用了不同的变量:σ2{displaystyle ^{2}}=(∑(xi{displaystyle x_{i}}-μ)2{displaystyle ^{2}})/nσ2{displaystyle ^{2}}=人口方差。这是一个小写的西格玛,平方。xi{displaystyle x_{i}}代表你的数据集中的一个项。∑内的项将针对xi{displaystyle x_{i}}的每个值进行计算,然后求和。
  4. Image titled Calculate Variance Step 10^{2}x_{i}^{2}^{2}x_{i}x_{i}
  5. 3找到人口的平均数。在分析一个群体时,符号μ("mu")代表算术平均数。为了找到平均数,把所有的数据点加在一起,然后除以数据点的数量。你可以把平均值看作是 "平均数",但要小心,因为这个词在数学中有多种定义。例子:平均值=μ=5+5+8+12+15+186{displaystyle {frac {5+5+8+12+15+18}{6}}=10.5
  6. Image titled Calculate Variance Step 11{\frac {5+5+8+12+15+18}{6}}
  7. 4从每个数据点中减去平均值。靠近平均值的数据点会导致差值更接近于零。对每个数据点重复减法问题,你可能会开始感觉到数据的分布情况。例如:x1{displaystyle x_{1}}。- μ = 5 - 10.5 = -5.5x2{displaystyle x_{2}} μ = 5 - 10.5 = -5.5x2{displaystyle x_{2}}。- μ = 5 - 10.5 = -5.5x3{displaystyle x_{3}}。- μ = 8 - 10.5 = -2.5x4{displaystyle x_{4}}。- μ = 12 - 10.5 = 1.5x5{displaystyle x_{5}}- μ=15-10.5=4.5x6{displaystyle x_{6}}。- μ = 18 - 10.5 = 7.5
  8. Image titled Calculate Variance Step 12x_{1}x_{2}x_{3}x_{4}x_{5}x_{6}
  9. 5对每个答案进行平方。现在,你在上一步骤中得到的一些数字将是负数,而一些数字将是正数。如果你把你的数据画在一条数线上,这两类数字代表平均值左边的数字和平均值右边的数字。这对计算方差没有好处,因为这两组会相互抵消。将每个数字平方化,使它们都变成正数。例如:(xi{displaystyle x_{i}}-μ)2{displaystyle ^{2}}对于i的每个值从1到6:(-5.5)2{displaystyle ^{2}}=30.25(-5.5)2{displaystyle ^{2}}=30。25(-2.5)2{displaystyle ^{2}} = 6.25(1.5)2{displaystyle ^{2}} = 2.25(4.5)2{displaystyle ^{2}} = 20.25(7.5)2{displaystyle ^{2}} = 56.25
  10. Image titled Calculate Variance Step 13x_{i}^{2}^{2}^{2}^{2}^{2}^{2}^{2}
  11. 6找出你的结果的平均值。现在你对每个数据点都有一个值,与该数据点离平均值的距离有关(间接)。将这些数值相加,然后除以数值的数量,就可以得出这些数值的平均值。例如:人口的方差=30.25+30.25+6.25+2.25+20.25+56.256=145.56={{displaystyle {frac {30.25+30.25+6.25+2.25+20.25+56.25}{6}}={{frac {145.5}{6}}=}24.25
  12. Image titled Calculate Variance Step 14{\frac {30.25+30.25+6.25+2.25+20.25+56.25}{6}}={\frac {145.5}{6}}=
  13. 7将其与公式联系起来。如果你不确定这与本方法开始时的公式如何匹配,可以试着用手写出整个问题。在找到与平均值的差值并进行平方后,你就有了(x1{displaystyle x_{1}}-μ)2{displaystyle ^{2}},(x2{displaystyle x_{2}}-μ)2{displaystyle ^{2}}的数值。以此类推,直到(xn{displaystyle x_{n}} - μ)2{displaystyle ^{2}},其中xn{displaystyle x_{n}}是该集合的最后一个数据点。为了找到这些值的平均值,你把它们加起来,然后除以n:( (x1{displaystyle x_{1}} - μ)2{displaystyle ^{2}}。+ (x2{displaystyle x_{2}} - μ)2{displaystyle ^{2}} + ...+ ...+ (xn{displaystyle x_{n}} - μ)2{displaystyle^{2}} + ...)/ n用西格玛符号重写分子后,你有(∑(xi{displaystyle x_{i}}-μ)2{displaystyle ^{2}})/n,即方差公式。
  14. Image titled Calculate Variance Step 15x_{1}^{2}x_{2}^{2}x_{n}^{2}x_{n}x_{1}^{2}x_{2}^{2}x_{n}^{2}x_{i}^{2}

帮助计算方差

差异小抄

  • 由于很难解释方差,所以通常计算这个值作为计算标准差的起点。
  • 在分析样本时,在分母中使用 "n-1 "而不是 "n "是一种叫做贝塞尔修正的技术。样本只是全部人口的一个估计值,而样本的平均值有偏向于适合这个估计值。这种校正可以消除这种偏差。这与以下事实有关:一旦你列出了n - 1个数据点,最后的第n个点就已经受到了约束,因为只有某些数值会导致方差公式中使用的样本平均值(x̅)。
  • 发表于 2022-03-11 15:50
  • 阅读 ( 239 )
  • 分类:教育

你可能感兴趣的文章

用excel计算历史波动率

...天数(365)。通过取结果的平方根得出年化标准差: Variance = σ²daily = [Σ (r (t)) ² / (n - 1)] 对于年化方差,假设一年365天,每天都有相同的日方差,σ²每天,我们获得: Annualized Variance = 365. σ²daily Annualized Variance = 365. [Σ ...

  • 发布于 2021-06-11 13:10
  • 阅读 ( 391 )

指数加权移动平均的探讨

...here:m=Number 天数n=日iu=平均回报率差\开始{对齐}&amp\text{Variance}=\sigma^2\u n=\frac{1}{m}\sum{i=1}^m u^2{n-1}\\&amp\textbf{其中:}\\&m=\text{测量天数}\\&n=\text{Day}i\\&u=\text{收益率与平均收益率之差}\\\end{对齐}​方差=σ...

  • 发布于 2021-06-12 06:26
  • 阅读 ( 217 )

贝塔如何衡量系统风险

...变化如何}\\&amp\文本{与市场回报变化有关}\\&amp\text{Variance}=\text{市场数据点的分散程度}\\&amp\文本{out from their average value}\\\结束{对齐}​β系数(β)=差异(Rm)​)协方差(Re)​,林吉特​)​where:Re​=单个股票的回报率​=整...

  • 发布于 2021-06-19 23:07
  • 阅读 ( 358 )

方差(variance)和标准差(standard deviation)的区别

...的无偏比较,以更好地理解这些条款。   什么是方差(variance)? 方差被简单地定义为围绕算术平均值的值的可变性的度量。简单来说,方差是均方差,而均值是给定数据集中所有值的平均值。变量方差的表示法是“σ2“(小写s...

  • 发布于 2021-06-25 15:38
  • 阅读 ( 1662 )

如何计算二项式概率(calculate binomial probability)

...努利试验。现在,让我们来看看求二项式概率的方法。 如何求二项式概率 如果X是n(有**)独立伯努利试验的成功次数,成功概率为p,那么实验中X成功的概率为, nCx称为二项式系数。 X被称为参数p和n的二元分布,通常用符号B...

  • 发布于 2021-06-27 00:17
  • 阅读 ( 471 )

标准差(standard deviation)和方差(variance)的区别

标准差和方差是数据离散度的统计度量数据也就是说,它们表示与平均值有多大的差异,或者值通常“偏离”平均值的程度平均值. 方差或标准差为零表示所有值都相同。方差是方差平方的平均值(即值与平均值的差值)...

  • 发布于 2021-07-06 05:11
  • 阅读 ( 1033 )

样本方差(sample variance)和总体方差(population variance)的区别

...这些过程感到困惑,并且经常相互交换。样本方差(sample variance) vs. 总体方差(population variance)样本方差与总体方差的区别在于,样本方差是一个估计过程,通过这个过程,任何特定样本数据的指标都可以通过一个系统的过程进行...

  • 发布于 2021-07-09 18:53
  • 阅读 ( 2752 )

方差(variance)和标准差(standard deviation)的区别

...识的分布情况)也将包括计算中的步幅的可比性。方差(variance) vs. 标准差(standard deviation)方差和标准差的区别在于,标准差不过是方差理论的平方根。这两个术语被用来决定信息收集的传播。标准差和方差都是数学度量,它们从...

  • 发布于 2021-07-10 05:23
  • 阅读 ( 336 )

如何计算标准差(calculate standard deviation)

...标准差功能。但是,您可以手动执行计算,并且应该了解如何执行。 计算标准差的不同方法 计算标准差的方法主要有两种:总体标准差和样本标准差。如果从总体或集合的所有成员收集数据,则应用总体标准偏差。如果您...

  • 发布于 2021-09-06 22:47
  • 阅读 ( 224 )

如何计算总体标准差(calculate population standard deviation)

...区间。稍微复杂一点的计算称为样本标准偏差。这是一个如何计算方差和总体标准差的简单示例。首先,让我们回顾一下如何计算总体标准偏差: 计算平均值(数字的简单平均值)。 对于每个数字:减去平均值。将结果平方...

  • 发布于 2021-10-01 13:34
  • 阅读 ( 486 )