平均值、中位数和模式之间的经验关系

在一组数据中,有各种各样的描述性统计。平均值、中值和模式都给出了数据中心的测量值,但它们的计算方式不同:...

在一组数据中,有各种各样的描述性统计。平均值、中值和模式都给出了数据中心的测量值,但它们的计算方式不同:

Student works on a mathematics problem
  • 通过将所有数据值相加,然后除以值的总数来计算平均值。
  • 中位数的计算方法是按升序列出数据值,然后在列表中找到中间值。
  • 通过计算每个值出现的次数来计算模式。频率最高的值是模式。

表面上看,这三个数字之间似乎没有联系。然而,事实证明,这些中心指标之间存在经验关系。

理论与经验

在我们继续之前,重要的是要理解我们在提到实证关系时所谈论的内容,并将其与理论研究进行对比。统计学和其他知识领域的一些结果可以从以前的一些陈述中以理论的方式推导出来。我们从我们所知道的开始,然后运用逻辑、数学和演绎推理,看看这会把我们引向何方。结果是其他已知事实的直接结果。

与理论相对应的是获取知识的经验方式。我们可以观察我们周围的世界,而不是根据已经确立的原则进行推理。从这些观察中,我们可以对我们所看到的做出解释。很多科学都是这样做的。实验给我们提供了经验数据。然后,目标就变成了制定一个适合所有数据的解释。

经验关系

在统计学中,均值、中位数和模式之间存在一种基于经验的关系。对无数数据集的观察表明,大多数情况下,平均值和模式之间的差异是平均值和中值之间差异的三倍。该方程形式的关系为:

平均值-模式=3(平均值-中位数)。

实例

为了了解上述与真实世界数据的关系,让我们看看2010年美国各州的人口。以百万计,人口为:加利福尼亚-36.4,德克萨斯-23.5,纽约-19.3,佛罗里达-18.1,伊利诺伊-12.8,宾夕法尼亚-12.4,俄亥俄-11.5,密歇根-10.1,乔治亚-9.4,北卡罗来纳-8.9,新泽西-8.7,弗吉尼亚-7.6,马萨诸塞-6.4,华盛顿-6.4,印第安纳-6.3,亚利桑那-6.2,田纳西-6.0,密苏里-5.8,马里兰州-5.6,威斯康星州-5.6,明尼苏达州-5.2,科罗拉多州-4.8,阿拉巴马州-4.6,南卡罗来纳州-4.3,路易斯安那州-4.3,肯塔基州-4.2,俄勒冈州-3.7,俄克拉荷马州-3.6,康涅狄格州-3.5,爱荷华州-3.0,密西西比州-2.9,阿肯色州-2.8,堪萨斯州-2.8,犹他州-2.6,内华达州-2.5,新墨西哥州-2.0,西弗吉尼亚州-1.8,内布拉斯加州-1.8,爱达荷州-1.5,缅因州-1.3,新罕布什尔州-1.3,夏威夷州-1.3,罗德岛州-1.1,蒙大拿州-9,特拉华州-9,南达科他州-8,阿拉斯加-7,北达科他州-6,佛蒙特州-6,怀俄明州-5

平均人口为600万。中位人口为425万。模式为130万。现在,我们将计算上述差异:

  • 平均值–模式=600万–130万=470万。
  • 3(平均值-中位数)=3(600万-425万)=3(175万)=525万。

虽然这两个差异数字并不完全匹配,但它们彼此相对接近。

应用

上述公式有几个应用程序。假设我们没有数据值列表,但知道均值、中位数或模式中的任意两个。上述公式可用于估算第三个未知量。

例如,如果我们知道我们的平均值是10,模式是4,那么我们的数据集的中位数是多少?由于平均-模式=3(平均-中位数),我们可以说10-4=3(10-中位数)。通过一些代数,我们看到2=(10-中位数),所以我们数据的中位数是8。

上述公式的另一个应用是计算偏度。由于偏度测量平均值和模式之间的差异,因此我们可以计算3(平均值-模式)。为了使这个量无量纲化,我们可以用标准偏差除以它,以提供一种计算偏度的替代方法,而不是在统计学中使用矩。

一句警告的话

如上所述,上述关系并不精确。相反,这是一个很好的经验法则,类似于范围法则,它在标准偏差和范围之间建立了一个近似的联系。平均值、中位数和模式可能不完全符合上述经验关系,但很有可能会相当接近。

  • 发表于 2021-10-07 02:40
  • 阅读 ( 224 )
  • 分类:数学

你可能感兴趣的文章

对称分布

...trical distribution)? 当变量的值以规则频率出现,并且通常平均值、中值和模态都出现在同一点时,就会出现对称分布。如果在图形的中间画一条线,它会显示出相互镜像的两面。 在图形形式中,对称分布可能表现为正态分布(...

  • 发布于 2021-06-04 09:29
  • 阅读 ( 457 )

五分位数

...分位和下五分位之间有三个五分位。虽然所有股票价格的平均值通常落在第二和第四个五分位数之间,这是数据的中间点,但数据高端或低端的异常值可能会增加或减少平均值。因此,在试图理解数据和平均值时,值得考虑数据...

  • 发布于 2021-06-11 02:16
  • 阅读 ( 836 )

模式(mode)和中值的(median)的区别

...人们一直教导我们,分析调查的最简单方法是确定结果的平均值、模式和中位数。与其他研究分析过程相比,这些过程涉及的计算量最小,可以给出更快的结果。 然而,大多数学生发现很难理解三者之间的差异,尤其是模式和...

  • 发布于 2021-06-23 21:38
  • 阅读 ( 712 )

分散(dispersion)和偏斜(skewness)的区别

...。我们通常计算一个数字来代表整个数据集,这被称为“平均值”。然而,它没有规定任何特定的方法来确定系列的组成。因此,需要采取额外的措施,使我们了解项目之间的差异或在平均水平附近的差异。为了理解统计学中定...

  • 发布于 2021-06-25 15:08
  • 阅读 ( 536 )

分散(dispersion)和偏斜(skewness)的区别

...是向右移动,都假定它是弯曲的。偏度可以量化为分布与平均值的不同程度。比较参数分散偏斜定义离散度是随机变量的一组值或分布的大小。它定义了扩展或扩展分布的光谱。偏度是随机变量在统计分布平均值附近的不对称性...

  • 发布于 2021-07-11 17:55
  • 阅读 ( 374 )

数学词汇:数学术语和定义

...或特征,如大小、形状、颜色等,允许对其进行分组。 平均值:平均值与平均值相同。将一系列数字相加,然后将总和除以数值总数,得出平均值。 底部:一个形状或三维物体的底部,物体的基础。 基数10:为数字指定位...

  • 发布于 2021-09-03 13:54
  • 阅读 ( 238 )

了解商业数学

...。这些公式不需要记忆。 统计数字 能够计算数据集的平均值、中值和模式 能够解释和理解平均值、中位数和模式的意义。 绘图 能够解释不同类型的图形和图表,如条形图和线形图、散点图和饼图,以了解不同变量之间...

  • 发布于 2021-09-05 12:04
  • 阅读 ( 348 )

社会学统计学导论

...典型分数。模式是最常出现的分数,中位数是中间分数,平均值是一组分数的算术平均值。可变性度量代表分数的分散程度。范围是最高和最低分数之间的差异。方差是一组分数平均值的平方偏差的平均值,标准偏差是方差的平...

  • 发布于 2021-09-23 04:46
  • 阅读 ( 239 )

平均值,中位数,(the mean, median,)和模式(mode)的区别

中心趋势的度量是描述数据分布中的平均值或典型值的数字。中心趋势有三个主要度量:平均值、中位数和模式。虽然它们都是中心趋势的度量,但每一个都有不同的计算方法,并且度量的内容也不同于其他度量。 中庸 平...

  • 发布于 2021-09-29 23:06
  • 阅读 ( 744 )

计算平均值、中值和模式

... 当人们谈论统计平均数时,他们指的是平均数。要计算平均值,只需将所有数字相加。接下来,将总和除以您添加的数字。结果是你的平均分或平均分。 例如,假设您有四个测试分数:15、18、22和20。要求平均值,首先将所有...

  • 发布于 2021-10-04 08:50
  • 阅读 ( 198 )
zdhldv319
zdhldv319

0 篇文章

相关推荐