平均值与标准差
在描述性和推断统计学中,用几个指标来描述一个数据集,它对应于它的中心趋势、分散性和偏斜性。在统计推断中,这些通常被称为估计量,因为它们估计总体参数值。
中心倾向是指并定位价值分布的中心。平均值、模式和中位数是描述数据集中趋势最常用的指标。分散是指数据从分布中心扩散的量。范围和标准差是最常用的分散度测量方法。Pearson偏度系数用于描述数据分布的偏度。这里,偏斜是指数据集是否围绕中心对称,如果不是,它的倾斜程度如何。
什么是卑鄙?
平均数是最常用的集中趋势指数。给定一个数据集,取所有数据值之和,然后除以数据数,计算出平均值。例如,10个人的体重(千克)被测量为70、62、65、72、80、70、63、72、77和79。然后十个人的平均体重(公斤)可以计算如下。权重之和为70+62+65+72+80+70+63+72+77+79=710。平均值=(总和)/(数据数量)=710/10=71(千克)。
正如在这个特定的例子中,数据集的平均值可能不是集合的数据点,而是对于给定的数据集是唯一的。平均值与原始数据的单位相同。因此,它可以标记在与数据相同的轴上,并可用于比较。此外,对于数据集的平均值没有符号限制。它可以是负的、零的或正的,因为数据集的总和可以是负的、零的或正的。
什么是标准差?
标准差是最常用的离散度指标。为了计算标准差,首先计算数据值与平均值的偏差。偏差的均方根称为标准差。
在前面的示例中,与平均值的偏差分别为(70–71)=-1,(62-71)=-9,(65-71)=-6,(72-71)=1,(80-71)=9,(70-71)=1,(63-71)=8,(72-71)=1,(77-71)=6和(79-71)=8。偏差平方和为(-1)2+(-9)2+(-6)2+12+92+(-1)2+(-8)2+12+62+82=366。标准偏差为√(366/10)=6.05(千克)。由此,可以得出结论,如果数据集没有严重倾斜,则大多数数据在71±6.05的区间内,并且在这个特定示例中确实如此。
由于标准差的单位与原始数据相同,因此它可以测量数据偏离中心的程度;标准差越大,离差越大。此外,无论数据集中的数据的性质如何,标准偏差都将是非负值。
标准差和平均值有什么区别?•标准偏差是对中心离散度的测量,而平均值测量数据集中心的位置。•标准偏差始终是非负值,但平均值可以取任何实际值。 |