平均值與標準差
在描述性和推斷統計學中,用幾個指標來描述一個數據集,它對應於它的中心趨勢、分散性和偏斜性。在統計推斷中,這些通常被稱為估計量,因為它們估計總體參數值。
中心傾向是指並定位價值分佈的中心。平均值、模式和中位數是描述數據集中趨勢最常用的指標。分散是指數據從分佈中心擴散的量。範圍和標準差是最常用的分散度測量方法。Pearson偏度係數用於描述數據分佈的偏度。這裡,偏斜是指數據集是否圍繞中心對稱,如果不是,它的傾斜程度如何。
什麼是卑鄙?
平均數是最常用的集中趨勢指數。給定一個數據集,取所有數據值之和,然後除以數據數,計算出平均值。例如,10個人的體重(千克)被測量為70、62、65、72、80、70、63、72、77和79。然後十個人的平均體重(公斤)可以計算如下。權重之和為70+62+65+72+80+70+63+72+77+79=710。平均值=(總和)/(數據數量)=710/10=71(千克)。
正如在這個特定的例子中,數據集的平均值可能不是集合的數據點,而是對於給定的數據集是唯一的。平均值與原始數據的單位相同。因此,它可以標記在與數據相同的軸上,並可用於比較。此外,對於數據集的平均值沒有符號限制。它可以是負的、零的或正的,因為數據集的總和可以是負的、零的或正的。
什麼是標準差?
標準差是最常用的離散度指標。為了計算標準差,首先計算數據值與平均值的偏差。偏差的均方根稱為標準差。
在前面的示例中,與平均值的偏差分別為(70–71)=-1,(62-71)=-9,(65-71)=-6,(72-71)=1,(80-71)=9,(70-71)=1,(63-71)=8,(72-71)=1,(77-71)=6和(79-71)=8。偏差平方和為(-1)2+(-9)2+(-6)2+12+92+(-1)2+(-8)2+12+62+82=366。標準偏差為√(366/10)=6.05(千克)。由此,可以得出結論,如果數據集沒有嚴重傾斜,則大多數數據在71±6.05的區間內,並且在這個特定示例中確實如此。
由於標準差的單位與原始數據相同,因此它可以測量數據偏離中心的程度;標準差越大,離差越大。此外,無論數據集中的數據的性質如何,標準偏差都將是非負值。
標準差和平均值有什麼區別?•標準偏差是對中心離散度的測量,而平均值測量數據集中心的位置。•標準偏差始終是非負值,但平均值可以取任何實際值。 |