介紹
標準差(SD)和標準誤差(SE)是兩個看似相似的術語;然而,它們在概念上千差萬別,在統計文獻中幾乎可以互換使用。這兩個術語前面通常都有一個加減符號(+/-),表示它們定義了一個對稱值或表示了一系列值。這兩個術語總是以一組測量值的平均值出現。
有趣的是,SE與標準、錯誤或科學資料的交流無關。
仔細研究SD和SE的起源和解釋,就會發現,為什麼專業統計學家和那些草率使用它的人都會犯錯。
標準差(SD)
標準差是描述分佈擴散的描述性統計。作為一個度量,當資料是正態分佈時,它是有用的。然而,當資料高度傾斜或雙峰時,它就不那麼有用了,因為它不能很好地描述分佈的形狀。通常,我們在報告樣本特徵時使用標準差,因為我們打算描述資料在平均值周圍的變化程度。描述資料傳播的其他有用統計資料包括四分位間距、第25和第75百分位以及資料範圍。
圖1.SD是資料擴散的度量。當資料是正態分佈的樣本時,人們期望三分之二的資料在平均值的1個標準差之內。
方差也是一種描述性統計,它被定義為標準差的平方。在描述結果時通常不報告,但它是一個更易於數學處理的公式(也稱為方差平方和),在統計計算中起作用。
例如,如果我們有兩個統計P&;方差已知的Q var(P)&;var(Q),那麼P+Q之和的方差等於方差之和:var(P)+var(Q)。現在很明顯為什麼統計學家喜歡談論方差。
但標準差對擴散具有重要意義,特別是當資料為正態分佈時:區間平均值+/-1 SD可捕獲2/3的樣本,區間平均值+-2 SD可捕獲95%的樣本。
SD提供了一個問題的個體回答偏離平均值的程度的指示。SD告訴研究者這些反應是如何分散的——它們是集中在平均值附近,還是分散在很遠的地方?你的所有受訪者對你的產品的評價都在你的量表中間,還是有些人贊成,有些人不贊成?
考慮一個實驗,在這個實驗中,受訪者被要求對一個產品的一系列屬性進行5分制評分。一組10名受訪者(下麵標記為“a”到“J”)的“物有所值”平均值為3.2,標準差為0.4,“產品可靠性”平均值為3.4,標準差為2.1。
乍一看(只看手段),可靠性似乎比價值更高。但較高的可靠性標準差可能表明(如下麵的分佈所示),回答是非常兩極分化的,大多數受訪者沒有可靠性問題(將屬性評級為“5”),但較小但重要的部分受訪者有可靠性問題,將屬性評級為“1”。單看平均數只能說明一部分情況,然而,更多的時候,這是研究人員關註的重點。回答的分佈是需要考慮的重要因素,SD提供了一個有價值的描述性度量。
答辯人 | 物有所值 | 產品可靠性 |
A | 三 | 1 |
B | 三 | 1 |
C | 三 | 1 |
D | 三 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 三 | 5 |
H | 三 | 5 |
我 | 三 | 5 |
J | 三 | 5 |
中庸 | 3.2 | 3.4 |
標準偏差。 | 0.4 | 2.1 |
第一次調查:受訪者用5分制對產品進行評級
兩個非常不同的分佈對一個5分評分量表的反應可以產生相同的平均數。考慮下麵顯示兩個不同評級的響應值的示例。
在第一個例子(評級“A”)中,SD為零,因為所有的回答都是平均值。個體的反應完全沒有偏離平均值。
在評級“B”時,即使組平均值與第一次分佈相同(3.0),標準差也較高。標準差為1.15表明,平均而言,個人回答與平均值相差略大於1點。
答辯人 | 評級“A” | 評級“B” |
A | 三 | 1 |
B | 三 | 2 |
C | 三 | 2 |
D | 三 | 三 |
E | 三 | 三 |
F | 三 | 三 |
G | 三 | 三 |
H | 三 | 4 |
我 | 三 | 4 |
J | 三 | 5 |
中庸 | 3 | 3 |
標準偏差。 | 0 | 1.15 |
第二項調查:受訪者用5分制對產品進行評級
另一種觀察SD的方法是將分佈繪製成響應的直方圖。低SD分佈將顯示為高窄形狀,而大SD將顯示為寬形狀。
SD通常並不表示“對或錯”或“更好或更壞”——SD越低並不一定越可取。它純粹用作描述性統計。它描述了相對於平均值的分佈。
與SD相關的技術免責宣告
將標準差視為“平均偏差”是從概念上理解其含義的一個很好的方法。然而,它實際上並不是作為平均值來計算的(如果是的話,我們稱之為“平均偏差”)。相反,它是“標準化”的,一種使用平方和計算值的有點複雜的方法。
在實際應用中,計算並不重要。大多數製表程式、電子錶格或其他資料管理工具都會為您計算SD。更重要的是要瞭解統計數字所傳達的資訊。
標準誤差
標準誤差是一種推斷統計,用於比較不同人群的樣本均值(平均值)。它是樣本平均值精度的度量。樣本平均數是從具有潛在分佈的資料中得出的統計資料。我們不能用與資料相同的方式將其視覺化,因為我們只進行了一個實驗,只有一個值。統計理論告訴我們,樣本均值(對於一個“足夠”的大樣本,在一些規則性條件下)近似正態分佈。這個正態分佈的標準差就是我們所說的標準誤差。
圖2.底部的分佈代表資料的分佈,而頂部的分佈是樣本平均數的理論分佈。SD為20是資料擴散的度量,而SE為5是樣本平均值周圍不確定度的度量。
當我們想要比較治療a和治療B的兩個樣本實驗的結果平均值時,我們需要估計我們測量平均值的精確程度。
實際上,我們感興趣的是如何精確地測量這兩種方法之間的差異。我們稱之為差的標準誤差。當您得知樣本均值差異的標準誤差是均值標準誤差的函式時,您可能不會感到驚訝:
既然你已經瞭解了均值的標準差(SE)和分佈的標準差(SD)是兩個不同的野獸,你可能會想知道他們最初是怎麼搞混的。雖然它們在概念上不同,但在數學上有一個簡單的關係:
,其中n是資料點的數量。
請註意,標準誤差取決於兩個分量:樣本的標準偏差和樣本的大小n。這是很直觀的:樣本的標準差越大,我們對真實均值的估計就越不精確。
而且,樣本量越大,我們掌握的關於人口的資訊就越多,我們就越能準確地估計出真實的平均數。
SE表示平均值的可靠性。小的SE表示樣本平均值更準確地反映了實際總體平均值。較大的樣本量通常會導致較小的SE(而SD不受樣本量的直接影響)。
大多數調查研究都涉及從人群中抽取樣本。然後,我們根據從該樣本獲得的結果來推斷人口。如果抽取第二個樣本,結果可能與第一個樣本不完全匹配。如果評級屬性的平均值對於一個樣本是3.2,那麼對於相同大小的第二個樣本可能是3.4。如果我們要從我們的總體中抽取無限數量的樣本(大小相等),我們可以將觀察到的平均數顯示為一個分佈。然後我們可以計算所有樣本平均值。這個平均數等於真實的人口平均數。我們還可以計算樣本均值分佈的標準差。樣本均值分佈的SD是每個樣本均值的SE。
因此,我們有最重要的觀察結果:SE是人口平均數的標準差。
樣品 | 中庸 |
第一 | 3.2 |
第二 | 3.4 |
第三 | 3.3 |
第四 | 3.2 |
第五 | 3.1 |
…. | …. |
…. | …. |
…. | …. |
…. | …. |
…. | …. |
中庸 | 3.3 |
標準偏差。 | 0.13 |
說明SD和SE之間關係的表格
現在很清楚,如果這個分佈的SD幫助我們理解樣本平均值與真實人口平均值之間的距離,那麼我們可以用這個來理解任何單個樣本平均值與真實平均值之間的精確程度。這就是SE的本質。
實際上,我們只從我們的人群中抽取了一個樣本,但是我們可以用這個結果來估計我們觀察到的樣本均值的可靠性。
事實上,SE告訴我們,我們可以95%確信我們觀察到的樣本平均值是正負大約2(實際上是1.96)個標準誤差。
下表顯示了我們用於研究的第一個(也是唯一一個)樣本的回答分佈。相對較小的SE值為0.13,表明我們的平均值與總體人口的真實平均值相對接近。我們的平均值的誤差範圍(95%置信度)是(大約)該值的兩倍(+/-0.26),告訴我們真實的平均值很可能在2.94和3.46之間。
答辯人 | 評級 |
A | 三 |
B | 三 |
C | 三 |
D | 三 |
E | 4 |
F | 4 |
G | 三 |
H | 三 |
我 | 三 |
J | 三 |
中庸 | 3.2 |
標準誤差 | 0.13 |
摘要
許多研究者未能理解標準差和標準差之間的區別,儘管它們通常包含在資料分析中。雖然標準差和標準誤差的實際計算看起來非常相似,但它們代表了兩個非常不同但互補的度量。SD告訴我們分佈的形狀,單個資料值與平均值的接近程度。SE告訴我們我們的樣本平均值與總人口的真實平均值有多接近。它們共同提供了一個比平均數更完整的影象。
...些在準備滴定所需溶液時非常重要。 什麼是標準溶液(a standard solution)? 標準溶液是具有精確已知濃度的濃縮溶液。在標準溶液的製備過程中,我們可以使用精確稱量的溶質,並將其溶解在合適的溶劑中,以得到特定體積的溶液...
... 4. 並列比較-標準化與表格滴定法 5. 摘要 什麼是標準化(standardization)? 標準化是一種分析技術,我們使用一級或二級標準溶液來確定未知濃度。溶液標準化最常用的技術是滴定法。對於標準化過程,需要標準溶液作為參考。標...
...的濃度、形成離子的趨勢和溫度。 什麼是標準電極電位(standard electrode potential)? 標準電極電位是標準條件下半電池的電位。兩個電極之間的電位差是產生電的結果。沒有辦法簡單而準確地測量電極電位。此外,它還隨系統的溫...
...氣壓力,因此形成了液體蒸汽的氣泡。 什麼是標準沸點(standard boiling point)? 標準沸點是液體在1巴的沸點。而且,我們認為這是IUPAC定義沸點(1982年以來)的溫度。例如,標準沸點為99.61°C,在1巴。 正常沸點(normal boiling point)和...
...自由能,H是焓,T是絕對溫度,S是熵 什麼是標準自由能(standard free energy)? 標準自由能是在標準實驗條件下給出吉布斯自由能的熱力學量。這意味著,為了將熱力學系統的能量命名為標準自由能,該系統的反應物和產物應處於標...
汙水處理廠(stp)和標準摩爾體積(standard molar volume)的區別 術語STP代表標準溫度和壓力。IUPAC給出273.15 K(0°C或32°F)作為標準溫度,105 Pa(1.00原子或1 bar)作為標準壓力。標準摩爾體積是一摩爾物質在標準溫度和壓力下的體積...
實際成本(actual cost)和標準成本(standard cost)的區別 實際成本和標準成本是管理會計中常用的兩個術語。實際成本與標準成本的關鍵區別在於,實際成本是指已發生或已支付的成本,而標準成本是指考慮到應發生的材料、人工和...
閒置成本(idle cost)和標準成本(standard cost)的區別 成本是企業的一個重要方面,應該對其進行有效管理,以獲得更高的利潤率。透過適當的規劃、有效的資源分配和持續的監測和控制,成本可以保持在可接受的水平。閒置成本...
...統計資料的準確性仍然存在疑問。Excel允許您根據樣本的標準偏差計算不確定度。 Excel中有統計公式可以用來計算不確定度。在本文中,我們將計算算術平均值、標準差和標準誤差。我們還將研究如何在Excel中的圖表上繪製這種...
...值的幾率更大,因此尾部更肥。 關鍵要點 當估計的標準差用於分母而不是真正的標準差時,T分佈是z分數的連續概率分佈。 與正態分佈一樣,T分佈是鐘形對稱的,但它有較重的尾部,這意味著它傾向於產生遠離平均值的值...