t檢驗

t檢驗是一種推斷統計量，用於確定兩組的均值是否存在顯著差異，這可能與某些特徵有關。它主要用於當資料集，如記錄為100次拋硬幣結果的資料集，將遵循正態分佈，可能有未知的方差。t檢驗被用作假設檢驗工具，它允許檢驗適用於人群的假設。...

什麼是t檢驗(a t-test)？

t檢驗是一種推斷統計量，用於確定兩組的均值是否存在顯著差異，這可能與某些特徵有關。它主要用於當資料集，如記錄為100次拋硬幣結果的資料集，將遵循正態分佈，可能有未知的方差。t檢驗被用作假設檢驗工具，它允許檢驗適用於人群的假設。

t檢驗檢查t統計量、t分佈值和自由度以確定統計顯著性。要用三種或三種以上的平均數進行檢驗，必須使用方差分析。

關鍵要點

t檢驗是一種推斷統計量，用於確定兩組的均值是否存在顯著差異，這可能與某些特徵有關。
t檢驗是許多用於研究目的的檢驗之一
計算t檢驗需要三個關鍵資料值。它們包括每個資料集的平均值之間的差異（稱為平均差）、每組的標準差以及每組資料值的數量。
根據所需的資料和分析型別，可以進行幾種不同型別的t檢驗。

1:38

T檢驗

解釋t檢驗

本質上，t檢驗允許我們比較兩個資料集的平均值，並確定它們是否來自同一人群。在上面的例子中，如果我們從a班的學生和B班的學生中抽取一個樣本，我們不會期望他們有完全相同的平均值和標準差。同樣地，從安慰劑對照組和從藥物處方組採集的樣本應具有稍微不同的平均值和標準偏差。

在數學上，t檢驗從兩組樣本中抽取一個樣本，並透過假設兩個均值相等的零假設來建立問題陳述。根據適用的公式，計算某些值並與標準值進行比較，並相應地接受或拒絕假定的無效假設。

如果零假設符合被拒絕的條件，則表明資料讀數很強，可能不是偶然的。t檢驗只是用於此目的的眾多檢驗之一。統計學家還必須使用t檢驗以外的檢驗來檢驗更多的變數和更大樣本量的檢驗。對於大樣本，統計學家使用z檢驗。其他測試選項包括卡方檢驗和f檢驗。

t檢驗有三種型別，分為依賴性t檢驗和獨立性t檢驗。

測試結果不明確

試想一下，一個藥品**商想測試一種新發明的藥品。它遵循的標準程式是在一組病人身上試驗藥物，然後給另一組病人（稱為對照組）服用安慰劑。給予對照組的安慰劑是一種沒有預期治療價值的物質，並作為衡量給予實際藥物的另一組如何反應的基準。

藥物試驗後，服用安慰劑的對照組成員報告平均預期壽命增加了3年，而服用新藥的對照組成員報告平均預期壽命增加了4年。即時觀察可能表明該藥物確實有效，因為對使用該藥物的人群效果更好。然而，觀察結果也有可能是偶然發生的，特別是意外的運氣。t檢驗有助於判斷結果是否正確，是否適用於整個人群。

在一所學校，100名a班學生的平均得分為85%，標準差為3%。另外100名B班學生的平均得分為87%，標準差為4%。雖然B班的平均成績好於A班，但如果得出B班學生的總體成績好於A班的結論可能是不正確的。這是因為兩個班的考試成績都有自然的差異，所以這種差異可能僅僅是由於偶然性造成的。t檢驗有助於判斷一個班級的表現是否比另一個好。

t檢驗假設

關於t檢驗的第一個假設涉及測量範圍。t檢驗的假設是，應用於所收集資料的測量量表遵循連續或順序量表，例如智商測試的分數。
第二個假設是簡單的隨機樣本，即資料是從總人口中有代表性的隨機選擇部分收集的。
第三個假設是，當繪製資料時，結果是正態分佈，鐘形分佈曲線。
最後的假設是方差的均勻性。當樣本的標準差近似相等時，存在均勻或相等的方差。

計算t檢驗

計算t檢驗需要三個關鍵資料值。它們包括每個資料集的平均值之間的差異（稱為平均差）、每組的標準差以及每組資料值的數量。

t檢驗的結果產生t值。然後將計算出的t值與從臨界值表（稱為t分佈表）獲得的值進行比較。這種比較有助於確定機會單獨對差異的影響，以及差異是否超出了機會範圍。t檢驗的問題是，兩組之間的差異是否代表了研究中的真實差異，或者是否可能是無意義的隨機差異。

t分佈表

T分佈表有單尾和雙尾兩種格式。前者用於評估具有明確方向（正或負）的固定值或範圍的案例。例如，當擲一對骰子時，輸出值保持在-3以下或超過7的概率是多少？後者用於範圍界限分析，例如詢問坐標是否介於-2和+2之間。

可以使用支援必要統計功能的標準軟體程式（如MS Excel中的程式）進行計算。

t值和自由度

t檢驗產生兩個值作為其輸出：t值和自由度。t值是兩個樣本集的平均值之差與樣本集記憶體在的變化之比。雖然分子值（兩個樣本集的平均值之差）的計算很簡單，但分母（樣本集中存在的變化）可能會變得有點複雜，這取決於所涉及的資料值的型別。比率的分母是對離散度或可變性的度量。t值越高，也稱為t得分，表明兩個樣本集之間存在很大差異。t值越小，兩個樣本集之間的相似度越高。

一個大的t分數表明，這兩組是不同的。
一個小的t分數表示這些組是相似的。

自由度是指在一項研究中，可以自由改變的價值觀，對於評估無效假設的重要性和有效性至關重要。這些值的計算通常取決於樣本集中可用資料記錄的數量。

等方差（或混合）t檢驗

當每組樣本數相同，或兩組資料的方差相似時，採用等方差t檢驗。以下公式用於計算等方差t檢驗的t值和自由度：

T值=平均值1−平均值2（n1−1)×var12+（n2−1)×var22n1+n2−2×1n1+1n2where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{（n1-1）\times var1^2+（n2-1）\times var2^2}{n1+n2-2}\times\sqrt{\frac{1}{n1}+\frac{1}{n2}}}\\&amp\textbf{其中：}\\&amp；mean1\text{和}mean2=\text{每個的平均值}\\&amp\文字{樣本集的}\\&amp；var1\text{和}var2=\text{每個樣本集的方差}\\&amp；n1\text{和}n2=\text{每個樣本集中的記錄數}\end{對齊}T值=n1+n2−2（n1）−1)×var12+（n2−1)×瓦爾22×11號+21號平均值1−平均值2where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差

而且，

自由度=n1+n2−2where:n1 and n2=每個樣本集中的記錄數\begin{aligned}&amp\text{自由度}=n1+n2-2\\&amp\textbf{其中：}\\&amp；n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}自由度=n1+n2−2where:n1 and n2=每個樣本集中的記錄數

不等方差t檢驗

當每組樣本數不同，且兩組資料的方差也不同時，採用不等方差t檢驗。這個測試也被稱為韋爾奇的t-測試。以下公式用於計算不等方差t檢驗的t值和自由度：

T值=平均值1−平均2VAR12N1+var22n2where:mean1 and mean2=每個樣本集var1和var2的平均值=每個樣本集的方差n1和n2=每個樣本集中的記錄數\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{var1^2}{n1}+\frac{var2^2}{n2}}\\&amp\textbf{其中：}\\&amp；mean1\text{和}mean2=\text{每個的平均值}\\&amp\文字{樣本集的}\\&amp；var1\text{和}var2=\text{每個樣本集的方差}\\&amp；n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}T值=n1var12+n2var22型平均值1−平均值2where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數

而且，

自由度=（var12n1+var22n2）2（var12n1）2n1−1+（var22n2）2n2−1where:var1 and var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數\begin{aligned}&amp\text{Degrees of Freedom}=\frac{\left（\frac{var1^2}{n1}+\frac{var2^2}{n2}\ right）^2}{\frac{\left（\frac{var1^2}{n1}\ right）^2}{n1-1}+\frac{\left（\frac{var2^2}{n2}\ right）^2}{n2-1}\&amp\textbf{其中：}\\&amp；var1\text{和}var2=\text{每個樣本集的方差}\\&amp；n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}自由度=n1−1（N12）)2+氮氣−1（N22VAR22）)2(n1var12型+n2var22型)2where:var1 and var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數