t檢驗

t檢驗是一種推斷統計量,用於確定兩組的均值是否存在顯著差異,這可能與某些特徵有關。它主要用於當資料集,如記錄為100次拋硬幣結果的資料集,將遵循正態分佈,可能有未知的方差。t檢驗被用作假設檢驗工具,它允許檢驗適用於人群的假設。...

什麼是t檢驗(a t-test)?

t檢驗是一種推斷統計量,用於確定兩組的均值是否存在顯著差異,這可能與某些特徵有關。它主要用於當資料集,如記錄為100次拋硬幣結果的資料集,將遵循正態分佈,可能有未知的方差。t檢驗被用作假設檢驗工具,它允許檢驗適用於人群的假設。

t檢驗檢查t統計量、t分佈值和自由度以確定統計顯著性。要用三種或三種以上的平均數進行檢驗,必須使用方差分析。

關鍵要點

  • t檢驗是一種推斷統計量,用於確定兩組的均值是否存在顯著差異,這可能與某些特徵有關。
  • t檢驗是許多用於研究目的的檢驗之一
  • 計算t檢驗需要三個關鍵資料值。它們包括每個資料集的平均值之間的差異(稱為平均差)、每組的標準差以及每組資料值的數量。
  • 根據所需的資料和分析型別,可以進行幾種不同型別的t檢驗。

1:38

T檢驗

解釋t檢驗

本質上,t檢驗允許我們比較兩個資料集的平均值,並確定它們是否來自同一人群。在上面的例子中,如果我們從a班的學生和B班的學生中抽取一個樣本,我們不會期望他們有完全相同的平均值和標準差。同樣地,從安慰劑對照組和從藥物處方組採集的樣本應具有稍微不同的平均值和標準偏差。

在數學上,t檢驗從兩組樣本中抽取一個樣本,並透過假設兩個均值相等的零假設來建立問題陳述。根據適用的公式,計算某些值並與標準值進行比較,並相應地接受或拒絕假定的無效假設。

如果零假設符合被拒絕的條件,則表明資料讀數很強,可能不是偶然的。t檢驗只是用於此目的的眾多檢驗之一。統計學家還必須使用t檢驗以外的檢驗來檢驗更多的變數和更大樣本量的檢驗。對於大樣本,統計學家使用z檢驗。其他測試選項包括卡方檢驗和f檢驗。

t檢驗有三種型別,分為依賴性t檢驗和獨立性t檢驗。

測試結果不明確

試想一下,一個藥品**商想測試一種新發明的藥品。它遵循的標準程式是在一組病人身上試驗藥物,然後給另一組病人(稱為對照組)服用安慰劑。給予對照組的安慰劑是一種沒有預期治療價值的物質,並作為衡量給予實際藥物的另一組如何反應的基準。

藥物試驗後,服用安慰劑的對照組成員報告平均預期壽命增加了3年,而服用新藥的對照組成員報告平均預期壽命增加了4年。即時觀察可能表明該藥物確實有效,因為對使用該藥物的人群效果更好。然而,觀察結果也有可能是偶然發生的,特別是意外的運氣。t檢驗有助於判斷結果是否正確,是否適用於整個人群。

在一所學校,100名a班學生的平均得分為85%,標準差為3%。另外100名B班學生的平均得分為87%,標準差為4%。雖然B班的平均成績好於A班,但如果得出B班學生的總體成績好於A班的結論可能是不正確的。這是因為兩個班的考試成績都有自然的差異,所以這種差異可能僅僅是由於偶然性造成的。t檢驗有助於判斷一個班級的表現是否比另一個好。

t檢驗假設

  1. 關於t檢驗的第一個假設涉及測量範圍。t檢驗的假設是,應用於所收集資料的測量量表遵循連續或順序量表,例如智商測試的分數。
  2. 第二個假設是簡單的隨機樣本,即資料是從總人口中有代表性的隨機選擇部分收集的。
  3. 第三個假設是,當繪製資料時,結果是正態分佈,鐘形分佈曲線。
  4. 最後的假設是方差的均勻性。當樣本的標準差近似相等時,存在均勻或相等的方差。

計算t檢驗

計算t檢驗需要三個關鍵資料值。它們包括每個資料集的平均值之間的差異(稱為平均差)、每組的標準差以及每組資料值的數量。

t檢驗的結果產生t值。然後將計算出的t值與從臨界值表(稱為t分佈表)獲得的值進行比較。這種比較有助於確定機會單獨對差異的影響,以及差異是否超出了機會範圍。t檢驗的問題是,兩組之間的差異是否代表了研究中的真實差異,或者是否可能是無意義的隨機差異。

t分佈表

T分佈表有單尾和雙尾兩種格式。前者用於評估具有明確方向(正或負)的固定值或範圍的案例。例如,當擲一對骰子時,輸出值保持在-3以下或超過7的概率是多少?後者用於範圍界限分析,例如詢問坐標是否介於-2和+2之間。

可以使用支援必要統計功能的標準軟體程式(如MS Excel中的程式)進行計算。

t值和自由度

t檢驗產生兩個值作為其輸出:t值和自由度。t值是兩個樣本集的平均值之差與樣本集記憶體在的變化之比。雖然分子值(兩個樣本集的平均值之差)的計算很簡單,但分母(樣本集中存在的變化)可能會變得有點複雜,這取決於所涉及的資料值的型別。比率的分母是對離散度或可變性的度量。t值越高,也稱為t得分,表明兩個樣本集之間存在很大差異。t值越小,兩個樣本集之間的相似度越高。

  • 一個大的t分數表明,這兩組是不同的。
  • 一個小的t分數表示這些組是相似的。

自由度是指在一項研究中,可以自由改變的價值觀,對於評估無效假設的重要性和有效性至關重要。這些值的計算通常取決於樣本集中可用資料記錄的數量。

相關(或配對)t檢驗

當樣本通常由相似單位的配對組成時,或當存在重覆測量的情況時,進行相關t檢驗。例如,在接受特定治療前後,可能會有相同的患者反覆接受測試的情況。在這種情況下,每個患者都被用作對照樣本。

此方法也適用於樣本以某種方式相關或具有匹配特徵的情況,例如涉及兒童、父母或兄弟姐妹的比較分析。相關或配對t檢驗屬於依賴型別,因為這涉及兩組樣本相關的情況。

計算配對t檢驗的t值和自由度的公式為:

T=平均值1−平均2秒(差)(n)where:mean1 and mean2=每個樣本集的平均值(diff)=成對資料值差異的標準偏差sn=樣本大小(成對差異的數量)\begin{aligned}&T=\frac{\textit{mean}1-\textit{mean}2}{\frac{s(\text{diff})}{\sqrt{(n)}}}}\\&amp\textbf{其中:}\\&amp\textit{mean}1\text{和}\textit{mean}2=\text{每個樣本集的平均值}\\&s(\text{diff})=\text{成對資料值差異的標準偏差}\\&n=\text{樣本大小(成對差異數)}\\&n-1=\text{自由度}\end{對齊}​T=(n)​s(差異)​平均值1−平均值2​where:mean1 and mean2=每個樣本集的平均值(diff)=成對資料值差異的標準偏差sn=樣本大小(成對差異的數量)​

其餘兩種屬於獨立t檢驗。這些型別的樣本是獨立選擇的,即兩組中的資料集引用的值不同。這些病例包括一組100名患者被分成兩組,每組50名患者。其中一組成為對照組,給予安慰劑,另一組接受處方治療。這構成了兩個相互不配對的獨立樣本組。

等方差(或混合)t檢驗

當每組樣本數相同,或兩組資料的方差相似時,採用等方差t檢驗。以下公式用於計算等方差t檢驗的t值和自由度:

T值=平均值1−平均值2(n1−1)×var12+(n2−1)×var22n1+n2−2×1n1+1n2where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{(n1-1)\times var1^2+(n2-1)\times var2^2}{n1+n2-2}\times\sqrt{\frac{1}{n1}+\frac{1}{n2}}}\\&amp\textbf{其中:}\\&mean1\text{和}mean2=\text{每個的平均值}\\&amp\文字{樣本集的}\\&var1\text{和}var2=\text{每個樣本集的方差}\\&n1\text{和}n2=\text{每個樣本集中的記錄數}\end{對齊}​T值=n1+n2−2(n1)−1)×var12+(n2−1)×瓦爾22​×11號​+21號​​平均值1−平均值2​where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差​

而且,

自由度=n1+n2−2where:n1 and n2=每個樣本集中的記錄數\begin{aligned}&amp\text{自由度}=n1+n2-2\\&amp\textbf{其中:}\\&n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}​自由度=n1+n2−2where:n1 and n2=每個樣本集中的記錄數​

不等方差t檢驗

當每組樣本數不同,且兩組資料的方差也不同時,採用不等方差t檢驗。這個測試也被稱為韋爾奇的t-測試。以下公式用於計算不等方差t檢驗的t值和自由度:

T值=平均值1−平均2VAR12N1+var22n2where:mean1 and mean2=每個樣本集var1和var2的平均值=每個樣本集的方差n1和n2=每個樣本集中的記錄數\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{var1^2}{n1}+\frac{var2^2}{n2}}\\&amp\textbf{其中:}\\&mean1\text{和}mean2=\text{每個的平均值}\\&amp\文字{樣本集的}\\&var1\text{和}var2=\text{每個樣本集的方差}\\&n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}​T值=n1var12​+n2var22型​平均值1−平均值2​where:mean1 and mean2=每個樣本集的平均值var1和var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數​

而且,

自由度=(var12n1+var22n2)2(var12n1)2n1−1+(var22n2)2n2−1where:var1 and var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數\begin{aligned}&amp\text{Degrees of Freedom}=\frac{\left(\frac{var1^2}{n1}+\frac{var2^2}{n2}\ right)^2}{\frac{\left(\frac{var1^2}{n1}\ right)^2}{n1-1}+\frac{\left(\frac{var2^2}{n2}\ right)^2}{n2-1}\&amp\textbf{其中:}\\&var1\text{和}var2=\text{每個樣本集的方差}\\&n1\text{和}n2=\text{每個樣本集中的記錄數}\\\結束{對齊}​自由度=n1−1(N12)​)2​+氮氣−1(N22VAR22)​)2​(n1var12型​+n2var22型​)2​where:var1 and var2=每個樣本集的方差n1和n2=每個樣本集中的記錄數​

確定要使用的正確t檢驗

以下流程圖可用於根據樣本集的特徵確定應使用哪個t檢驗。要考慮的關鍵專案包括樣本記錄是否相似、每個樣本集中的資料記錄數以及每個樣本集的方差。

T-test

不等方差t檢驗示例

假設我們對美術館中收到的畫進行對角線測量。一組樣品包括10幅畫,另一組包括20幅畫。資料集及其相應的均值和方差值如下:

  • 發表於 2021-06-04 13:19
  • 閱讀 ( 68 )
  • 分類:金融

你可能感興趣的文章

如何在excel中進行基礎資料分析

...您希望使用統計軟體。這些工具是用來做計算的,比如t檢驗、卡方檢驗、相關性等等。Excel不是用來進行資料分析的。但這並不意味著你做不到。 ...

  • 發佈於 2021-03-12 01:13
  • 閲讀 ( 50 )

如何在excel中計算基本統計:初學者指南

...,平均值,樣本和總體的標準差,標準誤差,和學生的T檢驗嗎? ...

  • 發佈於 2021-03-12 03:31
  • 閲讀 ( 49 )

instagram制定了更嚴格的規則來控制騷擾、色情和裸體

...oo.
 新規則的有效性和公平性將透過它們的執行方式來檢驗,尤其是現在這項服務每月的唯一使用者已經高達3億。據《華爾街日報》報道,這款應用程式審查的圖片“會引發使用者投訴”。

  • 發佈於 2021-04-29 13:58
  • 閲讀 ( 39 )

雙尾檢驗

什麼是雙尾檢驗(a two-tailed test)? 在統計學中,雙尾檢驗是一種方法,在這種方法中,分佈的臨介面積是雙邊的,檢驗一個樣本是否大於或小於某一範圍的值。它用於零假設檢驗和統計顯著性檢驗。如果被測試的樣本落入任何一...

  • 發佈於 2021-05-31 08:55
  • 閲讀 ( 48 )

t檢驗

什麼是t檢驗(a t-test)? t檢驗是一種推斷統計量,用於確定兩組的均值是否存在顯著差異,這可能與某些特徵有關。它主要用於當資料集,如記錄為100次拋硬幣結果的資料集,將遵循正態分佈,可能有未知的方差。t檢驗被用作假...

  • 發佈於 2021-06-04 13:19
  • 閲讀 ( 68 )

t分佈定義

...這意味著它傾向於產生遠離平均值的值。 統計學中使用T檢驗來估計顯著性。 t分佈告訴你什麼? 尾重由稱為自由度的T分佈引數決定,較小的值表示尾重,較大的值表示T分佈類似於標準正態分佈,平均值為0,標準偏差為1。T...

  • 發佈於 2021-06-04 21:23
  • 閲讀 ( 52 )

t檢驗(t-test)和方差分析(anova)的區別

t檢驗與方差分析 收集和計算統計資料以獲得平均值往往是一個漫長而乏味的過程。t檢驗和單因素方差分析(ANOVA)是兩種最常用的檢驗方法。 t檢驗是一種統計假設檢驗,如果零假設得到支援,檢驗統計量遵循學生的t分佈。...

  • 發佈於 2021-06-23 14:03
  • 閲讀 ( 48 )

方差分析(anova)和t檢驗(t-test)的區別

方差分析與T檢驗 T檢驗,有時稱為學生T檢驗,當你想比較兩組的平均數,看他們是否彼此不同時進行。它主要用於當一個隨機分配是給定的,只有兩個,不超過兩個,集比較。在進行T檢驗時,需要滿足一些條件,這樣才能得...

  • 發佈於 2021-06-23 15:51
  • 閲讀 ( 54 )

成對的(paired)和非配對試驗(unpaired test)的區別

配對與非配對檢驗 1908年,愛爾蘭化學家威廉·西利·戈塞特發明瞭t統計量。當他在吉尼斯啤酒廠工作時,他用它來監控一種名為stout的黑啤酒的質量。他用筆名“Student”在Biometrika上發表了這篇文章。有幾種型別的t檢驗,最常...

  • 發佈於 2021-06-23 15:53
  • 閲讀 ( 39 )

引數化(parametric)和非引數(nonparametric)的區別

...規則可以應用於某個群體。他們透過使用引數或非引數的檢驗來檢驗這個假設。引數測試通常更為常見,在進行研究時,它的研究比標準測試早得多。 進行一項研究的過程相對簡單——你構建一個假設,並假設某個“定律”可...

  • 發佈於 2021-06-25 05:34
  • 閲讀 ( 47 )