卡方(χ2）統計定義

卡方檢驗(χ2）統計是一種測試，用來衡量模型與實際觀測資料的比較。用於計算卡方統計量的資料必須是隨機的、原始的、互斥的、從自變數中提取的、從足夠大的樣本中提取的。例如，投擲一枚公平硬幣的結果符合這些標準。...

什麼是卡方統計(a chi-square statistic)？

卡方檢驗(χ2）統計是一種測試，用來衡量模型與實際觀測資料的比較。用於計算卡方統計量的資料必須是隨機的、原始的、互斥的、從自變數中提取的、從足夠大的樣本中提取的。例如，投擲一枚公平硬幣的結果符合這些標準。

卡方檢驗常用於假設檢驗。在給定樣本大小和關係中變數數量的情況下，卡方統計量比較預期結果和實際結果之間的任何差異。在這些測試中，自由度被用來根據實驗中變數和樣本的總數來確定是否可以拒絕某個無效假設。與任何統計一樣，樣本量越大，結果越可靠。

關鍵要點

卡方檢驗(
χ2 depends on the size of the difference between actual and observed values, the degrees of freedom, and the samples size.
χ2 can be used to test whether two variables are related or independent from one another or to test the goodness-of-fit between an observed distribution and a theoretical distribution of frequencies.

卡方的公式是

χc2級=∑(氧指數−Ei）2個iwhere:c=Degrees of freedomO=觀察值\begin{aligned}&amp\chi^2\u c=\sum\frac{（O\u i-E\u i）^2}{E\u i}\\&amp\textbf{其中：}\\&amp；c=\text{自由度}\\&amp；O=\text{觀測值}\\&amp；E=\text{期望值}\end{對齊}χc2級=∑工程安裝(氧指數−工程安裝)2where:c=Degrees 自由度=觀測值

一個卡方統計資料告訴你什麼？

卡方檢驗主要有兩種：獨立性檢驗，它提出了一個關係問題，例如，“學生性別和課程選擇之間有關係嗎？”；還有擬合優度測試，它會問“我手裡的硬幣和理論上公平的硬幣有多匹配？”

獨立

在考慮學生性別和課程選擇時χ2可採用獨立性試驗。為了進行這項測試，研究人員將收集兩個變數（性別和所選課程）的資料，然後使用上面給出的公式和一個簡單的公式比較男女學生在所提供的課程中選擇的頻率χ2統計表。

如果性別和課程選擇之間沒有關係（也就是說，如果他們是獨立的），那麼男女學生選擇每門課程的實際頻率應該大致相等，或者相反，任何一門選修課的男女學生比例應與樣本中男女學生的比例大致相等。Aχ2獨立性檢驗可以告訴我們，隨機機會能夠解釋資料中實際頻率和這些理論預期之間的任何觀察到的差異的可能性有多大。

擬合優度

χ2提供了一種方法來測試一個資料樣本與該樣本所代表的更大群體的（已知或假設）特徵的匹配程度。如果樣本資料不符合我們感興趣的總體的預期屬性，那麼我們就不想用這個樣本來得出關於更大總體的結論。

舉個例子，想象一枚正面或反面有50/50幾率落地的假想硬幣和一枚你擲100次的真硬幣。如果這枚真正的硬幣有一個“是公平的”，那麼它在任何一邊著陸的概率都是相等的，擲硬幣100次的預期結果是正面上升50次，反面上升50次。在這種情況下，χ2可以告訴我們100枚硬幣的實際結果與一枚普通硬幣能給出50/50結果的理論模型相比有多好。實際擲硬幣可能是50/50，60/40，甚至90/10。100次擲硬幣的實際結果離50/50越遠，這組擲硬幣與理論預期的50/50越不吻合，我們就越有可能得出結論，這枚硬幣實際上不是一枚公平的硬幣。