卡方(χ2) 統計定義

卡方檢驗(χ2) 統計是一種測試,用來衡量模型與實際觀測資料的比較。用於計算卡方統計量的資料必須是隨機的、原始的、互斥的、從自變數中提取的、從足夠大的樣本中提取的。例如,投擲一枚公平硬幣的結果符合這些標準。...

什麼是卡方統計(a chi-square statistic)?

卡方檢驗(χ2) 統計是一種測試,用來衡量模型與實際觀測資料的比較。用於計算卡方統計量的資料必須是隨機的、原始的、互斥的、從自變數中提取的、從足夠大的樣本中提取的。例如,投擲一枚公平硬幣的結果符合這些標準。

卡方檢驗常用於假設檢驗。在給定樣本大小和關係中變數數量的情況下,卡方統計量比較預期結果和實際結果之間的任何差異。在這些測試中,自由度被用來根據實驗中變數和樣本的總數來確定是否可以拒絕某個無效假設。與任何統計一樣,樣本量越大,結果越可靠。

關鍵要點

  • 卡方檢驗(
  • χ2 depends on the size of the difference between actual and observed values, the degrees of freedom, and the samples size.
  • χ2 can be used to test whether two variables are related or independent from one another or to test the goodness-of-fit between an observed distribution and a theoretical distribution of frequencies.

卡方的公式是

χc2級=∑(氧指數−Ei)2個iwhere:c=Degrees of freedomO=觀察值\begin{aligned}&amp\chi^2\u c=\sum\frac{(O\u i-E\u i)^2}{E\u i}\\&amp\textbf{其中:}\\&c=\text{自由度}\\&O=\text{觀測值}\\&E=\text{期望值}\end{對齊}​χc2級​=∑工程安裝​(氧指數​−工程安裝​)2​where:c=Degrees 自由度=觀測值​

一個卡方統計資料告訴你什麼?

卡方檢驗主要有兩種:獨立性檢驗,它提出了一個關係問題,例如,“學生性別和課程選擇之間有關係嗎?”;還有擬合優度測試,它會問“我手裡的硬幣和理論上公平的硬幣有多匹配?”

獨立

在考慮學生性別和課程選擇時χ2可採用獨立性試驗。為了進行這項測試,研究人員將收集兩個變數(性別和所選課程)的資料,然後使用上面給出的公式和一個簡單的公式比較男女學生在所提供的課程中選擇的頻率χ2統計表。

如果性別和課程選擇之間沒有關係(也就是說,如果他們是獨立的),那麼男女學生選擇每門課程的實際頻率應該大致相等,或者相反,任何一門選修課的男女學生比例應與樣本中男女學生的比例大致相等。Aχ2獨立性檢驗可以告訴我們,隨機機會能夠解釋資料中實際頻率和這些理論預期之間的任何觀察到的差異的可能性有多大。

擬合優度

χ2提供了一種方法來測試一個資料樣本與該樣本所代表的更大群體的(已知或假設)特徵的匹配程度。如果樣本資料不符合我們感興趣的總體的預期屬性,那麼我們就不想用這個樣本來得出關於更大總體的結論。

舉個例子,想象一枚正面或反面有50/50幾率落地的假想硬幣和一枚你擲100次的真硬幣。如果這枚真正的硬幣有一個“是公平的”,那麼它在任何一邊著陸的概率都是相等的,擲硬幣100次的預期結果是正面上升50次,反面上升50次。在這種情況下,χ2可以告訴我們100枚硬幣的實際結果與一枚普通硬幣能給出50/50結果的理論模型相比有多好。實際擲硬幣可能是50/50,60/40,甚至90/10。100次擲硬幣的實際結果離50/50越遠,這組擲硬幣與理論預期的50/50越不吻合,我們就越有可能得出結論,這枚硬幣實際上不是一枚公平的硬幣。

  • 發表於 2021-06-08 21:34
  • 閱讀 ( 28 )
  • 分類:金融

你可能感興趣的文章

如何在excel中進行基礎資料分析

...使用統計軟體。這些工具是用來做計算的,比如t檢驗、卡方檢驗、相關性等等。Excel不是用來進行資料分析的。但這並不意味著你做不到。 ...

  • 發佈於 2021-03-12 01:13
  • 閲讀 ( 55 )

mac上精彩主題演講的10個技巧和竅門

...養成習慣,使用主幻燈片。這些可以讓您為經常使用的設計定義特定的佈局。 ...

  • 發佈於 2021-03-23 19:06
  • 閲讀 ( 51 )

均勻分佈

...多個點。 還有其他幾個重要的連續分佈,如正態分佈、卡方分佈和學生t分佈。 還有幾個與分佈相關的資料生成或資料分析函式,幫助理解資料集中的變數及其方差。這些函式包括概率密度函式、累積密度函式和矩母函式。 ...

  • 發佈於 2021-05-30 18:53
  • 閲讀 ( 57 )

t檢驗

...。對於大樣本,統計學家使用z檢驗。其他測試選項包括卡方檢驗和f檢驗。 t檢驗有三種型別,分為依賴性t檢驗和獨立性t檢驗。 測試結果不明確 試想一下,一個藥品**商想測試一種新發明的藥品。它遵循的標準程式是在一...

  • 發佈於 2021-06-04 13:19
  • 閲讀 ( 72 )

概率分佈

...型別 概率分佈有許多不同的分類。其中包括正態分佈、卡方分佈、二項分佈和泊松分佈。不同的概率分佈有不同的用途,代表不同的資料生成過程。例如,二項式分佈評估一個事件在給定次數的試驗中發生幾次的概率,以及給...

  • 發佈於 2021-06-09 07:49
  • 閲讀 ( 46 )

在excel中建立線性回歸模型

...些關鍵假設必須為真: 變數必須是真正獨立的(使用卡方檢驗)。 資料不能有不同的誤差方差(這稱為異方差(也稱為異方差))。 每個變數的誤差項必須是不相關的。如果不是,則表示變數是序列相關的。 如果這三件...

  • 發佈於 2021-06-11 18:26
  • 閲讀 ( 60 )

聯合概率定義

什麼是聯合概率(a joint probability)? 聯合概率是一種統計方法,用來計算兩個事件在同一時間點同時發生的可能性。聯合概率是事件Y與事件X同時發生的概率。 聯合概率公式為 聯合概率的符號可以有幾種不同的形式。以下公式...

  • 發佈於 2021-06-14 07:36
  • 閲讀 ( 38 )

金融學中的假設檢驗:概念與例項

...但使用的是相同的四個步驟:定義假設、設定標準、計算統計資料和得出結論。 與大多數統計工具和模型一樣,這種數學模型也有侷限性,並且容易出現某些錯誤,因此投資者也有必要結合這種模型考慮其他模型 什麼是假...

  • 發佈於 2021-06-14 15:07
  • 閲讀 ( 50 )

優勢比(odds ratio)和相對風險(relative risk)的區別

...。這兩個指標是優勢比和相對風險。兩者都是兩個不同的統計概念,儘管彼此有很大的關聯。 相對風險(RR)就是兩個事件發生的概率或關係。假設A是事件1,B是事件2,把B除以A或A/B就可以得到RR。這正是專家們提出的流行說法...

  • 發佈於 2021-06-23 14:30
  • 閲讀 ( 53 )

方差(variance)和標準差(standard deviation)的區別

方差和標準差是概率論和統計學中最常用的術語,用於更好地描述資料集周圍的分佈度量。兩者都給出了一組資料在平均值周圍擴散的數值度量。平均值只是資料集中一系列值的算術平均值,而方差則衡量數字在平均值周圍的分...

  • 發佈於 2021-06-25 15:38
  • 閲讀 ( 59 )
cgrm4055
cgrm4055

0 篇文章

作家榜

  1. admin 0 文章
  2. 孫小欽 0 文章
  3. JVhby0 0 文章
  4. fvpvzrr 0 文章
  5. 0sus8kksc 0 文章
  6. zsfn1903 0 文章
  7. w91395898 0 文章
  8. SuperQueen123 0 文章

相關推薦