偽相關

在統計學中,偽相關性,或稱偽相關性,是指兩個變數之間看似因果關係,但實際上並非因果關係的聯絡。偽關係最初會顯示一個變數直接影響另一個變數,但事實並非如此。這種虛假的相關性通常是由第三個因素引起的,在檢查時並不明顯,有時被稱為混雜因素。...

什麼是偽相關(spurious correlation)?

在統計學中,偽相關性,或稱偽相關性,是指兩個變數之間看似因果關係,但實際上並非因果關係的聯絡。偽關係最初會顯示一個變數直接影響另一個變數,但事實並非如此。這種虛假的相關性通常是由第三個因素引起的,在檢查時並不明顯,有時被稱為混雜因素。

關鍵要點

  • 偽相關,或稱為偽相關,是指兩個因素看似隨意相關,但實際上並不相關。
  • 因果關係的出現往往是由於圖表上類似的運動,結果是巧合或第三個“混淆”因素造成的。
  • 偽相關可能由小樣本或任意端點引起。
  • 統計學家和科學家使用仔細的統計分析來確定虛假的關係。
  • 確認因果關係需要對所有可能的變數進行控制的研究。

偽相關的工作原理

當兩個隨機變數在一個圖上緊密地相互跟蹤時,很容易懷疑其中一個變數的變化會導致另一個變數的變化。拋開因果關係(這是另一個話題)不談,這個觀察可以讓圖表的讀者相信變數A的運動與變數B的運動有關,反之亦然。

然而,更仔細的統計檢查可能會顯示,對齊的運動是巧合,或由影響這兩個變數的第三個因素造成的。這是一個虛假的相關性。使用小樣本或任意端點進行的研究特別容易受到虛假性的影響。

偽相關示例

有趣的關聯很容易找到,但很多都會被證明是假的。三個例子是裙子長度理論,超級碗指標,以及與大學畢業率的相關關係。

裙子長度理論

裙長理論起源於20世紀20年代,認為裙長與股市走勢是相關的。如果裙子的長度是長的,相關性是股市看跌。如果襯衫的長度很短,市場就會看漲。

超級碗指標

1月下旬,人們經常會對所謂的超級碗指標喋喋不休,這表明美足會議隊獲勝很可能意味著股市在未來一年將走低,而國足會議隊的勝利預示著市場上漲。

OpenMarkets的資料顯示,自超級碗時代開始以來,這一指標的準確率一直在74%左右,即54年中的40年。這是一個有趣的話題,但可能不是一個嚴肅的理財顧問會推薦的客戶投資策略。

教育程度和種族

社會學家們一直致力於確定哪些變數會影響教育程度。根據EducationData.org,2019年,25至29歲的白人完成大學學業的可能性比黑人高出55%。資料表明,種族對大學畢業率有因果關係;然而,影響教育程度的不是種族本身,而是社會中種族主義的影響,這是第三個“隱藏”變數。

種族主義影響有色人種,使他們在教育和經濟上處於不利地位。例如,非白人社群的學校面臨著更大的挑戰,獲得的資金更少,非白人人口的父母的工作報酬較低,用於子女教育的資源更少,許多家庭生活在糧食沙漠中,營養不良。因此,種族主義是影響教育程度的一個因果變數,而不是種族。

如何識別偽相關

統計學家和其他分析資料的科學家必須時刻警惕虛假的關係。他們使用多種方法來識別它們,包括:

  • 確保適當的代表性樣品
  • 獲得足夠的樣本量
  • 警惕任意端點
  • 控制盡可能多的外部變數
  • 使用零假設並檢查強p值

許多虛假的關係可以用常識來識別。如果發現一種相關性,通常有一個以上的變數在起作用,而且這些變數往往不是很明顯。

假相關常見問題解答

你怎麼知道相關性是假的?

在研究結果中發現虛假關係的明顯方法是運用常識。僅僅因為兩件事發生並且看起來是聯絡在一起的,並不意味著沒有其他因素在起作用。然而,要確定的是,研究方法是經過嚴格審查的。在研究中,所有可能影響研究結果的變數都應該包含在統計模型中,以控制它們對因變數的影響。

什麼是相關性而非因果關係的例子(an example of correlation but not causation)?

一個相關的例子是,睡眠越多,白天的表現就越好。雖然有關聯,但不一定有因果關係。更多的睡眠可能不是一個人表現更好的原因;例如,他們可能正在使用一種新的軟體工具來提高生產力。要找到原因,必須有來自一項研究的事實證據,表明睡眠和表現之間的因果關係。

什麼是偽回歸的意義(the meaning of spurious regression)?

偽回歸是一種統計模型,顯示線性關係的誤導性統計證據;換句話說,獨立的非平穩變數之間的虛假相關性。

什麼是虛假因果關係的例子(an example of false causality)?

錯誤的因果關係發生在我們因為註意到它們之間的關係而很快假設一件事導致另一件事的時候。例如,我們可以假設哈里一直在努力訓練,以成為一個更快的跑步者,因為他的比賽時間已經改善。然而,現實可能是,哈里的比賽時間有所改善,因為他有新的跑鞋與最新的技術。最初的假設是錯誤的因果關係。

  • 發表於 2021-06-02 10:57
  • 閱讀 ( 12 )
  • 分類:金融

你可能感興趣的文章

如何用excel求相關係數

最簡單和最常見的統計Excel計算之一是相關性。這是一個簡單的統計資料,但當你想知道兩個變數是否相關時,它可以提供很多資訊。如果你知道正確的命令,在Excel中找到相關係數是非常容易的。 ...

  • 發佈於 2021-03-11 16:27
  • 閲讀 ( 67 )

如何從一個快閃記憶體驅動器玩積木樂趣隨處minecraft

... path:”框中找到的路徑前面去掉驅動器號指定,以便建立偽相對路徑,以便在快閃記憶體驅動器的字母分配更改時,MultiMC不會在錯誤的位置查詢Java可執行檔案。 瀏覽Java可執行檔案後,“Java路徑:”框中的路徑如下所示: K:/Min...

  • 發佈於 2021-04-10 20:57
  • 閲讀 ( 67 )

逆相關

什麼是逆相關(an inverse correlation)? 逆相關,也稱為負相關,是兩個變數之間的相反關係,當一個變數的值較高時,另一個變數的值可能較低。 例如,對於變數A和B,A的值高,B的值低,A的值低,B的值高。在統計術語中,逆相...

  • 發佈於 2021-05-31 22:02
  • 閲讀 ( 68 )

我應該如何解釋負相關性?

兩個變數之間的負相關或負相關表示一個變數增加而另一個變數減少,反之亦然。這種關係可能代表或不代表兩個變數之間的因果關係,但它確實描述了一種可觀察的模式。負相關可以與正相關形成對比,正相關發生在兩個變數...

  • 發佈於 2021-06-03 12:43
  • 閲讀 ( 100 )

如何使用excel計算相關性?

什麼是相關性(correlation)? 相關性衡量兩個變數之間的線性關係。透過測量和關聯每個變數的方差,相關性給出了關係強度的指示。 換句話說,相關性回答了一個問題:變數A(自變數)在多大程度上解釋了變數B(因變數)? ...

  • 發佈於 2021-06-11 21:09
  • 閲讀 ( 52 )

相關係數正、負和零意味著什麼?

相關係數是兩個不同變數x和y之間線性關係強度的指標。大於零的線性相關係數表示正相關關係。小於零的值表示負關係。最後,值為零表示兩個變數x和y之間沒有關係。本文闡述了線性相關係數對投資者的意義,如何計算股票...

  • 發佈於 2021-06-12 05:23
  • 閲讀 ( 71 )

負相關

什麼是負相關(negative correlation)? 負相關是兩個變數之間的關係,其中一個變數隨著另一個變數的減少而增加,反之亦然。 在統計學中,完全負相關用-1.0表示,0表示無相關,+1.0表示完全正相關。一個完美的負相關意味著兩個...

  • 發佈於 2021-06-12 15:52
  • 閲讀 ( 67 )

如何交易貨幣和商品的相關性

...的關聯很常見。例如,加拿大元(加元)因出口而與油價相關,而日本因進口大部分石油而易受油價影響。同樣,澳大利亞(AUD)和紐西蘭(NZD)與金價和油價關係密切。 雖然這種相關性(正或負)可能是顯著的,但如果外匯...

  • 發佈於 2021-06-16 03:07
  • 閲讀 ( 45 )

協方差(covariance)和相關性(correlation)的區別

協方差與相關 協方差和相關是概率論和統計學中的兩個概念。這兩個概念都描述了兩個變數之間的關係。另外,兩者都是測量變數之間某種依賴關係的工具。 “協方差”被定義為“兩個隨機變數的期望值與它們的期望值之間...

  • 發佈於 2021-06-24 07:48
  • 閲讀 ( 97 )

相關性之間的差異(differences between correlation)和回歸(regression)的區別

相關和回歸都是處理兩個或多個變數的統計工具。雖然兩者涉及同一主題,但兩者之間存在差異。兩者之間的區別將在下麵解釋。 意思 與兩個或多個變數相關的術語表示變數以某種方式相關。相關分析確定兩個變數之間是否存...

  • 發佈於 2021-06-24 15:38
  • 閲讀 ( 50 )