方差與協方差
方差和協方差是統計學中使用的兩種度量方法。方差是對數據分散性的度量,協方差表示兩個隨機變量的變化程度。方差是一個相當直觀的概念,但協方差的定義在數學上並不那麼直觀。
關於方差的更多信息
方差是數據與分佈平均值的離散度的度量。它顯示數據點與分佈平均值的距離。它是概率分佈的主要描述符之一,也是分佈的矩之一。另外,方差是總體的一個參數,樣本的方差作為總體方差的估計量。從一個角度來看,它被定義為標準差的平方。
用通俗的語言,它可以描述為每個數據點之間距離的平方平均值和分佈的平均值。以下公式用於計算方差。
Var(X)=E[(X-µ)2],用於總體,以及
Var(X)=E[(X-‾X)2]對於樣本
可以進一步簡化為Var(X)=E[X2]-(E[X])2。
方差有一些簽名屬性,通常用於統計學中,以使用法更簡單。方差是非負的,因為它是距離的平方。然而,方差的範圍不受限制,而且取決於特定的分佈。常數隨機變量的方差為零,且方差與位置參數無關。
關於協方差的更多信息
在統計理論中,協方差是兩個隨機變量一起變化的量度。換句話說,協方差是兩個隨機變量之間相關性強度的度量。同時,它也可以看作是兩個隨機變量方差概念的推廣。
兩個隨機變量X和Y的協方差被稱為σXY=E[(X-E[X])(Y-E[Y])。由此,方差可以看作是協方差的一個特例,其中兩個變量是相同的。Cov(X,X)=變量(X)
通過歸一化協方差,可以得到線性相關係數或皮爾遜相關係數,其定義為ρ=E[(X-E[X])(Y-E[Y])/(σXσY)=(Cov(X,Y))/(σXσY)
從圖形上看,一對數據點之間的協方差可以看作是數據點位於相反頂點的矩形區域。它可以解釋為兩個數據點之間分離程度的度量。考慮到整個群體的矩形,與所有數據點對應的矩形的重疊可以被視為分離強度;兩個變量的方差。協方差是二維的,因為有兩個變量,但將其簡化為一個變量,就可以將單個變量的方差作為一維的分離。
方差和協方差的區別是什麼?
•方差是對總體中擴散/分散的度量,而協方差被視為兩個隨機變量的變化或相關性強度的度量。
•方差可以看作是協方差的一種特殊情況。