正態分佈公式基於兩個簡單的引數均值和標準差,它們量化了給定資料集的特徵。
平均值表示整個資料集的“中心”值或平均值,而標準差表示該平均值周圍資料點的“分佈”或變化。
考慮以下兩個資料集:
對於資料集1,平均值=10,標準偏差(stddev)=0
對於資料集2,平均值=10,標準偏差(stddev)=2.83
讓我們為DataSet1繪製這些值:
與資料集2類似:
以上兩個圖中的紅色水平線表示每個資料集的“平均值”或平均值(兩種情況下均為10)。第二張圖中的粉紅色箭頭表示資料值與平均值之間的分佈或變化。對於資料集2,這用標準偏差值2.83表示。由於DataSet1的所有值都相同(每個值為10),並且沒有變化,stddev值為零,因此沒有粉色箭頭適用。
stddev值有幾個重要的有用的特徵,這些特徵對資料分析非常有用。對於正態分佈,資料值對稱分佈在平均值的兩側。對於任何正態分佈的資料集,在水平軸上用stddev繪製圖形,在垂直軸上繪製資料值的數目,得到以下圖形。
從上圖可以看出,stddev表示如下:
鐘形曲線下的面積在測量時表示給定範圍的期望概率:
其中X是感興趣的值(下麵的示例)。
繪製和計算面積並不總是很方便,因為不同的資料**有不同的平均值和標準差數值。為了使統一的標準方法易於計算並適用於實際問題,引入了Z值的標準轉換,它構成了正態分佈表的一部分。
Z=(X–平均值)/stddev,其中X是隨機變數。
基本上,這種轉換迫使平均值和stddev分別標準化為0和1,這使得標準定義的Z值集(來自正態分佈表)能夠用於簡單的計算。包含概率值的標準z值表的快照如下:
二項分佈與正態分佈 隨機變數的概率分佈在統計學中佔有重要地位。在這些概率分佈中,二項分佈和正態分佈是現實生活中最常見的兩種。 什麼是二項分佈? 二項式分佈是與隨機變數X相對應的概率分佈,它是一系列獨立的...
...概率。 在連續均勻分佈中,結果是連續的和無限的。 在正態分佈中,圍繞平均數的資料出現的頻率更高。 在正態分佈中,發生的頻率越遠離平均值就越小。 瞭解均勻分佈 均勻分佈有兩種型別:離散分佈和連續分佈。軋制...
...bell curve)? 鐘形曲線是一種常見的變數分佈型別,也稱為正態分佈。“鐘形曲線”一詞源於這樣一個事實,即用來描述正態分佈的圖形由對稱的鐘形曲線組成。 曲線上的最高點或鐘形物的頂部代表一系列資料中最可能發生的事...
...票或期貨合約等工具,在隨機遊走之後,價格將呈現對數正態分佈,且具有恆定的漂移和波動性。利用這一假設並考慮其他重要變數,該方程導出了歐式看漲期權的價格。 Black-Scholes方程的輸入是波動率、標的資產價格、期權...
...別之一。另外兩個對應的是中庫爾特語,它沒有峰度,與正態分佈有關,而平庫爾特語則有更細的尾巴和更少的峰度。 關鍵要點 瘦肉精分佈是那些具有過度正峰度的分佈。 與正態分佈相比,它們發生極端事件的可能性更大...
...用點或破折號表示,而連續變數用實線表示。下圖顯示了正態分佈的離散和連續分佈,平均值(期望值)為50,標準偏差為10: 這個分佈圖試圖描繪不確定性。在這種情況下,結果50是最有可能的,但只會發生約4%的時間;結...
...偏斜(skewness)? 偏斜是指一組資料中偏離對稱鐘形曲線或正態分佈的失真或不對稱。如果曲線向左或向右移動,則稱為傾斜。偏度可以量化為給定分佈與正態分佈的差異程度的表示。正態分佈的偏斜為零,而對數正態分佈則會表...
...istribution)? T分佈,又稱學生T分佈,是一種概率分佈,與正態分佈相似,呈鐘形,但尾部較重。與正態分佈相比,T分佈出現極值的幾率更大,因此尾部更肥。 關鍵要點 當估計的標準差用於分母而不是真正的標準差時,T分...
對數正態分佈的定義 對數正態分佈是相關正態分佈的對數值的統計分佈。對數正態分佈可以透過相關的對數計算轉換為正態分佈,反之亦然。 瞭解正態和對數正態 正態分佈是結果的概率分佈,對稱或形成鐘形曲線。在正...
...峰度。 概率分佈的工作原理 也許最常見的概率分佈是正態分佈,或“鐘形曲線”,儘管存在幾種常用的分佈。通常,某些現象的資料生成過程將決定其概率分佈。這個過程稱為概率密度函式。 概率分佈也可以用來建立累積...