描述性統計與推斷統計
統計學是收集、分析和呈現數據的學科。統計學理論根據它們通過分析數據所產生的信息分為兩個分支。
什麼是描述性統計?
描述性統計是統計學的一個分支,它定量地描述數據集的主要屬性。為了儘可能準確地表示數據集的屬性,可以使用圖形或數字工具對數據進行彙總。
圖形化摘要是通過對感興趣的變量的值進行製表、分組和繪圖來完成的。頻率分佈和相對頻率分佈直方圖就是這樣的表示。它們描繪了價值觀在整個人口中的分佈。
數值摘要包括計算描述性指標,如平均值、模式和平均值。描述性度量又分為兩類:集中趨勢度量和離散/變異度量。集中趨勢的度量是平均值/平均值、中位數和模式。每種方法都有自己的適用性和有用性。其中一個可能失敗,另一個可以更好地表示數據集。
顧名思義,分散度的度量包括測量數據的分佈。範圍、標準差、方差、百分位和四分位範圍以及變異係數是離散度的度量。它們提供有關數據傳播的信息。
使用描述性統計的一個簡單例子是計算學生的平均成績。GPA本質上是學生成績的加權平均數,是該學生整體學業成績的反映。
什麼是推斷統計學?
推斷統計學是統計學的一個分支,它從一個受隨機、觀察和抽樣變化影響的樣本中得到有關總體的結論。一般來說,結果是從總體的隨機樣本中獲得的,然後將從樣本中得出的結論推廣到代表整個總體。
樣本是總體的一個子集,對從樣本中獲得的數據進行描述性統計的度量稱為統計學。從樣本分析中獲得的描述性統計指標在應用於總體時被稱為參數,它們代表整個群體。
推斷統計量的重點是如何將從樣本中得到的統計量儘可能準確地概括出來,以代表總體。一個值得關注的因素是樣本的性質。如果樣本是有偏的,那麼結果也是有偏的,基於這些的參數不能正確地代表整個群體。因此,抽樣是推理統計學的一個重要研究課題。統計假設、統計決策理論、估計理論、假設檢驗、實驗設計、方差分析和迴歸分析是推理統計理論的重要研究課題。
推斷統計在實際行動中的一個很好的例子是在投票前通過投票方式預測選舉結果。
描述性統計和推斷統計有什麼區別?
•描述性統計側重於總結從樣本中收集的數據。這項技術產生了集中趨勢和離散度的度量,表示變量的值是如何集中和分散的。
•推斷統計學將從樣本中獲得的統計數據概括為樣本所屬的一般人群。人口的度量被稱為參數。
•描述性統計僅對從中獲取數據的樣本的屬性進行總結,但在推理統計中,使用樣本中的度量來推斷人口的屬性。