分類數據與數值數據
數據是為參考或分析而收集的事實或信息。這些數據通常是作為相關主題的屬性收集的。這個屬性可以隨時間變化,因此這個變化的屬性可以被視為一個變量。變量可以採用不同形式的值,這些值在收集的數據中是固有的。
變量可以是定性的,也可以是定量的;也就是說,如果變量是定量的,答案就是數字,所測屬性的大小可以在一定程度上準確地表述出來。另一種類型,定性變量衡量定性屬性,變量假定的值不能以大小或大小給出。變量本身被稱為分類變量,通過分類變量收集的數據是分類數據。
關於數值數據的更多信息
數值數據基本上是從一個變量中獲得的定量數據,其值具有大小/大小的意義。根據Stanley-Smith-Stevens的理論,將得到的數值數據進一步分為三類。數值數據可以是序數、區間或比率。數據的類型由測量值的方法決定,這些類型稱為測量級別。
一個人的重量,兩點之間的距離,溫度和股票的價格是數值數據的例子。
在統計學中,大多數方法都是為了分析數值數據而推導出來的。數字數據的分析主要採用基本的描述性統計和迴歸等推斷方法。
有關分類數據的詳細信息
分類數據是定性變量的值,通常是數字、單詞或符號。它們表明了這樣一個事實:在考慮的情況下,變量屬於可用的幾種選擇之一。因此,它們屬於其中一個範疇;因此得名為範疇。
一個人的政治派別,一個人的國籍,一個人最喜歡的顏色,一個病人的血型都是定性屬性。有時,一個數可以作為一個範疇值來獲得,但這個數本身並不代表所測量屬性的大小。郵政編碼就是一個例子。
此外,任何分類值都屬於標稱數據類型,這是基於測量級別的另一種類型。用於分析分類數據的方法不同於數值數據,但其基本原理可能是相同的。
分類數據和數字數據有什麼區別?
•數字數據是定量變量的值,並帶有與變量上下文相關的量值感(因此,它們總是帶有數值的數字或符號)。分類數據是為一個定性變量獲得的值;分類數據的數字不具有重要性。
•數字數據始終屬於序數、比率或區間類型,而類別數據屬於名義類型。
•用於分析定量數據的方法與用於分類數據的方法不同,即使原理相同,至少應用程序有顯著差異。
•使用描述性統計、迴歸、時間序列等統計方法分析數字數據。