分类数据与数值数据
数据是为参考或分析而收集的事实或信息。这些数据通常是作为相关主题的属性收集的。这个属性可以随时间变化,因此这个变化的属性可以被视为一个变量。变量可以采用不同形式的值,这些值在收集的数据中是固有的。
变量可以是定性的,也可以是定量的;也就是说,如果变量是定量的,答案就是数字,所测属性的大小可以在一定程度上准确地表述出来。另一种类型,定性变量衡量定性属性,变量假定的值不能以大小或大小给出。变量本身被称为分类变量,通过分类变量收集的数据是分类数据。
关于数值数据的更多信息
数值数据基本上是从一个变量中获得的定量数据,其值具有大小/大小的意义。根据Stanley-Smith-Stevens的理论,将得到的数值数据进一步分为三类。数值数据可以是序数、区间或比率。数据的类型由测量值的方法决定,这些类型称为测量级别。
一个人的重量,两点之间的距离,温度和股票的价格是数值数据的例子。
在统计学中,大多数方法都是为了分析数值数据而推导出来的。数字数据的分析主要采用基本的描述性统计和回归等推断方法。
有关分类数据的详细信息
分类数据是定性变量的值,通常是数字、单词或符号。它们表明了这样一个事实:在考虑的情况下,变量属于可用的几种选择之一。因此,它们属于其中一个范畴;因此得名为范畴。
一个人的政治派别,一个人的国籍,一个人最喜欢的颜色,一个病人的血型都是定性属性。有时,一个数可以作为一个范畴值来获得,但这个数本身并不代表所测量属性的大小。邮政编码就是一个例子。
此外,任何分类值都属于标称数据类型,这是基于测量级别的另一种类型。用于分析分类数据的方法不同于数值数据,但其基本原理可能是相同的。
分类数据和数字数据有什么区别?
•数字数据是定量变量的值,并带有与变量上下文相关的量值感(因此,它们总是带有数值的数字或符号)。分类数据是为一个定性变量获得的值;分类数据的数字不具有重要性。
•数字数据始终属于序数、比率或区间类型,而类别数据属于名义类型。
•用于分析定量数据的方法与用于分类数据的方法不同,即使原理相同,至少应用程序有显著差异。
•使用描述性统计、回归、时间序列等统计方法分析数字数据。