离散变量与连续变量
在统计学中,变量是描述一个实体(如人、地方或事物)的属性,变量的取值可能因实体而异。例如,如果我们让变量Y是学生在考试中的成绩,Y可以取a、B、C、S和F。如果我们让变量X是一个学生在一个班上的身高,那么它可以取一个范围内的任何实际值。
从这两个变量的定性运算中可以看出,这两种类型的量化运算是可能的。这些定量变量分为两类:离散变量和连续变量。
什么是离散变量?
如果定量变量最多只能取一个可数的值,那么这种数据称为离散数据。换句话说,变量的域最多应该是可数的。一个至多可数的数要么是有限的,要么是可数的。一个例子将进一步说明这一点。
一个班有五个问题的测验。设X为学生得到正确答案的数目。X的可能值是0、1、2、3、4和5;只有6个可能性,而且是一个有限的数。因此,X是一个离散变量。
在游戏中,一个人必须射击一个目标。如果我们让Y是他击中目标的一次射击的次数,那么Y的可能值是1,2,3,4…等等。理论上,这些值不需要有一个有限的限制。但这些值是可数的。因此,变量Y定义为“他击中目标前一次射击的次数”是一个离散变量。
从这两个例子可以看出,离散变量通常被定义为计数。
什么是连续变量?
一个定量变量可以取一个范围内所有可能的值,称为连续数据。因此,如果连续变量的域是区间(0,5),那么变量可以取0到5之间的任何实数值。
例如,如果我们将变量Z定义为一个班级中学生的身高,那么变量Z可以取人类身高范围内的任何实数值。因此,Z是一个连续变量,但是如果我们添加一个额外的限制条件,如“学生身高到最近的厘米”,那么变量Z将是离散的,因为它只能取有限个值。
由此可以看出,通常将连续变量定义为测量值。
离散变量和连续变量的区别是什么?•离散变量的域最多可数,而连续变量的域由特定范围内的所有实际值组成。•通常离散变量定义为计数,但连续变量定义为测量值。 |