简单随机样本与系统随机样本
数据是统计中最重要的一件事。由于实际困难,当一个假设被检验时,将无法利用来自整个人口的数据。因此,从样本中获取数据值,以推断一个种群。因为,并非所有数据都被使用;在作出的推论中存在不确定性(称为采样误差)。为了尽量减少这种不确定性,选择无偏样本是很重要的。
当个体被选为一个样本时,群体中的每个个体被选中的概率相等,那么这样的样本就被称为随机样本。例如,假设一个社区的100所房子中有10所被选为样本。每栋房子的编号都写在一张纸上,100张都放在一个篮子里。一个人从篮子里随机选择10张不同的纸来替换。然后选择10个数字作为随机样本。
简单随机抽样和系统随机抽样都是抽样技术,其结果是随机抽样具有一些不同的性质。
什么是简单的随机抽样?
简单随机样本是一个随机样本,以这样的方式选择,即该样本量的每个样本(可从总体中选择)具有相等的被选为样本的概率。这种抽样技术要求在整个人群范围内都能达到。换言之,总体在时间和空间上都应该足够小,以便有效地进行简单的随机抽样。回过头来看例子,在第二段中,我们可以看到这里所做的是简单的随机抽样,用这种方法抽取的10栋房子的样本是一个简单的随机抽样。
例如,考虑对一家公司生产的灯泡进行终身测试。考虑的人口是该公司生产的所有灯泡。但在这种情况下,有些灯泡尚未生产,有些灯泡已经售出。因此,取样时间上仅限于目前库存的灯泡。在这种情况下,不能进行简单的随机抽样,因为不可能确保对于每个k,每个k大小的样本被选为要调查的样本的概率相等。
什么是系统随机抽样?
用系统模式选择的随机样本称为系统随机样本。使用这种方法选择样本有几个步骤。
- 编制总体索引(数字应随机分配)
- 计算采样间隔的最大值(总体中的个体数除以要为样本选择的个体数)
- 选择一个介于1和最大值之间的随机数。
- 重复添加“最大值”以选择其余的个体。
- 通过选择与获得的数字序列相对应的个体来选择样本。
例如,考虑在100套房子中选择10套房子。然后,将房屋编号从1到100,以找到一个系统的随机样本。然后,最大值为100/10=10。现在,在1-10范围内随机选择一个数字。这可以通过抽签来完成。例如,7是由此获得的数字。随机抽样是编号为7、17、27、37、47、57、67、77、87和97的房屋。
简单随机抽样和系统随机抽样有什么区别?•简单随机抽样要求对每个个体分别进行选择,而系统随机抽样则不要求。•在简单随机抽样中,对于每个k,大小为k的每个样本被选为样本的概率相等,但在系统随机抽样中并非如此 |