样本与总体
总体和样本是统计学中的两个重要术语。简单地说,总体是我们感兴趣研究的最大项目集合,样本是总体的一个子集。换言之,样本应该代表数量较少但数量足够的总体。一个群体可以有几个不同大小的样本。
样品
一个样本可以由从总体中选出的两个或多个项目组成。一个样本的最小可能规模是两个,而最大的可能大小等于总体规模。从人群中选择样本有几种方法。从理论上讲,选择一个“随机样本”是获得关于总体准确推断的最佳方法。这类样本也称为概率样本,因为总体中的每个项目都有均等的机会被纳入样本中。
“简单随机抽样”技术是最著名的随机抽样技术。在这种情况下,要为样本选择的项目是从总体中随机选择的。这样的样本称为“简单随机样本”或SRS。另一种流行的技术是“系统抽样”。在这种情况下,样本的项目是根据特定的系统顺序选择的。
例句:每10个排队的人被选为一个样本。
在这种情况下,系统顺序是每10个人。统计学家可以自由地以有意义的方式定义这个顺序。还有其他随机抽样技术,如整群抽样或分层抽样,其选择方法与上述两种稍有不同。
在实际应用中,可以使用方便样本、判断样本、雪球样本和目的性样本等非随机样本。除此之外,选择非随机样本的项目与机会有关。事实上,人口中的每一项都不具有均等的机会被纳入非随机样本。这些类型的样本也称为非概率样本。
人口
任何有兴趣调查的实体集合都被简单地定义为“总体”。总体是样本的基础。宇宙中任何一组物体都可以是一个群体,这是基于研究的宣言。一般来说,一个群体的规模应该比较大,并且很难通过单独考虑其项目来推断某些特征。在总体中要调查的测量值称为参数。在实际应用中,参数的估计是通过对样本的相关测量来进行的。
例:从5名学生的平均数学成绩估算一个班30名学生的平均数学成绩时,参数为该班的平均数学成绩。这项统计是5名学生的平均数学成绩。
样本与总体
样本与总体之间有趣的关系是,没有样本的总体可以存在,但是样本不可能没有总体存在。这一论点进一步证明了样本依赖于总体,但有趣的是,大多数总体推断依赖于样本。样本的主要目的是尽可能准确地估计或推断出某个总体的测量值。从同一总体的几个样本而不是一个样本得到的整体结果可以推断出更高的准确度。另一件重要的事情是,当从一个总体中选择多个样本时,一个项目也可以包含在另一个样本中。这种情况被称为“样本替换”。此外,投资于样本中的相关人口测量值并获得几乎相似的产出是节省成本和时间价值的黄金机会。