简单随机与分层随机的区别是什么?

在统计分析中,“总体”是存在的观察或数据的总集。然而,测量人口中的每个个体或数据点往往是不可行的。相反,研究人员依赖于样本。样本是一组来自人群的观察结果。抽样方法是从总体中抽取样本的过程。...

简单随机与分层随机抽样:综述

在统计分析中,“总体”是存在的观察或数据的总集。然而,测量人口中的每个个体或数据点往往是不可行的。相反,研究人员依赖于样本。样本是一组来自人群的观察结果。抽样方法是从总体中抽取样本的过程。

简单随机样本和分层随机样本是获取样本的常用方法。简单随机样本用于表示整个数据群体,并随机选择人群中的个人,而不考虑任何其他因素。

另一方面,分层随机抽样首先根据共同特征将人群分成更小的群体或阶层。因此,分层抽样策略将确保每个分组的成员都包含在数据分析中。

关键要点

  • 简单随机和分层随机样本是统计测量工具。
  • 一个简单的随机样本需要整个人口中的一小部分基本数据来表示整个数据集。
  • 人口被分成具有相似特征的不同群体,从中抽取分层随机样本。

简单随机抽样

简单随机抽样是一种统计工具,用于描述从数据总体中抽取的非常基本的样本。这个样本相当于整个人口。

当关于数据总体的可用信息非常少,当数据总体的差异太大而无法划分为不同的子集,或者当数据总体中只有一个明显的特征时,通常使用简单随机样本。

例如,一家糖果公司可能希望研究其客户的购买习惯,以确定其产品线的未来。如果有10000个客户,它可以使用从这些客户中选择100个作为随机样本。然后,它可以将从这100个客户那里得到的信息应用到其他客户群中。

统计学家将设计一个详尽的数据总体列表,然后在这个大群体中随机选取一个样本。在这个样本中,每个人口成员都有平等的机会被选为样本的一部分。可通过两种方式选择:

  • 通过手工抽奖,每个人都有一个号码。然后有人随机抽取数字,将其包含在样本中。这是最好的使用时,看看一个小组。
  • 计算机生成的采样。这种方法最适用于较大的数据集,使用计算机来选择样本,而不是人类。

使用简单的随机抽样,研究人员可以对特定人群进行概括,并避免任何偏见。这有助于确定如何作出未来的决定。从而使糖果公司从上面的例子中可以利用这个工具开发出一种新的糖果风味,以生产出基于目前口味的100名客户。但是记住,这些都是概括,所以有错误的余地。毕竟,这是一个简单的示例。这100个客户可能无法准确地反映整个人群的口味。

分层随机抽样

与简单的随机样本不同,分层随机样本用于很容易分成不同子组或子集的总体。这些组是基于一定的标准,然后根据组的大小和人口的比例从每个组中随机选择元素。

这种抽样方法意味着将从每个不同的群体中进行选择,其规模取决于其在整个人口中的比例。但研究人员必须确保地层不重叠。人口中的每个点必须只属于一个阶层,因此每个点都是相互排斥的。重叠的地层会增加包含某些数据的可能性,从而使样本倾斜。

糖果公司可决定采用随机分层抽样法,将100名顾客分成不同的年龄组,以帮助确定其生产的未来。

投资组合经理可以使用分层随机抽样,通过复制债券指数等指数来创建投资组合。

与简单随机抽样相比,分层抽样有一些优点和缺点。因为它使用特定的特征,它可以提供一个更准确的代表性的人口基于什么是用来划分为不同的子集。这通常需要较小的样本量,这可以节省资源和时间。此外,研究人员还可以从每一层中选取足够的样本点,对每一层进行单独的分析。

但是分层抽样比随机抽样需要做更多的工作。研究人员必须单独跟踪和验证每一层的数据,与随机抽样相比,这可能需要更多的时间。

  • 发表于 2021-06-17 15:42
  • 阅读 ( 86 )
  • 分类:商业金融

你可能感兴趣的文章

随机定向(random orientation)和独立产品组合(independent assortment)的区别

...等位基因或基因如何在配子形成过程中彼此独立地分离。简单地说,独立分类是独立于任何其他基因的遗传的基因的遗传。 图02:独立分类 配子接受一个等位基因而不受任何其他等位基因的影响。因此,这些等位基因是独立地...

  • 发布于 2021-03-04 17:56
  • 阅读 ( 384 )

集群(cluster)和分层抽样(stratified sampling)的区别

...采集。研究者可以采用几种抽样方法,其中一些方法是:简单随机抽样、系统抽样、与大小抽样成比例的概率、匹配随机抽样、配额抽样、线采样、事件抽样、分层抽样和聚类抽样。 分层抽样是一种抽样方法,将人口分为若干...

  • 发布于 2021-06-23 21:45
  • 阅读 ( 539 )

装袋(bagging)和随机森林(random forest)的区别

...类树比单个分类树具有更高的精度。Bagging是最古老和最简单的基于集成的算法之一,它可以应用于基于树的算法以提高预测的准确性。还有另一个增强的bagging版本叫做随机森林算法,它本质上是一个用bagging机制训练的决策树的...

  • 发布于 2021-06-26 09:39
  • 阅读 ( 667 )

决策树(decision tree)和随机森林(random forest)的区别

...射了一系列相关选择的可能结果。它之所以流行是因为它简单易懂。当数据集变得更大时,单一的决策树不足以找到预测。随机林是决策树的集合,可以替代这个问题。随机林的输出基于其所有决策树的输出。 覆盖的关键领域 1...

  • 发布于 2021-06-30 23:51
  • 阅读 ( 2658 )

快速随机(fast stochastic)和慢随机(slow stochastic)的区别

...慢随机振荡器(或Stoch%D)计算Stoch%K统计量在s个周期内的简单移动平均值。通常s=3: %K和%D振荡器范围从0到100,通常使用线图可视化。接近极限100和0的水平(分别为%K或%D)表明了强弱,因为价格已经或接近新的N日高点或低点...

  • 发布于 2021-07-07 09:57
  • 阅读 ( 435 )

可能性(probability)和非概率抽样(non-probability sampling)的区别

...以从调查样本推广到目标人群。概率抽样的方法如下: 简单随机抽样 分层抽样 整群抽样 系统抽样 非概率抽样的定义 当在抽样方法中,宇宙中的所有个体都没有平等的机会成为样本的一部分时,这种方法被称为非概率抽样。...

  • 发布于 2021-07-08 19:51
  • 阅读 ( 1024 )

pdf格式(pdf)和pmf公司(pmf)的区别

...同的值,PMF在计算机编程和统计数据的形成中非常有用。简单地说,概率质量函数或PMS是与离散事件相关的函数,即与这些事件发生相关的概率。“质量”一词解释了离散事件的概率。概率质量函数(PMF)的一些应用包括:概率...

  • 发布于 2021-07-09 22:58
  • 阅读 ( 263 )

了解分层样本及其制作方法

...人员可以保证每个亚组的受试者都包含在最终样本中,而简单的随机抽样不能确保亚组在样本中的代表性相等或成比例。 比例分层随机抽样 在比例分层随机抽样中,当对整个人口进行检查时,每个阶层的规模与该阶层的人口...

  • 发布于 2021-09-12 06:08
  • 阅读 ( 137 )

社会学中不同类型的抽样设计

...让你回答特定研究问题的方法。有四种概率抽样技术。 简单随机抽样 简单随机抽样是统计方法和计算中假定的基本抽样方法。为了收集一个简单的随机样本,目标人群的每个单位都被分配了一个数字。然后生成一组随机数,...

  • 发布于 2021-09-12 06:20
  • 阅读 ( 365 )

统计中的样本类型

...可能成为样本中的一员。成员是通过随机过程选择的。 简单随机样本–这类样本很容易与随机样本混淆,因为它们之间的差异非常细微。在这种类型的样本中,个体是随机获得的,因此每个个体被选择的可能性是相等的。同时...

  • 发布于 2021-09-24 00:23
  • 阅读 ( 192 )