样本选择偏差

样本选择偏差是由于选择非随机数据进行统计分析而产生的一种偏差。偏差是由于样本选择过程中的缺陷而存在的,其中数据的子集由于特定属性而被系统地排除在外。排除子集会影响检验的统计显著性,并且会使统计模型参数的估计产生偏差。...

什么是样本选择偏差(sample selection bias)?

样本选择偏差是由于选择非随机数据进行统计分析而产生的一种偏差。偏差是由于样本选择过程中的缺陷而存在的,其中数据的子集由于特定属性而被系统地排除在外。排除子**影响检验的统计显著性,并且会使统计模型参数的估计产生偏差。

了解样本选择偏差

生存偏差是一种常见的样本选择偏差。例如,当对一大群股票的投资策略进行回测时,可以方便地查找具有整个样本期数据的证券。如果我们要根据15年的股票数据来测试策略,我们可能倾向于寻找在整个15年期间拥有完整信息的股票。然而,剔除一只停止交易或很快离开市场的股票,将在我们的数据样本中输入一个偏差。由于我们只考虑了持续15年的股票,我们的最终结果将是有缺陷的,因为这些股票表现良好,足以在市场中生存。

对冲基金业绩指数是样本选择偏差受生存偏差影响的一个例子。由于无法存活的对冲基金停止向指数聚合器报告其业绩,因此产生的指数自然倾向于保留下来的基金和策略,因此“存活”。这也可能是受欢迎的共同基金报告服务的一个问题。

分析师可以调整以考虑这些偏见,但可能会在这个过程中引入新的偏见。

  • 发表于 2021-05-31 10:07
  • 阅读 ( 113 )
  • 分类:商业金融

你可能感兴趣的文章

excel中标准差的计算

... 总体和样本标准差解释 ...

  • 发布于 2021-03-28 16:19
  • 阅读 ( 267 )

如何用microsoftexcel计算不确定度

...大多数统计数据的准确性仍然存在疑问。Excel允许您根据样本的标准偏差计算不确定度。 Excel中有统计公式可以用来计算不确定度。在本文中,我们将计算算术平均值、标准差和标准误差。我们还将研究如何在Excel中的图表上绘...

  • 发布于 2021-04-03 14:31
  • 阅读 ( 218 )

标准差(standard deviation)和方差(variance)的区别

...方差数学公式 方差平方根 样本中每个值与平均值的偏差平方的平均值。 符号 希腊文字母西格玛-σ 无专用符号;用标准差或其它值表示。 ...

  • 发布于 2021-07-06 05:11
  • 阅读 ( 1042 )

如何计算标准差(calculate standard deviation)

...不同方法 计算标准差的方法主要有两种:总体标准差和样本标准差。如果从总体或集合的所有成员收集数据,则应用总体标准偏差。如果您获取代表较大总体的样本的数据,则应用样本标准偏差公式。方程式/计算几乎相同,但...

  • 发布于 2021-09-06 22:47
  • 阅读 ( 228 )

什么是抽样分布(a sampling distribution)

...较大,我们通过选择具有预定规模的总体子集来形成统计样本。通过研究样本,我们可以使用推断统计来确定有关人口的一些信息。 一个大小为n的统计样本涉及从人群中随机选择的n个个体或受试者组成的单个群体。与统计样...

  • 发布于 2021-09-23 07:26
  • 阅读 ( 567 )

标准偏差何时等于零?

样本标准差是一种描述性统计,用于测量定量数据集的传播。这个数字可以是任何非负实数。由于零是一个非负实数,因此值得一问,“样本标准偏差何时等于零?”这发生在非常特殊和非常不寻常的情况下,即我们所有的数...

  • 发布于 2021-09-23 19:18
  • 阅读 ( 170 )

统计和数学自由度

...中的维数。 为了说明自由度的概念,我们将看一个关于样本平均值的基本计算,为了找到数据列表的平均值,我们将所有数据相加,然后除以值的总数。 带有示例平均值的说明 假设我们知道一个数据集的平均值是25,这个...

  • 发布于 2021-09-24 00:42
  • 阅读 ( 202 )

总体和样本标准偏差之间的差异

...惊讶的是,实际上有两个可以考虑。存在总体标准偏差和样本标准偏差。我们将区分这两个方面,并强调它们的区别。 质的差异 虽然两种标准偏差都测量可变性,但总体和样本标准偏差之间存在差异。第一个问题涉及统计...

  • 发布于 2021-09-24 06:48
  • 阅读 ( 348 )

如何抽样工作(sampling works)

系统抽样是一种创建随机概率样本的技术,其中每个数据段以固定的间隔选择,以包含在样本中。例如,如果一名研究人员想要在一所注册人数为10000的大学中创建一个系统的1000名学生样本,他或她会从所有学生的名单中选择...

  • 发布于 2021-10-01 07:51
  • 阅读 ( 198 )

均值的置信区间示例

...差。 问题陈述 我们从25只特定种类的蝾螈的简单随机样本开始,测量它们的尾巴。我们样品的平均尾长为5厘米。 如果我们知道0.2 cm是种群中所有蝾螈尾巴长度的标准偏差,那么种群中所有蝾螈平均尾巴长度的90%置信区间...

  • 发布于 2021-10-06 10:47
  • 阅读 ( 284 )
----小可爱----
----小可爱----

0 篇文章

相关推荐