逐步回归

逐步回归是逐步迭代构建回归模型的过程,包括选择用于最终模型的自变量。它包括连续添加或删除潜在的解释变量,并在每次迭代后检验统计显著性。...

什么是逐步回归(stepwise regression)?

逐步回归是逐步迭代构建回归模型的过程,包括选择用于最终模型的自变量。它包括连续添加或删除潜在的解释变量,并在每次迭代后检验统计显著性。

统计软件包的可用性使得逐步回归成为可能,即使在具有数百个变量的模型中也是如此。

关键要点

  • 逐步回归是一种迭代检验线性回归模型中每个自变量统计显著性的方法。
  • 正向选择法从零开始,递增地添加每个新变量,检验统计显著性。
  • 反向消去法从加载多个变量的完整模型开始,然后删除一个变量以测试其相对于整体结果的重要性。
  • 然而,逐步回归也有其缺点,因为它是一种将数据拟合到模型中以获得预期结果的方法。

逐步回归类型

逐步回归的基本目标是通过一系列测试(例如F-检验、t检验)来找到一组显著影响依赖变量的独立变量。这是通过迭代来实现的,它是通过反复的循环或分析周期来获得结果或决策的过程。在统计软件包的帮助下自动进行测试,有利于节省时间和限制错误。

逐步回归可以通过一次尝试一个自变量并将其包含在回归模型中(如果具有统计显著性),或者通过将所有潜在自变量包含在模型中并消除那些不具有统计显著性的自变量来实现。有些方法同时使用这两种方法,因此有三种逐步回归方法:

  1. 正向选择从模型中没有变量开始,在模型中添加每个变量时测试每个变量,然后保持那些被认为最具统计意义的变量重复这个过程,直到结果是最优的。
  2. 向后消除从一组独立变量开始,一次删除一个变量,然后测试移除的变量是否具有统计意义。
  3. 双向消除是前两种方法的组合,测试哪些变量应该包括或排除。

例子

使用后向消去法的逐步回归的一个例子是,尝试使用设备运行时间、设备年龄、员工人数、室外温度和一年中的时间等变量来了解工厂的能源使用情况。该模型包括所有的变量,然后每个变量被删除,一次一个,以确定哪个是统计意义最小的。最后,该模型可能会显示,一年中的时间和温度是最重要的,这可能意味着工厂的能源消耗峰值是在空调使用量最高的时候。

逐步回归的局限性

回归分析,包括线性回归和多元回归,在当今的经济和投资领域有着广泛的应用。这样做的目的往往是找到过去存在的模式,而这些模式在未来也可能再次出现。例如,一个简单的线性回归可能会查看多年来的市盈率和股票回报率,以确定低市盈率(自变量)的股票是否提供更高的回报(因变量)。这种方法的问题在于,市场状况经常发生变化,过去的关系在现在或将来未必成立。

同时,逐步回归过程也受到了许多批评,甚至有人呼吁停止使用这种方法。统计人员注意到这种方法的一些缺点,包括结果不正确、过程本身固有的偏差以及通过迭代开发复杂回归模型的计算能力的必要性。

  • 发表于 2021-06-02 15:46
  • 阅读 ( 128 )
  • 分类:商业金融

你可能感兴趣的文章

逐步(stepwise)和总稳定常数(overall stability constants)的区别

关键区别-逐步与整体稳定常数 稳定常数是指溶液中形成复杂化合物的平衡常数。这是一种测量这些过渡金属离子配合物稳定性的方法。与其他平衡常数一样,稳定常数也与温度有关。稳定常数的定义为“过渡金属离子与某些...

  • 发布于 2020-10-19 14:00
  • 阅读 ( 526 )

均值回归

什么是均值回归(mean reversion)? 均值回归(Mean reversion)是金融学中使用的一种理论,它表明资产价格波动率和历史收益率最终将回归到整个数据集的长期均值或平均水平。 这一平均水平可以出现在多种情况下,如经济增长、...

  • 发布于 2021-06-05 21:09
  • 阅读 ( 345 )

多元线性回归(mlr)

什么是多元线性回归(mlr)(multiple linear regression (mlr))? 多元线性回归(MLR),也称为多元回归,是一种使用多个解释变量来预测响应变量结果的统计技术。多元线性回归(MLR)的目标是建立解释变量(自变量)和反应变量(因...

  • 发布于 2021-06-10 11:43
  • 阅读 ( 253 )

方差分析之间的差异(difference betweeen anova)和回归(regression)的区别

方差分析Â vs回归 很难区分方差分析和回归之间的差异。这是因为这两个术语的相似之处多于不同之处。可以说,方差分析和回归是同一枚硬币的两面。 方差分析(ANOVA)和回归统计模型仅适用于有连续结果变量的情况。回归...

  • 发布于 2021-06-23 13:54
  • 阅读 ( 270 )

机器学习(machine learning)和神经网络(neural networks)的区别

...是指使用统计技术的算法,允许计算机从数据中学习,并逐步提高特定任务的性能。神经网络是一个系统,它的灵感来自于人脑中能够更快地执行计算任务的生物神经元。 算法 回归、分类、聚类、支持向量机、随机森林等是机...

  • 发布于 2021-06-30 18:24
  • 阅读 ( 937 )

线性回归(linear regression)和逻辑回归(logistic regression)的区别

线性回归和logistic回归的主要区别在于,线性回归用于预测连续值,而logistic回归用于预测离散值。 机器学习系统可以基于对过去输入的训练来预测未来的结果。机器学习主要有两种类型,即有监督学习和无监督学习。回归和分...

  • 发布于 2021-06-30 23:41
  • 阅读 ( 1445 )

神志正常(sanity)和回归测试(regression testing)的区别

健全性测试和回归测试的主要区别在于,健全性测试有助于在执行主要测试之前测试系统的关键功能,而回归测试有助于确保对代码所做的修改不会造成任何意外的影响。 一般来说,商业软件开发是一项艰巨的任务。代码中的...

  • 发布于 2021-07-01 23:10
  • 阅读 ( 685 )

相关性(correlation)和回归(regression)的区别

统计界最常用的两个术语是相关性和回归。这两个术语被称为“分析”,因为它们是基于众多变量的传播。这种现象通常被称为多元分布。当需要检查两个定量变量之间的关联时,它们最常用。受访者最有可能被问及相关和回归...

  • 发布于 2021-07-07 05:26
  • 阅读 ( 505 )

t检验(t-test)和线性回归(linear regression)的区别

T检验和线性回归是与推断统计有关的术语,推断统计是一种统计方法,它通过对一个群体进行一个小的但说明性的样本来帮助我们对该群体进行概括和预测。三种方法通常用于推断统计-置信区间,假设检验和回归分析。测试(tte...

  • 发布于 2021-07-09 15:30
  • 阅读 ( 2284 )

线性回归分析

线性回归是一种统计技术,用于了解独立(预测)变量和因变量(标准)之间的关系。当分析中有多个自变量时,这称为多元线性回归。一般来说,回归允许研究者提出一个一般性问题:“什么是……的最佳预测因子?” 例...

  • 发布于 2021-09-12 06:09
  • 阅读 ( 186 )
sgzrbuarokfhj
sgzrbuarokfhj

0 篇文章

相关推荐