线性回归是一种统计工具,用于确定一条直线与一组成对数据的拟合程度。最适合该数据的直线称为最小二乘回归线。这条线有多种用途。这些用途之一是针对解释变量的给定值估计响应变量的值。与此相关的是一个残差。
通过执行减法获得残差。我们所要做的就是从观测到的某个x的y值中减去y的预测值。结果称为残差。
残差的公式很简单:
残差=观测y–预测y
值得注意的是,预测值来自我们的回归线。观察值来自我们的数据集。
我们将通过一个例子来说明这个公式的用法。假设我们得到以下成对数据集:
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
通过使用软件,我们可以看到最小二乘回归线是y=2x。我们将使用它来预测x的每个值。
例如,当x=5时,我们看到2(5)=10。这给了我们回归线上x坐标为5的点。
为了计算x=5点的残差,我们从观测值中减去预测值。由于我们数据点的y坐标为9,因此剩余值为9–10=-1。
在下表中,我们了解如何计算此数据集的所有残差:
X | 观察到 | 预测y | 残余物 |
1. | 2. | 2. | 0 |
2. | 3. | 4. | -1 |
3. | 7. | 6. | 1. |
3. | 6. | 6. | 0 |
4. | 9 | 8. | 1. |
5. | 9 | 10 | -1 |
现在我们已经看到了一个示例,需要注意残差的一些特征:
残差有几种用途。一个用途是帮助我们确定我们是否有一个具有整体线性趋势的数据集,或者我们应该考虑一个不同的模型。原因是残差有助于放大数据中的任何非线性模式。通过检查残差和相应的残差图,可以更容易地观察到通过观察散点图难以看到的内容。
考虑残差的另一个原因是检查满足线性回归推断的条件。在验证线性趋势(通过检查残差)后,我们还检查残差的分布。为了能够进行回归推断,我们希望回归线的残差近似为正态分布。残差的柱状图或柱状图将有助于验证是否满足此条件。
...分离、物理分离或机械分离。 目录 1. 概述和主要区别 2. 什么是滤液 3. 什么是残留物 4. 并列比较-过滤液与残留物的表格形式 5. 摘要 什么是滤液(filtrate)? 滤液是经过过滤过程后我们可以得到的液体部分。它是通过我们用来过...
什么是剩余标准差(residual standard deviation)? 残差标准差是一个统计术语,用于描述观察值与预测值的标准差差异,如回归分析中的点所示。 回归分析是统计学中用来显示两个不同变量之间关系的一种方法,用来描述如何从一个...
什么是多元线性回归(mlr)(multiple linear regression (mlr))? 多元线性回归(MLR),也称为多元回归,是一种使用多个解释变量来预测响应变量结果的统计技术。多元线性回归(MLR)的目标是建立解释变量(自变量)和反应变量(因...
...述模型“拟合”数据或观测集的统计术语。 aic不会做什么 由于Akaike信息标准(AIC)可以处理一组统计和计量经济学模型以及给定的数据集,因此它是模型选择中的一个有用工具。但即使作为一种模型选择工具,AIC也有其局限...
...而自变量由可能对因变量产生重大影响的因素组成。 什么是线性回归(linear regression)? 线性回归是一种回归分析技术,使用直线建立两个变量之间的关系。线性回归试图通过找到斜率和截距来绘制最接近数据的直线,从而定...
剩余股利政策是根据与投资相关的资本支出满足后剩余的股本金额计算股利的一种方...
个人可以考虑许多不同类型的剩余收入机会。其中最受欢迎的是创建博客并将其盈利...
农药残留分析是一种实验室测试,目的是在准备好的食物、水或活生物体等样品中寻...