线性回归分析

线性回归是一种统计技术,用于了解独立(预测)变量和因变量(标准)之间的关系。当分析中有多个自变量时,这称为多元线性回归。一般来说,回归允许研究者提出一个一般性问题:“什么是……的最佳预测因子?”...

线性回归是一种统计技术,用于了解独立(预测)变量和因变量(标准)之间的关系。当分析中有多个自变量时,这称为多元线性回归。一般来说,回归允许研究者提出一个一般性问题:“什么是……的最佳预测因子?”

Obese man eating junk food

例如,假设我们正在研究肥胖的原因,用体重指数(BMI)来衡量。特别是,我们想看看以下变量是否是一个人体重指数的重要预测因素:每周吃快餐的次数、每周看电视的时间、每周锻炼的分钟数以及父母的体重指数。线性回归将是一种很好的分析方法。

回归方程

当使用一个自变量进行回归分析时,回归方程为Y=a+b*X,其中Y为因变量,X为自变量,a为常数(或截距),b为回归线的斜率。例如,假设GPA最好由回归方程1+0.02*IQ预测。如果一个学生的智商是130,那么他或她的平均成绩将是3.6(1+0.02*130=3.6)。

在进行回归分析时,如果有多个自变量,则回归方程为Y=a+b1*X1+b2*X2+…+bp*Xp。例如,如果我们想在GPA分析中加入更多的变量,比如动机和自律的测量,我们会使用这个等式。

r平方

R平方,也称为确定系数,是一种常用的统计数据,用于评估回归方程的模型拟合度。也就是说,所有自变量在预测因变量方面有多好?R平方的值范围为0.0到1.0,可以乘以100以获得解释的方差百分比。例如,回到只有一个自变量(IQ)的GPA回归方程……假设方程的R平方为0.4。我们可以解释这意味着40%的GPA方差是由IQ解释的。如果我们再加上另外两个变量(动机和自律),R平方增加到0.6,这意味着智商、动机和自律共同解释了GPA分数60%的差异。

回归分析通常使用统计软件(如SPSS或SAS)进行,因此可以为您计算R平方。

解释回归系数(b)

上述方程式中的b系数表示自变量和因变量之间关系的强度和方向。如果我们看一下GPA和IQ方程,1+0.02*130=3.6,0.02是变量IQ的回归系数。这告诉我们,这种关系的方向是积极的,所以随着智商的增加,平均成绩也会增加。如果方程式为1-0.02*130=Y,那么这意味着IQ和GPA之间的关系为负。

假设

为了进行线性回归分析,必须满足关于数据的几个假设:

  • 线性:假设自变量和因变量之间的关系是线性的。尽管这一假设永远无法得到完全证实,但查看变量的散点图有助于做出这一判断。如果存在关系中的曲率,可以考虑变换变量或显式地允许非线性分量。
  • 正态性:假设变量的残差是正态分布的。也就是说,预测Y(因变量)值的误差分布方式接近正态曲线。您可以查看直方图或正态概率图来检查变量及其残值的分布。
  • 独立性:假设Y值预测中的误差彼此独立(不相关)。
  • 齐次方差:假设回归线周围的方差对于自变量的所有值都是相同的。

来源

  • StatSoft:电子统计教科书。(2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.

  • 发表于 2021-09-12 06:09
  • 阅读 ( 166 )
  • 分类:数学

你可能感兴趣的文章

如何用excel求相关系数

...数,以查看相关关系。最后,我将给你一个非常快的介绍线性回归,另一个统计函数,可能会证明有用的时候,你看相关性。 ...

  • 发布于 2021-03-11 16:27
  • 阅读 ( 571 )

业务分析回归基础

...习回归分析将是非常值得的。 在本文中,您将学习简单线性回归的基础知识,有时称为“普通最小二乘法”或OLS回归,这是一种常用于预测和财务分析的工具。我们将从学习回归的核心原则开始,首先学习协方差和相关性,然...

  • 发布于 2021-06-02 15:34
  • 阅读 ( 164 )

多元线性回归(mlr)

什么是多元线性回归(mlr)(multiple linear regression (mlr))? 多元线性回归(MLR),也称为多元回归,是一种使用多个解释变量来预测响应变量结果的统计技术。多元线性回归(MLR)的目标是建立解释变量(自变量)和反应变量(因...

  • 发布于 2021-06-10 11:43
  • 阅读 ( 228 )

在excel中建立线性回归模型

什么是线性回归(linear regression)? 线性回归是将自变量和因变量之间的线性关系绘制成图形的数据图。它通常用于直观地显示关系的强度和结果的离散度——所有这些都是为了解释因变量的行为。 比如说,我们想测试吃冰淇淋...

  • 发布于 2021-06-11 18:26
  • 阅读 ( 236 )

时间与价格的线性回归

...而不必考虑人类思维的易错性和偏见。对于投资者来说,线性回归是一种成功的方法,在大多数图表工具中都有。 线性回归分析两个独立的变量,以确定一个单一的关系。在图表分析中,这是指价格和时间的变量。使用图表的...

  • 发布于 2021-06-20 00:47
  • 阅读 ( 232 )

方差分析(anova)和安科娃(ancova)的区别

...应同时存在的情况的混合效应模型。 虽然也可以使用非线性模型,但方差分析的所有方法都使用线性模型来创建响应的假设�它假定情况是独立的,简化了统计分析。它还假设残差的正态分布和方差的相等性,并且方差必须...

  • 发布于 2021-06-23 12:47
  • 阅读 ( 522 )

相关性之间的差异(differences between correlation)和回归(regression)的区别

...变化,那么这两个变量被称为是相关的。 相关性可以是线性的,也可以是非线性的。线性相关性是指变量之间的相关性使得一个变量值的变化会导致另一个变量值的变化。在线性相关中,与因变量和自变量的各自值相关的散点...

  • 发布于 2021-06-24 15:38
  • 阅读 ( 612 )

线性回归(linear regression)和逻辑回归(logistic regression)的区别

线性回归和logistic回归的主要区别在于,线性回归用于预测连续值,而logistic回归用于预测离散值。 机器学习系统可以基于对过去输入的训练来预测未来的结果。机器学习主要有两种类型,即有监督学习和无监督学习。回归和分...

  • 发布于 2021-06-30 23:41
  • 阅读 ( 1408 )

方差分析(anova)和无症状(anocva)的区别

...分析相比,方差分析更为可靠和无偏。模型方差分析使用线性和非线性模型。而ANOCVA只使用一般的线性模型。变量方差分析包括分类变量。ANOCVA包括范畴变量和区间变量。方差分析与方差分析比较表什么是方差分析(anova)?ANOVA代...

  • 发布于 2021-07-07 04:47
  • 阅读 ( 446 )

相关性(correlation)和回归(regression)的区别

...与因变量在数值上的关系。 用法表示两个变量之间的线性关系。拟合一条最佳直线并根据另一个变量估计一个变量。 因变量和自变量没有区别这两个变量是不同的。 表示相关系数表示两个变量一起运动的程度。回归表示...

  • 发布于 2021-07-09 07:41
  • 阅读 ( 417 )
rwwd790470
rwwd790470

0 篇文章

相关推荐