回归与相关
在统计学中,确定两个随机变量之间的关系是很重要的。它提供了对一个变量相对于其他变量的预测能力。回归分析和相关性应用于天气预报、金融市场行为、通过实验建立物理关系,以及更真实的场景。
什么是回归?
回归是一种统计方法,用来绘制两个变量之间的关系。通常在收集数据时,可能存在依赖于其他变量的变量。这些变量之间的精确关系只能用回归方法来建立。确定这种关系有助于理解和预测一个变量对另一个变量的行为。
回归分析最常见的应用是估计因变量的给定值或值范围的值。例如,利用回归分析,我们可以建立商品价格与消费之间的关系,这是基于从随机抽样中收集的数据。回归分析产生数据集的回归函数,这是一个最适合可用数据的数学模型。这很容易用散点图来表示。从图形上讲,回归相当于为给定的数据集找到最佳拟合曲线。曲线的函数是回归函数。利用这一数学模型,可以对给定价格的商品需求进行预测。
因此,回归分析在预测预报中得到了广泛的应用。在物理、化学和许多自然科学和工程学科领域,它也被用来建立实验数据之间的关系。如果关系或回归函数是一个线性函数,那么这个过程称为线性回归。在散点图中,可以用直线表示。如果函数不是参数的线性组合,则回归是非线性的。
什么是相关性?
相关性是两个变量之间关系强度的度量。相关系数根据另一个变量的变化来量化一个变量的变化程度。在统计学中,相关性与相关性的概念有关,即两个变量之间的统计关系。
皮尔逊相关系数或仅相关系数r是-1和1之间的值(-1≤r≤+1)。它是最常用的相关系数,仅对变量之间的线性关系有效。如果r=0,则不存在关系;如果r≥0,则关系成正比;即一个变量的值随另一个变量的增加而增加。如果r≤0,则关系成反比;即一个变量随着另一个变量的增加而减少。
由于线性条件,相关系数r也可用于建立变量之间的线性关系。
回归和相关有什么区别?
回归给出了两个随机变量之间关系的形式,相关关系给出了强度的关系。
回归分析产生一个回归函数,它有助于外推和预测结果,而相关性可能只提供它可能改变的方向的信息。