如何(以及为什么)在excel中使用outliers函数

离群值是一个明显高于或低于数据中大多数值的值。当使用Excel分析数据时,异常值会使结果产生偏差。例如,数据集的平均值可能真正反映了您的值。Excel提供了一些有用的函数来帮助管理异常值,让我们来看看。...
007Ys3FFgy1gp73ww1hv3j30i208cdju

离群值是一个明显高于或低于数据中大多数值的值。当使用Excel分析数据时,异常值会使结果产生偏差。例如,数据集的平均值可能真正反映了您的值。Excel提供了一些有用的函数来帮助管理异常值,让我们来看看。

一个简单的例子

在下图中,异常值很容易发现分配给Eric的值2和分配给Ryan的值173。在这样的数据集中,手动发现和处理这些异常值非常容易。

如何(以及为什么)在excel中使用outliers函数

在一组更大的数据中,情况并非如此。能够识别异常值并将其从统计计算中删除是很重要的,这也是我们将在本文中讨论的方法。

如何在数据中发现异常值

要查找数据集中的异常值,我们使用以下步骤:

  1. 计算第1和第3个四分位数(我们将稍微讨论一下它们是什么)。
  2. 评估四分位范围(我们还将进一步解释这些)。
  3. 返回数据范围的上限和下限。
  4. 使用这些边界来标识外围数据点。

下图中数据集右侧的单元格区域将用于存储这些值。

如何(以及为什么)在excel中使用outliers函数

我们开始吧。

第一步:计算四分位数

如果你把你的数据分成四分之一,每一组数据都被称为四分位数。这个范围内最低25%的数字组成第一个四分位数,下一个25%组成第二个四分位数,依此类推。我们首先采取这一步,因为最广泛使用的离群值定义是一个数据点,它比第一个四分位数低1.5个四分位数区间(IQR),比第三个四分位数高1.5个四分位数区间。为了确定这些值,我们首先要弄清楚四分位数是什么。

Excel提供了一个四分位数函数来计算四分位数。它需要两条信息:数组和夸脱。

=QUARTILE(array, quart)

数组是要计算的值的范围。四分位数是一个表示要返回的四分位数的数字(例如,1表示第一个四分位数,2表示第二个四分位数,依此类推)。

注意:在Excel 2010中,Microsoft发布了四分位公司以及四分位数.EXC函数作为四分位函数的改进。当在多个版本的Excel中工作时,QUARTILE更向后兼容。

让我们回到示例表。

如何(以及为什么)在excel中使用outliers函数

为了计算第一个四分位数,我们可以在单元格F2中使用以下公式。

=QUARTILE(B2:B14,1)

当您输入公式时,Excel会为quart参数提供一个选项列表。

如何(以及为什么)在excel中使用outliers函数

为了计算第三个四分位数,我们可以输入一个类似于F3单元格中前一个四分位数的公式,但使用三而不是一。

=QUARTILE(B2:B14,3)

现在,我们得到了单元格中显示的四分位数据点。

如何(以及为什么)在excel中使用outliers函数

第二步:评估四分位区间

四分位间距(或IQR)是数据中数值的中间50%。它被计算为第一个四分位值和第三个四分位值之间的差值。

我们将在F4单元格中使用一个简单的公式,从第3个四分位数中减去第1个四分位数:

=F3-F2

现在,我们可以看到显示的四分位间距。

如何(以及为什么)在excel中使用outliers函数

第三步:返回上下限

下限和上限是我们要使用的数据范围的最小值和最大值。任何小于或大于这些界限值的值都是异常值。

我们将通过将IQR值乘以1.5,然后从Q1数据点中减去它来计算单元格F5中的下限:

=F2-(1.5*F4)

如何(以及为什么)在excel中使用outliers函数

注意:这个公式中的括号是不必要的,因为乘法部分将在减法部分之前计算,但它们确实使公式更容易阅读。

为了计算单元格F6中的上限,我们将IQR再次乘以1.5,但这次将其添加到Q3数据点:

=F3+(1.5*F4)

如何(以及为什么)在excel中使用outliers函数

第四步:识别异常值

现在我们已经设置了所有的基础数据,现在是时候确定我们的外围数据点了,即低于下限值或高于上限值的数据点。

我们将使用OR函数执行此逻辑测试,并通过在单元格C2中输入以下公式来显示满足这些条件的值:

=OR(B2<$F$5,B2>$F$6)

如何(以及为什么)在excel中使用outliers函数

然后我们将这个值复制到我们的C3-C14细胞中。真值表示异常值,如您所见,我们的数据中有两个异常值。

如何(以及为什么)在excel中使用outliers函数

计算平均值时忽略异常值

使用四分位函数,让我们计算IQR,并使用最广泛使用的离群值定义。但是,当计算一系列值的平均值并忽略异常值时,有一个更快更容易使用的函数。这种技术不会像以前那样识别异常值,但它允许我们灵活地处理我们可能认为的异常值部分。

我们需要的函数名为TRIMMEAN,您可以在下面看到它的语法:

=TRIMMEAN(array, percent)

数组是要求平均值的值范围。百分比是要从数据集的顶部和底部排除的数据点的百分比(可以输入百分比或十进制值)。

我们将下面的公式输入到示例中的单元格D3中,以计算平均值并排除20%的异常值。

=TRIMMEAN(B2:B14, 20%)

如何(以及为什么)在excel中使用outliers函数


这里有两个不同的函数来处理异常值。无论您是要根据某些报告需要确定它们,还是要将它们从计算(如平均值)中排除,Excel都有一个功能来满足您的需要。

  • 发表于 2021-04-04 02:15
  • 阅读 ( 733 )
  • 分类:互联网

你可能感兴趣的文章

解决并解释了3个复杂的excel提取问题

...microsoftexcel的复杂单元格中提取信息而挣扎。我写的关于如何用这个函数从Excel中提取数字或文本的文章中的许多评论和问题证明了这一点。显然,如何从Excel工作表中分离出所需的数据并不总是很清楚。 ...

  • 发布于 2021-03-17 15:46
  • 阅读 ( 197 )

4个excel查找功能,有效搜索电子表格

... 一旦你知道如何使用查找在Excel中搜索,不管你的电子表格有多大,你总能在Excel中找到一些东西! ...

  • 发布于 2021-03-18 02:23
  • 阅读 ( 259 )

如何在microsoftexcel中绘制框须图

...个方框和胡须图。如果您以前从未做过,我们将向您展示如何在Excel中创建一个方框和胡须图,然后仔细检查计算结果,并自定义用于表示的图表。 ...

  • 发布于 2021-03-21 15:18
  • 阅读 ( 287 )

3个疯狂的excel公式,做了惊人的事情

... 让我们深入了解如何使用公式和其他工具更好地使用Microsoft Excel。 ...

  • 发布于 2021-03-22 19:09
  • 阅读 ( 270 )

如何在excel中合并和取消合并单元格:技巧和窍门

... 您可能想知道为什么不在本例中删除第二列。嗯,你可能会的。合并列对您没有多大帮助。 ...

  • 发布于 2021-03-25 03:38
  • 阅读 ( 200 )

在vba中理解excel单元格与range函数

... 那么为什么不在同一个脚本中触发奖金列的计算呢? ...

  • 发布于 2021-03-25 12:55
  • 阅读 ( 467 )

通过本课程掌握excel电子表格函数、公式和数据分析

在任何行业,团队中都需要知道如何管理和研究数据的人员。数据分析技能可帮助您了解客户数据并做出明智的业务决策。microsoftexcel是一种电子表格软件,它可以让您将数据制表、分析和可视化。 ...

  • 发布于 2021-03-28 03:39
  • 阅读 ( 293 )

excel中标准差的计算

... 如何利用insert函数计算excel中的标准差 ...

  • 发布于 2021-03-28 16:19
  • 阅读 ( 252 )

如何在excel中计算唯一值

... 我们怎么到那里有点复杂。所以,如果你想理解为什么这个公式是有效的,我们将在下面一次分解一部分。 ...

  • 发布于 2021-03-29 00:28
  • 阅读 ( 228 )

学习excel、python、tableau等的数据分析

...。 使用图表和图形进行数据可视化:了解为什么、何时以及如何使用每种图表类型以及最佳实践。 Excel数据分析:学习如何通过项目、应用程序和实际培训练习分析数据。 基本/高级Exc...

  • 发布于 2021-03-29 08:25
  • 阅读 ( 253 )
hpq28403
hpq28403

0 篇文章

相关推荐