四分位数是一个统计术语,它描述了根据数据值将观测值划分为四个定义的区间,以及它们与整个观测值集的比较。
要理解四分位数,重要的是要理解中位数作为中心趋势的度量。统计学中的中值是一组数字的中间值。在这个点上,正好有一半的数据位于中心值的下方和上方。
所以,给定一组13个数字,中位数就是第七个数字。此值前面的六个数字是数据中的最低数字,中间值后面的六个数字是给定数据集中的最高数字。因为中位数不受分布中的极值或异常值的影响,所以它有时比平均值更受欢迎。
中位数是一个稳健的位置估计器,但它并没有说明其值的两边的数据是如何传播或分散的。这就是四分位数的作用。四分位数通过将分布分为四组来测量平均值上下的值的分布。
正如中位数将数据分成一半,使50%的测量值低于中位数,50%的测量值高于中位数一样,四分位数将数据分成四分之一,使25%的测量值低于下四分位数,50%的测量值低于中位数,75%的测量值低于上四分位数。
四分位数将数据分为三个点:下四分位数、中位数和上四分位数,形成四组数据集。下四分位数或第一四分位数表示为Q1,是介于数据集最小值和中间值之间的中间数。第二个四分位数Q2也是中位数。上四分位数或第三个四分位数,表示为Q3,是分布中位数和最高值之间的中心点。
现在,我们可以画出由四分位数组成的四组。第一组值包含到Q1为止的最小值;第二组包括Q1至中位数;第三组是Q3的中位数;第四类包括Q3到整个集合的最高数据点。
每个四分位数包含总观察值的25%。一般来说,数据是从最小到最大排列的:
假设一个由19名学生组成的班级的数学分数按升序分布为:
首先,记下中间值Q2,在本例中是第10个值:75。
Q1是最小分数和中位数之间的中心点。在这种情况下,Q1介于第一和第五个分数之间:68。(注意,在计算一组奇数值的Q1或Q3时,也可以包括中间值。)。如果我们将中间点两边的中间值包括在内,那么Q1将是第一和第十个分数之间的中间值,即第五和第六个分数的平均值-(第五+第六)/2=(68+69)/2=68.5)。
Q3是Q2和最高分之间的中间值:84(或者如果包括中间值,Q3=(82+84)/2=83)。
现在我们有了四分位数,让我们来解释它们的数字。68分(Q1)代表第一个四分位数,是第25个百分位数。68是可用数据中设置的分数下半部分的中位数,即59到75之间的分数中位数。
Q1告诉我们,25%的分数低于68分,75%的班级分数高于68分。Q2(中位数)是第50个百分位数,显示50%的分数低于75分,50%的分数高于75分。最后,Q3(中位数)显示25%的分数高于75分,75%的分数低于84分。
如果Q1的数据点离中值的距离比Q3离中值的距离远,那么我们可以说数据集较小值之间的离散度大于较大值之间的离散度。如果Q3与Q2的距离远于Q1与中值的距离,则同样的逻辑也适用。
或者,如果有偶数个数据点,中位数将是中间两个数字的平均值。在我们上面的例子中,如果我们有20个学生而不是19个,他们的分数中位数将是第10个和第11个数字的算术平均数。
四分位数用于计算四分位数间的范围,这是一种测量中位数附近的变**的度量。四分位数范围简单地计算为第一个和第三个四分位数之间的差值:Q3–Q1。实际上,正是数据的中半部分的范围显示了数据的传播方式。
对于大型数据集,microsoftexcel有一个四分位数函数来计算四分位数。
... 对于查看方框和胡须图,方框显示第一个四分位数到第三个四分位数,中间有一条穿过中心的线。胡须从每四分之一到最小值或最大值。 ...
...据集中的异常值,我们使用以下步骤: 计算第1和第3个四分位数(我们将稍微讨论一下它们是什么)。 评估四分位范围(我们还将进一步解释这些)。 返回数据范围的上限和下限。 使用这些边界来标识外围数据点。 下图中数...
...去年带来200亿美元的广告收入,占Facebook 2019年总收入的四分之一以上。 Instagram上的故事之间、提要内以及浏览标签上都会出现广告。Instagram团队已经越来越多地发现如何在用户的内容之间**广告。 鉴于谷歌昨日承认...
...会正义概念。 根据人口的大小,五分位数的替代品包括四分位数和三分位数。 了解五分位数 五分位数是一种分位数,定义为人口中大小相等的部分。统计分析中最常见的指标之一,中位数,实际上只是将一个群体分成两个...
...所有情况下都是如此。 第25百分位和第75百分位也被称为四分位,因为它们分别代表值的四分之一(1/4)和四分之三(3/4)。 百分比和百分位数不一定代表相同的数量。例如,如果你参加SAT考试,考试成绩为60%,你可能会发现你...
...分数低于它。所以在这个例子中,中位数是8,低于8分有四分,高于8分有四分,所以8代表样本的中点或中心趋势。 算术平均数和中位数的缺点 均值不是一个稳健的统计工具,因为它不能应用于所有的分布,但很容易是最广泛...
...位数(percentile)百分比和百分位数的区别在于百分比可以有四分位数,而百分位数没有四分位数。另一个方面是百分比总是以100的值来显示。百分位数显示给定组的某个给定排名的百分比值。百分数直接表示以100为单位的数字数据...
... 基本上,这所学校的大多数新生的分数至少为1400分,四分之一的新生的分数为1570分或更高。 为什么分数百分位数排名很重要? 他们是一个伟大的方式来衡量你的分数是否在你选择的学校入学的学生范围内。如果你是哈佛...
...数意味着你的分数比那些被那所大学录取的学生中的倒数四分之一要好。这也意味着四分之三的被录取者的得分高于这个数字。低于第25个百分位,你的考试分数对你的申请来说并不有利,但如果你在其他领域表现出色,你可能...
第一个四分位数和第三个四分位数是描述性统计,是对数据集中位置的测量。与中位数表示数据集中点的方式类似,第一个四分位数表示四分之一点或25%点。大约25%的数据值小于或等于第一个四分位数。第三个四分位数类似,...