一组数据的中值是中间点,其中正好有一半的数据值小于或等于中值。以类似的方式,我们可以考虑连续概率分布的中位数,但不是在一组数据中找到中间值,而是以不同的方式找到分布的中间值。
概率密度函数下的总面积为1,表示100%,因此,其中一半可以表示为一半或50%。数理统计的一个重要思想是,概率由密度函数曲线下的面积表示,该面积由一个积分计算,因此连续分布的中值是实数线上正好一半面积位于左侧的点。
这可以用下面的不恰当积分更简洁地表述。具有密度函数f(X)的连续随机变量X的中值为M,因此:
0.5=∫M−∞f(x)dx0.5=\int{m}^{-\infty}f(x)dx0.5=∫M−∞f(x)dx
现在我们计算指数分布Exp(A)的中值。具有此分布的随机变量具有密度函数f(x)=e-x/A/A,用于x任何非负实数。该函数还包含数学常数e,约等于2.71828。
由于x的任何负值的概率密度函数都为零,因此我们所要做的就是积分以下各项并求解M:
0.5 = ∫0M f(x) dx自积分以来∫ e-x/A/A dx=-e-x/A,结果是
0.5 = -e-M/A + 1这意味着0.5=e-M/A,取方程两边的自然对数后,我们得到:
ln(1/2) = -M/A由于1/2=2-1,根据对数的性质,我们写下:
- ln2 = -M/A将两边乘以A,得出中值M=A ln2的结果。
应提及该结果的一个结果:指数分布Exp(A)的平均值为A,并且由于ln2小于1,因此产品Aln2小于A。这意味着指数分布的中值小于平均值。
如果我们考虑概率密度函数图,这是有意义的。由于长尾效应,该分布向右倾斜。很多时候,当分布向右倾斜时,平均值位于中位数的右侧。
在统计分析方面,这意味着我们通常可以预测,鉴于数据向右倾斜的概率,平均值和中值并不直接相关,这可以表示为中值-均值不等式证明,称为切比雪夫不等式。
作为一个例子,考虑一个数据集,假定一个人在10小时内接收到总共30个访问者,其中访问者的平均等待时间是20分钟,而一组数据可能表明,半数以上的等待时间在20到30分钟之间,如果超过一半的访问者出现在最初的五小时内。
什么是基尼指数(the gini index)? 基尼指数,或称基尼系数,是1912年意大利统计学家科拉多·基尼(Corrado Gini)提出的一种衡量人口收入分配情况的指标。它通常被用作衡量经济不平等的指标,衡量一个人口的收入分配,或者不太...
...的图。左边的图表是正倾斜的。这意味着平均值>中位数>模式。请注意,右尾翼是如何变长的,而左侧的结果是如何向中心**的。尽管这些结果表明结果小于平均值的概率更高,但也表明右侧长尾所示的极为积极结...
...可能存在风险。 常见问题 什么是对称分布中平均值、中位数和模式之间的关系(the relati***hip between mean, median, and mode in a symmetrical distribution)? 在对称分布中,这三个描述性统计数据都倾向于相同的值,例如在正态分布(贝尔...
...元的街头高点,而该股定于周五的交易日开盘,比150美元中位数低近20美元。这种低迷的配售突显出对苹果股票合法价值的困惑。 小费 “法昂” is an acronym that refers to the stocks of five prominent American 技术公司: Facebook, Inc. (FB公...
...元的街头高点不等,而该股周一开盘将比目标价293美元的中位数低约44美元。这种安排有很多潜在的上升空间,但在今年迄今50%以上的回报率之后,可能需要更多的时间来消除超买的技术条件。 市盈率 is the ratio for valuing a co...
...2018年高点。 2019年6月,在触及1994年以来最极端的超买指数后,月度随机振荡指数进入卖出周期。这预示着未来三到六个月内价格将走低,但横跨前十年下跌趋势的斐波那契网格显示了一个更为乐观的故事,随着价格走势接近...
...对于其他考试分数下降的百分位数。它是基于将值的正态分布划分为百分位;其中最重要的是第25、50和75百分位。 正态分布是呈钟形的数值曲线。百分位数将这个“钟声”分成几个部分。百分位数依赖并假设数据遵循正态...
平均数(或平均数)和中位数是统计术语,在理解一组统计分数的中心趋势方面具有某种相似的作用。虽然平均值传统上是衡量样本中点的常用方法,但它的缺点是,与样本的其他部分相比,任何单个值过高或过低都会影...
...中间值**的趋势。两个最常用的中心趋势指标是平均值和中位数。平均值定义为给定数据集的“中心”值,而中位数是给定数据集的“最中间”值。 一个理想的衡量中心趋势的方法是一个定义清晰,易于理解,易于计算的方法...
...列数字相加,然后将总和除以数值总数,得出平均值。 中位数:中位数是从最小到最大的一系列数字中的“中间值”。当列表中的值总数为奇数时,中间值为中间项。当列表中的值总数为偶数时,中位数等于两个中间数之和除...