数理统计使用各种数学分支的技术来明确证明有关统计的陈述是正确的。我们将看到如何使用微积分来确定卡方分布的最大值(对应于其模式)的上述值,以及找到分布的拐点。
在此之前,我们将讨论最大值和拐点的一般特征。我们还将研究一种计算拐点最大值的方法。
对于离散数据集,模式是最常出现的值。在数据的柱状图上,这将由最高的条表示。一旦我们知道了最高的条形图,我们就会查看对应于该条形图基准的数据值。这是我们数据集的模式。
同样的想法也用于处理连续分布。这一次为了找到模式,我们寻找分布中的最高峰值。对于该分布图,峰值的高度为y值。这个y值被称为图形的最大值,因为该值大于任何其他y值。模式是与该最大y值相对应的沿水平轴的值。
虽然我们可以简单地查看分布图来找到模式,但这种方法存在一些问题。我们的准确度只和我们的图表一样好,我们很可能不得不估计。此外,绘制我们的函数可能会有困难。
另一种不需要绘图的方法是使用微积分。我们将使用的方法如下:
现在我们通过上面的步骤来计算具有r自由度的卡方分布的模式。我们从本文图像中显示的概率密度函数f(x)开始。
f(x)=K xr/2-1e-x/2
这里K是一个常数,包含伽马函数和2的幂。我们不需要知道细节(但是我们可以参考图片中的公式了解这些细节)。
该函数的一阶导数通过乘积规则和链式规则给出:
f'(x)=K(r/2-1)xr/2-2e-x/2-(K/2)xr/2-1e-x/2
我们将此导数设置为零,并将右侧的表达式作为因子:
0=K xr/2-1e-x/2[(r/2-1)x-1-1/2]
由于常数K、指数函数和xr/2-1都不是零,我们可以用这些表达式来划分方程的两边。然后我们有:
0=(r/2-1)x-1-1/2
将方程的两边乘以2:
0=(r-2)x-1-1
因此1=(r-2)x-1,我们通过x=r-2得出结论。这是沿水平轴发生模式的点。它表示卡方分布峰值的x值。
曲线的另一个特征是处理曲线的方式。曲线的部分可以向上凹,就像大写的U形。曲线也可以向下凹,形状像交叉符号∩. 当曲线从下凹变为上凹,反之亦然,我们有一个拐点。
函数的二阶导数检测函数图的凹度。如果二阶导数为正,则曲线向上凹。如果二阶导数为负,则曲线向下凹。当二阶导数等于零时,函数的图变为凹形,我们有一个拐点。
为了找到图形的拐点,我们:
现在我们来看看如何完成卡方分布的上述步骤。我们从区分开始。从上述工作中,我们发现函数的一阶导数为:
f'(x)=K(r/2-1)xr/2-2e-x/2-(K/2)xr/2-1e-x/2
我们再次区分,使用乘积规则两次。我们有:
f''(x)=K(r/2-1)(r/2-2)xr/2-3e-x/2-(K/2)(r/2-1)xr/2-2e-x/2+(K/4)xr/2-1e-x/2-(K/2)(r/2-1)xr/2-2e-x/2
我们将其设为0,并将两边除以Ke-x/2
0=(r/2-1)(r/2-2)xr/2-3-(1/2)(r/2-1)xr/2-2+(1/4)xr/2-1-(1/2)(r/2-1)xr/2-2
通过组合相似的术语,我们有:
(r/2-1)(r/2-2)xr/2-3-(r/2-1)xr/2-2+(1/4)xr/2-1
将两侧乘以4x3-r/2,得出:
0=(r-2)(r-4)-(2r-4)x+x2。
二次公式现在可以用来解x。
x=[(2r-4)+/-[(2r-4)2-4(r-2)(r-4)]1/2]/2
我们将术语扩展为1/2次方,如下所示:
(4r2-16r+16)-4(r2-6r+8)=8r-16=4(2r-4)
这意味着:
x=[(2r-4)+/-[(4(2r-4)]1/2]/2=(r-2)+/-[2r-4]1/2
由此我们可以看出,有两个拐点。此外,这些点关于分布模式是对称的,因为(r-2)在两个拐点之间。
我们看到了这两个特征是如何与自由度相关的。我们可以使用这些信息来帮助绘制卡方分布。我们还可以将此分布与其他分布进行比较,例如正态分布。我们可以看到,卡方分布的拐点出现在与正态分布拐点不同的地方。
...类型 概率分布有许多不同的分类。其中包括正态分布、卡方分布、二项分布和泊松分布。不同的概率分布有不同的用途,代表不同的数据生成过程。例如,二项式分布评估一个事件在给定次数的试验中发生几次的概率,以及给...
Z检验和卡方检验是两种不同的统计假设检验。这两个测试都为空值假设提供了另一种观点。Z检验(ztest) vs. chisquare公司(chisquare)Z检验与卡方检验的区别在于,Z检验是检验两个总体均值的结果是否存在差异的一种统计检验。另一方...
卡方拟合优度检验是更一般的卡方检验的一种变体。此测试的设置是单个类别变量,可以有多个级别。通常在这种情况下,我们会考虑一个分类变量的理论模型。通过这个模型,我们预计一定比例的人口会下降到这些水平。拟...
...因为所有结果的概率都是相同的。不同于具有中等驼峰或卡方分布的正态分布,均匀分布没有模式。相反,每一种结果都同样可能发生。与卡方分布不同,均匀分布没有偏态。因此,平均值和中位数是一致的。 由于均匀分布中...
...99个元素的值,那么最后一个已经确定。 学生t分数与卡方分布 自由度在使用学生t分数表时起着重要作用。实际上有几个t分数分布。我们使用自由度来区分这些分布。 这里我们使用的概率分布取决于样本的大小。如果我们...
...由度。这只是两个数字n1-1和n2-1中较小的一个。 独立卡方 卡方检验的一个用途是观察两个分类变量是否表现出独立性,每个变量有几个级别。关于这些变量的信息记录在一个包含r行和c列的双向表中。自由度的数量是乘积(r-...
...Microsoft Excel。许多发行版都被编程到Excel中。其中之一是卡方分布。有几个Excel函数使用卡方分布。 卡方的详细信息 在了解Excel的功能之前,让我们先提醒一下有关卡方分布的一些细节。这是一个不对称的概率分布,并且高度...
...和非线性回归;使用二项分布、正态分布、Student-t分布和卡方分布检验假设;使用基本计数原理、排列和组合;解释并应用正态和二项式概率分布;并确定正态分布模式。
...多其他分布涉及数字e的使用。例如,t分布、gamma分布和卡方分布的公式都包含数字e。
...定F分布取决于样本的自由度。F分布的这一特征与t分布和卡方分布相似。 F分布为零或正,因此F没有负值。F分布的这一特征类似于卡方分布。 F分布向右倾斜。因此,这种概率分布是不对称的。F分布的这一特征类似于卡方分布...