卡方拟合优度检验示例

卡方拟合优度检验有助于将理论模型与观测数据进行比较。此测试是一种更通用的卡方检验。与数学或统计学中的任何主题一样,通过一个卡方拟合优度测试的例子,通过一个例子来了解正在发生的事情是有帮助的。...

卡方拟合优度检验有助于将理论模型与观测数据进行比较。此测试是一种更通用的卡方检验。与数学或统计学中的任何主题一样,通过一个卡方拟合优度测试的例子,通过一个例子来了解正在发生的事情是有帮助的。

Bowl of Colorful Candies Bowl of Colorful Candies

考虑一个标准的牛奶巧克力M&MS包有六种不同的颜色:红,橙,黄,绿,蓝和棕色。假设我们对这些颜色的分布感到好奇,并问,这六种颜色的比例是否相等?这类问题可以通过拟合优度测试来回答。

背景

首先,我们要注意设置以及拟合优度测试适用的原因。我们的颜色变量是分类的。此变量有六个级别,对应于六种可能的颜色。我们将假设我们统计的M&M将是所有M&M总体中的一个简单随机样本。

无效和替代假设

拟合优度检验的无效假设和替代假设反映了我们对总体的假设。因为我们正在测试颜色是否以相同的比例出现,所以我们的无效假设是所有颜色都以相同的比例出现。更正式地说,如果p1是红色糖果的总体比例,p2是橙色糖果的总体比例,依此类推,那么无效假设是p1=p2=…=p6=1/6。

另一种假设是,至少有一个人口比例不等于1/6。

实际和预期计数

实际计数是六种颜色中每种颜色的糖果数量。预期计数是指如果无效假设为真,我们将预期的计数。我们会让n成为我们样品的大小。红色糖果的预期数量为p1 n或n/6。事实上,在这个例子中,六种颜色中每种颜色的预期糖果数量只是π的n倍,或n/6。

拟合优度的卡方统计

现在,我们将计算一个特定示例的卡方统计。假设我们有一个简单的随机样本600 M&M糖果,其分布如下:

  • 212个糖果是蓝色的。
  • 147种糖果是橙色的。
  • 103个糖果是绿色的。
  • 50个糖果是红色的。
  • 46种糖果是黄色的。
  • 42种糖果是棕色的。

如果零假设为真,则每种颜色的预期计数为(1/6)x 600=100。现在我们在计算卡方统计量时使用它。

我们计算每种颜色对统计数据的贡献。每一个都是(实际-预期)2/预期的形式:

  • 对于蓝色,我们有(212–100)2/100=125.44
  • 对于橙色,我们有(147–100)2/100=22.09
  • 对于绿色,我们有(103-100)2/100=0.09
  • 对于红色,我们有(50-100)2/100=25
  • 对于黄色,我们有(46–100)2/100=29.16
  • 对于棕色,我们有(42-100)2/100=33.64

然后,我们将所有这些贡献相加,并确定我们的卡方统计为125.44+22.09+0.09+25+29.16+33.64=235.42。

自由度

拟合优度测试的自由度只比变量的级别数少一个。因为有六种颜色,所以我们有6–1=5个自由度。

卡方表与p值

我们计算的卡方统计量235.42对应于具有五个自由度的卡方分布上的特定位置。我们现在需要一个p值,以确定在假设零假设为真的情况下,获得至少与235.42一样极端的检验统计量的概率。

Microsoft的Excel可用于此计算。我们发现,我们对五个自由度的检验统计量的p值为7.29 x 10-49。这是一个非常小的p值。

决策规则

我们根据p值的大小决定是否拒绝零假设。因为我们有一个非常小的p值,所以我们拒绝了零假设。我们得出结论,M&M在六种不同颜色中的分布并不均匀。后续分析可用于确定一种特定颜色的总体比例的置信区间。

  • 发表于 2021-10-20 23:49
  • 阅读 ( 445 )
  • 分类:数学

你可能感兴趣的文章

如何在excel中进行基础数据分析

...使用统计软件。这些工具是用来做计算的,比如t检验、卡方检验、相关性等等。Excel不是用来进行数据分析的。但这并不意味着你做不到。 ...

  • 发布于 2021-03-12 01:13
  • 阅读 ( 470 )

在excel中建立线性回归模型

...些关键假设必须为真: 变量必须是真正独立的(使用卡方检验)。 数据不能有不同的误差方差(这称为异方差(也称为异方差))。 每个变量的误差项必须是不相关的。如果不是,则表示变量是串行相关的。 如果这三件...

  • 发布于 2021-06-11 18:26
  • 阅读 ( 232 )

回溯检验和正向检验:相关性的重要性

...这种过度优化创建的系统只在纸面上看起来很好。 曲线拟合是使用优化分析,在测试期间使用的历史数据上,以最大的利润创建最高数量的中标交易。尽管在回溯测试结果中它看起来令人印象深刻,但曲线拟合会导致不可靠的...

  • 发布于 2021-06-20 00:40
  • 阅读 ( 176 )

z-检验(z-test)和卡方(chi-square)的区别

Z检验和卡方检验是两种不同的统计假设检验。这两个测试都为空值假设提供了另一种观点。Z检验(ztest) vs. chisquare公司(chisquare)Z检验与卡方检验的区别在于,Z检验是检验两个总体均值的结果是否存在差异的一种统计检验。另一方...

  • 发布于 2021-07-09 14:50
  • 阅读 ( 1174 )

卡方拟合优度检验

卡方拟合优度检验是更一般的卡方检验的一种变体。此测试的设置是单个类别变量,可以有多个级别。通常在这种情况下,我们会考虑一个分类变量的理论模型。通过这个模型,我们预计一定比例的人口会下降到这些水平。拟...

  • 发布于 2021-09-23 05:38
  • 阅读 ( 175 )

统计和数学自由度

...99个元素的值,那么最后一个已经确定。 学生t分数与卡方分布 自由度在使用学生t分数表时起着重要作用。实际上有几个t分数分布。我们使用自由度来区分这些分布。 这里我们使用的概率分布取决于样本的大小。如果我们...

  • 发布于 2021-09-24 00:42
  • 阅读 ( 187 )

如何在统计中寻找自由度(find degrees of freedom in statistics)

...由度。这只是两个数字n1-1和n2-1中较小的一个。 独立卡方 卡方检验的一个用途是观察两个分类变量是否表现出独立性,每个变量有几个级别。关于这些变量的信息记录在一个包含r行和c列的双向表中。自由度的数量是乘积(r-...

  • 发布于 2021-09-24 12:18
  • 阅读 ( 290 )

在excel中寻找卡方函数

...Microsoft Excel。许多发行版都被编程到Excel中。其中之一是卡方分布。有几个Excel函数使用卡方分布。 卡方的详细信息 在了解Excel的功能之前,让我们先提醒一下有关卡方分布的一些细节。这是一个不对称的概率分布,并且高度...

  • 发布于 2021-09-25 03:14
  • 阅读 ( 286 )

akaike信息准则(aic)简介

...失这些信息。因此,AIC致力于平衡给定模型的复杂性与其拟合优度之间的权衡,拟合优度是描述模型“拟合”数据或观测集的统计术语。 aic不会做什么 由于Akaike信息标准(AIC)可以处理一组统计和计量经济学模型以及给定的...

  • 发布于 2021-09-25 11:45
  • 阅读 ( 380 )

结构方程模型

...将产生一个接近样本协方差矩阵的估计矩阵。这主要通过卡方检验统计和拟合指数进行评估。 测试理论:每个理论或模型都生成自己的协方差矩阵。那么,哪种理论最好?对代表特定研究领域中相互竞争的理论的模型进行评估...

  • 发布于 2021-10-02 19:16
  • 阅读 ( 327 )
a1245888417
a1245888417

0 篇文章

相关推荐