什么是分类变量的双向表?(a two-way table of categorical variables?)

统计学的目标之一是以有意义的方式排列数据。双向表是组织特定类型成对数据的重要方式。与统计学中任何图形或表格的构造一样,了解我们正在处理的变量类型非常重要。如果我们有定量数据,那么应该使用直方图或茎叶图等图形。如果我们有分类数据,那么条形图或饼图是合适的。...

统计学的目标之一是以有意义的方式排列数据。双向表是组织特定类型成对数据的重要方式。与统计学中任何图形或表格的构造一样,了解我们正在处理的变量类型非常重要。如果我们有定量数据,那么应该使用直方图或茎叶图等图形。如果我们有分类数据,那么条形图或饼图是合适的。

student and teacher

在处理成对数据时,我们必须小心。成对定量数据存在散点图,但成对分类数据有什么样的图?当我们有两个分类变量时,我们应该使用一个双向表。

双向表的说明

首先,我们记得分类数据与特征或类别有关。它不是定量的,也没有数值。

双向表包括列出两个分类变量的所有值或级别。其中一个变量的所有值都列在垂直列中。另一个变量的值沿水平行列出。如果第一个变量有m个值,第二个变量有n个值,那么表中总共有mn个条目。每个条目对应于两个变量中每个变量的特定值。

沿着每一行和每一列,对条目进行合计。在确定边际和条件分布时,这些总数很重要。当我们进行独立性卡方检验时,这些总数也很重要。

双向表的示例

例如,我们将考虑一个情况下,我们在大学的统计课程的几个部分。我们想构建一个双向表来确定课程中男性和女性之间的差异(如果有的话)。为了实现这一目标,我们统计了每个性别成员获得的每个字母等级的数量。

我们注意到第一个分类变量是性别,在对男性和女性的研究中有两个可能的值。第二个分类变量是字母等级,有五个值由A、B、C、D和F给出。这意味着我们将有一个双向表,其中2 x 5=10个条目,加上一个额外的行和一个额外的列,这将需要将行和列总数制成表格。

我们的调查显示:

  • 50名男性获得A,60名女性获得A。
  • 60名男性得B,80名女性得B。
  • 100名男性得C,50名女性得C。
  • 40名男性得D,50名女性得D。
  • 30名男性获得F,20名女性获得F。

此信息输入到下面的双向表中。每一行的总数告诉我们每一种等级的得分是多少。总计栏告诉我们男性和女性的数量。

双向表的重要性

当我们有两个分类变量时,双向表有助于组织数据。此表可用于帮助我们比较数据中的两个不同组。例如,我们可以考虑统计课程中男性相对于女性在课程中的表现。

下一步

形成双向表后,下一步可能是对数据进行统计分析。我们可能会问,研究中的变量是否相互独立。为了回答这个问题,我们可以在双向表上使用卡方检验。

年级和性别双向表

男性的 女的 全部的
A. 50 60 110
B 60 80 140
C 100 50 150
D 40 50 90
F 30 20 50
全部的 280 260 540

  • 发表于 2021-10-07 09:20
  • 阅读 ( 556 )
  • 分类:数学

你可能感兴趣的文章

标识符(identifier)和变量(variable)的区别

...性。有意义的标识符也使程序易于理解。 什么是变量(a variable)? 在编程中,需要存储数据。对存储的数据进行计算。这些数据应该存储在内存位置。变量是用来保存数据的容器或存储区域。为变量指定一个唯一的名称或标识符...

  • 发布于 2020-10-19 14:52
  • 阅读 ( 913 )

绝对的(categorical)和定量数据(quantitative data)的区别

...检查分类数据和定量数据之间的差异。 什么是分类数据(categorical data)? 定性变量衡量只能作为变量属性给出的属性。一个人的政治派别,一个人的国籍,一个人最喜欢的颜色,和一个病人的血型,只能用每个变量的定性属性来...

  • 发布于 2020-10-24 05:48
  • 阅读 ( 2341 )

导数(derivative)和有差别的(differential)的区别

...ents the change in the function with respect to changes in the independent variable or variables. In the usual notation, for a given function f of a single variable x, the total differential of order 1 df is given by, . This means that for an infinitesimal change in x(i.e. dx), there will be a  f (...

  • 发布于 2020-10-25 13:25
  • 阅读 ( 597 )

作用域如何影响powershell脚本

...。以下命令将显示哪些变量和别名具有AllScope属性: Get-Variable | Where-Object {$_.Opti*** -match 'AllScope'}
 Get-Alias | Where-Object {$_.Opti*** -match 'AllScope') 作用域 在我们第一次了解作用域时,我们将从PowerShell会话开始,其中变量$MyVar被...

  • 发布于 2021-04-11 03:54
  • 阅读 ( 250 )

如何让你的android手机告诉你在哪里丢的

...。这是高度基于一个任务的维基。 Emailer,步骤1–5: 1Variables–>变量集:%EMAIL\u USER to“EMAIL\u USER\u name”–此脚本设计用于Gmail,因此它可以是您自己的Gmail帐户,也可以是推荐的安卓。你姓什么@gmail.com”. 2Variables–>变量...

  • 发布于 2021-04-12 19:02
  • 阅读 ( 162 )

相关性(correlation)和回归(regression)的区别

...(correlation)? In statistics, we say there is a correlation between two variables if the two variables are related. If the relati***hip between the variables is a linear one, we can express the degree to which they are related using a number called Pearson’s correlation coefficient  .  takes...

  • 发布于 2021-06-27 11:05
  • 阅读 ( 905 )

地方的(local)和全局变量(global variable)的区别

... 全局变量、局部变量、内存位置 什么是局部变量(a local variable)? 函数或方法是执行特定任务的一组指令。局部变量是在函数中声明的变量。它只能在该特定函数中访问。同一程序的其他函数不能访问该变量。从其他函数中评...

  • 发布于 2021-07-01 00:27
  • 阅读 ( 1025 )

变量(variable)和sql中的参数(parameter in sql)的区别

...别的比较 关键术语 变量,参数,SQL 什么是sql中的变量(variable in sql)? SQL中的变量是一个对象,它可以保存一个特定类型的数据值。此外,可以使用它作为计数器来计算循环控制结构中的迭代次数。它还有助于保存数据值,以...

  • 发布于 2021-07-01 06:02
  • 阅读 ( 613 )

方差分析(anova)和无症状(anocva)的区别

...CVA包括范畴变量和区间变量。方差分析与方差分析比较表什么是方差分析(anova)?ANOVA代表“方差分析”。它是一种统计技术,用于分析给定的样本或具有一个或多个变量的数据。它用于观察样本中两个或三个以上变量的平均值之...

  • 发布于 2021-07-07 04:47
  • 阅读 ( 444 )

分类(classification)和制表(tabulation)的区别

...他们根据自己的特征和行为来排列数据按行和列排列它为什么存在?使分析数据的过程更加容易帮助表示数据将数据划分为不同的组和子组基于标题和副标题分类与制表对照表什么是分类(classification)?分类可以解释为根据数据...

  • 发布于 2021-07-07 04:50
  • 阅读 ( 543 )
pixmoli731
pixmoli731

0 篇文章

相关推荐