暂无介绍
离群值是与一组数据中的大多数数据差异很大的数据值。这些值不在数据中呈现的总体趋势范围内。仔细检查一组数据以查找异常值会带来一些困难。虽然很容易看出(可能是通过使用stemplot)某些值与其余数据不同,但要将该值视为异常值,其差异有多大?我们将研究一种特定的测量方法,它将为我们提供一个客观的标准,来衡量什么是异常值。...
统计学领域分为两大类:描述性和推理性。每个部分都很重要,提供了实现不同目标的不同技术。描述性统计描述人口或数据集中正在发生的事情。相比之下,推断统计允许科学家从样本组中获取发现,并将其推广到更大的人群中。这两种统计数据有一些重要的区别。...
在看散点图时,有很多问题要问。最常见的问题之一是想知道直线与数据的近似程度。为了帮助回答这个问题,有一个描述性统计称为相关系数。我们将看到如何计算这个统计数据。...
散点图是一种用于表示成对数据的图形。解释变量沿水平轴绘制,响应变量沿垂直轴绘制。使用这种类型的图形的一个原因是寻找变量之间的关系。...
当我们测量一组数据的可变性时,有两个与此相关的密切相关的统计数据:方差和标准偏差,这两个数据都表明了数据值的分布情况,并且在计算中涉及到类似的步骤。然而,这两种统计分析之间的主要区别在于标准差是方差的平方根。...
有些数据分布,如钟形曲线或正态分布,是对称的。这意味着分布的右侧和左侧是彼此的完美镜像。并非每个数据分布都是对称的。非对称的数据集称为非对称数据集。衡量分布不对称程度的指标称为偏度。...
线性回归是一种统计工具,用于确定一条直线与一组成对数据的拟合程度。最适合该数据的直线称为最小二乘回归线。这条线有多种用途。这些用途之一是针对解释变量的给定值估计响应变量的值。与此相关的是一个残差。...
四分位数范围(IQR)是第一个四分位数和第三个四分位数之间的差值。计算公式如下:...
你可能想考虑的一个特征是时间。识别这种顺序并显示变量值随时间变化的图形称为时间序列图。...
直方图是统计中使用的一种图形。这种图形使用垂直条显示定量数据。条形图的高度表示数据集中数值的频率或相对频率。...
四分位范围规则在检测异常值时很有用。异常值是数据集整体模式之外的单个值。这个定义有些模糊和主观,因此在确定数据点是否真的是异常值时,有一个规则可以应用是很有帮助的,这就是四分位范围规则的作用。...
在统计学中,百分位数用于理解和解释数据。一组数据的第n个百分位是数据的n%低于它的值。在日常生活中,百分位数用于理解测试分数、健康指标和其他测量值。例如,一名身高6.5英尺的18岁男性的身高排在第99位。这意味着在所有18岁的男性中,99%的人身高等于或小于6.5英尺。另一方面,一个只有5.5英尺高的18岁男性的身高排在第16位,这意味着只有16%的同龄男性身高相同或更短。...
数理统计中的矩涉及基本计算。这些计算可用于找到概率分布的均值、方差和偏度。...
最小值是数据集中的最小值。最大值是数据集中的最大值。了解更多关于这些统计数据如何不那么琐碎的信息。...
统计学的目标之一是以有意义的方式排列数据。双向表是组织特定类型成对数据的重要方式。与统计学中任何图形或表格的构造一样,了解我们正在处理的变量类型非常重要。如果我们有定量数据,那么应该使用直方图或茎叶图等图形。如果我们有分类数据,那么条形图或饼图是合适的。...