暂无介绍
数据集的一个重要特征是确定它是否包含任何异常值。异常值在我们的数据集中被直观地认为是与大多数其他数据有很大差异的值。当然,对异常值的这种理解是不明确的。要被视为异常值,该值与其余数据的偏差应该有多大?一位研究人员所说的离群值会与另一位研究人员的离群值相匹配吗?为了给异常值的确定提供一些一致性和定量度量,我们使用了内部和外部围栏。...
当考虑标准偏差时,可能会令人惊讶的是,实际上有两个可以考虑。存在总体标准偏差和样本标准偏差。我们将区分这两个方面,并强调它们的区别。...
统计学有两个分支,描述统计学和推理统计学。在这两个主要分支中,统计抽样主要涉及推断统计。这类统计背后的基本思想是从统计样本开始。在我们有了这个样本之后,我们试着说一些关于人口的事情。我们很快意识到抽样方法的重要性。...
卡方拟合优度检验是更一般的卡方检验的一种变体。此测试的设置是单个类别变量,可以有多个级别。通常在这种情况下,我们会考虑一个分类变量的理论模型。通过这个模型,我们预计一定比例的人口会下降到这些水平。拟合优度测试决定了我们理论模型中的预期比例与现实的匹配程度。...
以图形方式表示数据的最常用方法之一是饼图。它的名字来源于它的外形:一个被切成几片的圆形馅饼。这种图形在绘制定性数据时非常有用,因为定性数据中的信息描述的是特征或属性,而不是数字。每个特征对应于饼的不同部分。通过查看所有饼图,您可以比较每个类别中适合的数据量。一个类别越大,它的饼图就越大。...
有时数字数据成对出现。也许有一位古生物学家测量了同一恐龙物种的五块化石中股骨(腿骨)和肱骨(肱骨)的长度。从臂长的角度考虑手臂长度可能是有意义的,并且计算诸如平均值或标准偏差之类的东西。但是,如果研究人员好奇地想知道这两个测量值之间是否有关系呢?仅仅看手臂和腿是不够的。相反,古生物学家应该对每个骨骼的骨骼长度进行配对,并使用一个称为相关性的统计区域。...
假设检验是统计学的核心话题。这项技术属于一个被称为推断统计的领域。来自各种不同领域的研究人员,如心理学、营销学和医学,对正在研究的人群提出假设或主张。研究的最终目标是确定这些主张的有效性。精心设计的统计实验从人群中获取样本数据。这些数据反过来又被用来检验关于人口的假设的准确性。...