钟形曲线显示了整个统计数据。不同的测量方法,如种子的直径、鱼鳍的长度、SAT上的分数以及一令纸的单张重量,都是如此绘制钟形曲线时形成钟形曲线。所有这些曲线的一般形状都是相同的。但所有这些曲线都不同,因为它们中的任何一条都不太可能具有相同的平均值或标准偏差。标准偏差较大的钟形曲线较宽,标准偏差较小的钟形曲线较薄。平均值较大的钟形曲线比平均值较小的钟形曲线向右移动更多。
为了让这更具体一点,让我们假设我们测量了500粒玉米的直径。然后,我们记录、分析和绘制这些数据。结果表明,该数据集呈钟形曲线,平均值为1.2cm,标准偏差为0.4cm。现在假设我们对500颗豆子做同样的事情,我们发现它们的平均直径为.8厘米,标准偏差为.04厘米。
上面绘制了这两个数据集的钟形曲线。红色曲线对应于玉米数据,绿色曲线对应于大豆数据。正如我们所看到的,这两条曲线的中心和分布是不同的。
这显然是两条不同的钟形曲线。它们是不同的,因为它们的平均值和标准偏差不匹配。因为我们遇到的任何有趣的数据集都可以有任何正数作为标准差,任何数字作为平均值,我们实际上只是在描绘无限多条钟形曲线的表面。这是一个很大的曲线和太多的处理。解决办法是什么?
数学的一个目标是尽可能地概括事物。有时几个单独的问题是单个问题的特例。这种涉及钟形曲线的情况就是一个很好的例子。我们可以将所有钟形曲线关联到一条曲线,而不是处理无限多条钟形曲线。这种特殊的钟形曲线称为标准钟形曲线或标准正态分布。
标准钟形曲线的平均值为零,标准偏差为1。通过直接计算,可将任何其他钟形曲线与本标准进行比较。
任何钟形曲线的所有性质都适用于标准正态分布。
在这一点上,我们可能会问,“为什么要用标准钟形曲线呢?”这似乎是一个不必要的复杂问题,但随着我们继续统计,标准钟形曲线将是有益的。
我们会发现,统计中的一类问题要求我们找到我们遇到的任何钟形曲线部分下面的区域。钟形曲线对于区域来说不是一个很好的形状。它不像矩形或直角三角形那样有简单的面积公式。寻找钟形曲线部分的面积可能很棘手,事实上非常困难,我们需要使用一些微积分。如果我们不标准化我们的钟形曲线,每次我们想要找到一个区域时,我们都需要做一些微积分。如果我们将曲线标准化,那么计算面积的所有工作都已为我们完成。
...气压力,因此形成了液体蒸汽的气泡。 什么是标准沸点(standard boiling point)? 标准沸点是液体在1巴的沸点。而且,我们认为这是IUPAC定义沸点(1982年以来)的温度。例如,标准沸点为99.61°C,在1巴。 正常沸点(normal boiling point)和...
二项分布与正态分布 随机变量的概率分布在统计学中占有重要地位。在这些概率分布中,二项分布和正态分布是现实生活中最常见的两种。 什么是二项分布? 二项式分布是与随机变量X相对应的概率分布,它是一系列独立的...
...相互镜像的两面。 在图形形式中,对称分布可能表现为正态分布(即钟形曲线)。对称分布是技术交易中的一个核心概念,因为假定资产的价格行为随时间的变化符合对称分布曲线。 对称分布可以与非对称分布形成对比,非...
什么是正态分布(the normal distribution)? 正态分布公式基于两个简单的参数均值和标准差,它们量化了给定数据集的特征。 平均值表示整个数据集的“中心”值或平均值,而标准差表示该平均值周围数据点的“分布”或变化。 ...
...高。这将使生产效率降到最低。 什么是分布式数据库(a distributed database)? A distributed database contains two or more database files located at different locati*** in the network. In other words, the database is split into multiple files. The users can access the nearest data...
...人员利用标准时间和正常时间进行工作测量。标准时间(standard time) vs. 正常时间(normal time)标准时间和正常时间的区别在于,正常时间是指工作应该毫不拖延地完成的时间。标准时间是指工人在不可避免的延误下完成工作所花费的...
随机变量分布的方差是一个重要特征。这个数字表示分布的扩展,它是通过标准偏差的平方来发现的。一种常用的离散分布是泊松分布。我们将了解如何使用参数λ计算泊松分布的方差。 泊松分布 当我们有一个某种连续统...
统计抽样在统计学中经常使用。在这个过程中,我们的目标是确定某个群体的某些方面。由于总体规模通常较大,我们通过选择具有预定规模的总体子集来形成统计样本。通过研究样本,我们可以使用推断统计来确定有关人口...
...会像我们可能的那样精确。 中库尔特语 峰度通常根据正态分布进行测量。尾巴形状与任何正态分布(而不仅仅是标准正态分布)大致相同的分布被称为中库尔德分布。中库尔特分布的峰度既不高也不低,而是被认为是其他两...
数据的正态分布是指大多数数据点相对相似,这意味着它们出现在一个较小的值范围内,在数据范围的高端和低端具有较少的异常值。 当数据呈正态分布时,将其绘制在图形上会产生钟形对称图像,通常称为钟形曲线。在这...