抽样分布是从特定人群中抽取的大量样本中获得的统计数据的概率分布。给定总体的抽样分布是一个总体统计可能出现的一系列不同结果的频率分布。
在统计学中,总体是从中抽取统计样本的整个池。人口可以是指整个群体的人,物体,事件,医院访问,或测量。因此,一个群体可以说是由一个共同特征组合在一起的对象的集合观察。
许多由院士、统计学家、研究人员、营销人员、分析师等绘制和使用的数据实际上是样本,而不是总体。样本是总体的一个子集。例如,一位医学研究人员想将1995年至2005年期间在北美出生的所有婴儿的平均体重与同一时期在南美出生的婴儿的平均体重进行比较,却无法在合理的时间内得出10年期间发生的100多万次分娩的整个人口的数据。相反,他只会用每个大陆100个婴儿的体重来做结论。使用200名婴儿的体重作为样本,计算出的平均体重是样本的平均值。
现在假设医学研究人员不是从每一大洲的100个新生儿体重中抽取一个样本,而是从普通人群中重复随机抽取样本,并计算每个样本组的样本平均数。因此,在北美,他收集了美国、加拿大和墨西哥记录的100个新生儿体重的数据如下:来自美国部分医院的4个100个样本,来自加拿大的5个70个样本,以及来自墨西哥的3个150个记录,共有1200个新生儿体重分为12组。他还收集了来自南美洲12个国家的100个出生体重的样本数据。
每个样本都有自己的样本均值,样本均值的分布称为样本分布。
为每个样本集计算的平均权重是平均值的抽样分布。不仅仅是平均数可以从样本中计算出来。其他统计数据,如标准差、方差、比例和范围可以从样本数据中计算出来。标准差和方差衡量抽样分布的可变性。
总体中的观察数、样本中的观察数以及用于绘制样本集的程序决定了样本分布的可变性。抽样分布的标准差称为标准差。虽然抽样分布的平均数等于总体的平均数,但标准误差取决于总体的标准差、总体的大小和样本的大小。
了解每个样本集的平均值彼此之间以及总体平均值之间的分布情况,将表明样本平均值与总体平均值的接近程度。样本分布的标准误差随样本量的增加而减小。
一个总体或一组数字样本将具有正态分布。然而,由于抽样分布包含多组观测值,因此不一定具有钟形曲线形状。
按照我们的例子,北美和南美婴儿的人口平均体重呈正态分布,因为有些婴儿体重不足(低于平均值)或超重(高于平均值),大多数婴儿介于两者之间(接近平均值)。如果北美新生儿的平均体重是7磅,那么在北美记录的12组样本观察中,每个样本的平均体重也将接近7磅。
但是,如果将在1200个样本组中计算的每个平均值绘制成图表,则结果形状可能会导致均匀分布,但很难确定实际形状将是什么。研究人员从超过一百万个体重数字的人群中抽取的样本越多,图表就会越开始形成正态分布。
...品袋中食品的数量,5%的拒收率可能是合适的。 随机抽样 双尾检验也可以在公司的某些生产活动中实际使用,例如在特定工厂生产和包装糖果。如果生产设施指定每袋50个糖果作为其目标,可接受的分配范围为45至55个糖果,...
...,很可能只由股票收益的一小部分组成,这将使分析受到抽样误差的影响。通过增加样本量,这种误差可以大大减小。 关键要点 概率分布描述了给定数据生成过程中可能值的预期结果。 概率分布有许多形状,具有不同的特...
...数据集的某些参数,这就是正态分布的联系所在。 根据抽样分布的标准统计假设,“对于任意样本量n,X的抽样分布̅ 如果抽取样本的总体X是正态分布的,则为正态分布。”因此,所有其他可能样本的概率意味着人们可以选择...
...组参与者的平均值。假设检验与t检验我们可以画出t值的抽样分布(学生t分布)-这显示了如果零假设为真,每个t值的可能性分布将受到样本大小的影响(或者更准确地说,受自由度的影响)我们评估在给定t分布的情况下获得t...
...少一个平均数的差异。 单因素方差分析基于以下假设: 抽样人群的正态分布。 因变量的测量是在区间或比率水平。 一个自变量中两个或两个以上的绝对独立群。 样品的独立性 总体方差的同质性。 双向方差分析的定义 双向...
抽样是指选择一个特定的群体或样本来代表整个群体。抽样方法主要分为概率抽样和非概率抽样两类。在第一种情况下,每个成员都有一个固定的、已知的属于样本的机会,而在第二种情况下,没有一个个体成为样本一部分的特...
...因为它包含了理想度量的所有特征,但它有一个缺点,即抽样波动会影响平均值。 同理,中位数的定义也很明确,也很容易理解和计算,这个指标最好的地方是不受抽样波动的影响,但中位数的唯一缺点是它不是基于所有的观...
...有五个观察值。只有在有分类值的情况下才能进行测试。抽样方法应简单随机。公式z=(x-μ)/(σ/√n) 式中,x=样本平均值。μ=总体平均值。σ/√n=标准偏差。Χ2=∑(O)− E) 2/E式中,O=每个观察(实际)值E=每个预期值使用...
...人口,并用于对该人口进行推断。社会学家通常使用两种抽样技术:基于概率的抽样技术和不基于概率的抽样技术。他们可以使用这两种技术生成不同种类的样本。 非概率抽样技术 非概率模型是一种技术,在这种技术中,...
...品被认为是相互独立的。 中心极限定理涉及样本均值的抽样分布。我们可以询问抽样分布的总体形状。中心极限定理说,这种抽样分布近似正态,通常称为钟形曲线。当我们增加用于产生采样分布的简单随机样本的大小时,这...