t检验是一种推断统计量,用于确定两组的均值是否存在显著差异,这可能与某些特征有关。它主要用于当数据集,如记录为100次抛硬币结果的数据集,将遵循正态分布,可能有未知的方差。t检验被用作假设检验工具,它允许检验适用于人群的假设。
t检验检查t统计量、t分布值和自由度以确定统计显著性。要用三种或三种以上的平均数进行检验,必须使用方差分析。
1:38
本质上,t检验允许我们比较两个数据集的平均值,并确定它们是否来自同一人群。在上面的例子中,如果我们从a班的学生和B班的学生中抽取一个样本,我们不会期望他们有完全相同的平均值和标准差。同样地,从安慰剂对照组和从药物处方组采集的样本应具有稍微不同的平均值和标准偏差。
在数学上,t检验从两组样本中抽取一个样本,并通过假设两个均值相等的零假设来建立问题陈述。根据适用的公式,计算某些值并与标准值进行比较,并相应地接受或拒绝假定的无效假设。
如果零假设符合被拒绝的条件,则表明数据读数很强,可能不是偶然的。t检验只是用于此目的的众多检验之一。统计学家还必须使用t检验以外的检验来检验更多的变量和更大样本量的检验。对于大样本,统计学家使用z检验。其他测试选项包括卡方检验和f检验。
t检验有三种类型,分为依赖性t检验和独立性t检验。
试想一下,一个药品**商想测试一种新发明的药品。它遵循的标准程序是在一组病人身上试验药物,然后给另一组病人(称为对照组)服用安慰剂。给予对照组的安慰剂是一种没有预期治疗价值的物质,并作为衡量给予实际药物的另一组如何反应的基准。
药物试验后,服用安慰剂的对照组成员报告平均预期寿命增加了3年,而服用新药的对照组成员报告平均预期寿命增加了4年。即时观察可能表明该药物确实有效,因为对使用该药物的人群效果更好。然而,观察结果也有可能是偶然发生的,特别是意外的运气。t检验有助于判断结果是否正确,是否适用于整个人群。
在一所学校,100名a班学生的平均得分为85%,标准差为3%。另外100名B班学生的平均得分为87%,标准差为4%。虽然B班的平均成绩好于A班,但如果得出B班学生的总体成绩好于A班的结论可能是不正确的。这是因为两个班的考试成绩都有自然的差异,所以这种差异可能仅仅是由于偶然性造成的。t检验有助于判断一个班级的表现是否比另一个好。
计算t检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异(称为平均差)、每组的标准差以及每组数据值的数量。
t检验的结果产生t值。然后将计算出的t值与从临界值表(称为t分布表)获得的值进行比较。这种比较有助于确定机会单独对差异的影响,以及差异是否超出了机会范围。t检验的问题是,两组之间的差异是否代表了研究中的真实差异,或者是否可能是无意义的随机差异。
T分布表有单尾和双尾两种格式。前者用于评估具有明确方向(正或负)的固定值或范围的案例。例如,当掷一对骰子时,输出值保持在-3以下或超过7的概率是多少?后者用于范围界限分析,例如询问坐标是否介于-2和+2之间。
可以使用支持必要统计功能的标准软件程序(如MS Excel中的程序)进行计算。
t检验产生两个值作为其输出:t值和自由度。t值是两个样本集的平均值之差与样本集内存在的变化之比。虽然分子值(两个样本集的平均值之差)的计算很简单,但分母(样本集中存在的变化)可能会变得有点复杂,这取决于所涉及的数据值的类型。比率的分母是对离散度或可变性的度量。t值越高,也称为t得分,表明两个样本集之间存在很大差异。t值越小,两个样本集之间的相似度越高。
自由度是指在一项研究中,可以自由改变的价值观,对于评估无效假设的重要性和有效性至关重要。这些值的计算通常取决于样本集中可用数据记录的数量。
当样本通常由相似单位的配对组成时,或当存在重复测量的情况时,进行相关t检验。例如,在接受特定治疗前后,可能会有相同的患者反复接受测试的情况。在这种情况下,每个患者都被用作对照样本。
此方法也适用于样本以某种方式相关或具有匹配特征的情况,例如涉及儿童、父母或兄弟姐妹的比较分析。相关或配对t检验属于依赖类型,因为这涉及两组样本相关的情况。
计算配对t检验的t值和自由度的公式为:
T=平均值1−平均2秒(差)(n)where:mean1 and mean2=每个样本集的平均值(diff)=成对数据值差异的标准偏差sn=样本大小(成对差异的数量)\begin{aligned}&;T=\frac{\textit{mean}1-\textit{mean}2}{\frac{s(\text{diff})}{\sqrt{(n)}}}}\\&\textbf{其中:}\\&\textit{mean}1\text{和}\textit{mean}2=\text{每个样本集的平均值}\\&;s(\text{diff})=\text{成对数据值差异的标准偏差}\\&;n=\text{样本大小(成对差异数)}\\&;n-1=\text{自由度}\end{对齐}T=(n)s(差异)平均值1−平均值2where:mean1 and mean2=每个样本集的平均值(diff)=成对数据值差异的标准偏差sn=样本大小(成对差异的数量)
其余两种属于独立t检验。这些类型的样本是独立选择的,即两组中的数据集引用的值不同。这些病例包括一组100名患者被分成两组,每组50名患者。其中一组成为对照组,给予安慰剂,另一组接受处方治疗。这构成了两个相互不配对的独立样本组。
当每组样本数相同,或两组数据的方差相似时,采用等方差t检验。以下公式用于计算等方差t检验的t值和自由度:
T值=平均值1−平均值2(n1−1)×var12+(n2−1)×var22n1+n2−2×1n1+1n2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差\begin{aligned}&\text{T-value}=\frac{mean1-mean2}{\frac{(n1-1)\times var1^2+(n2-1)\times var2^2}{n1+n2-2}\times\sqrt{\frac{1}{n1}+\frac{1}{n2}}}\\&\textbf{其中:}\\&;mean1\text{和}mean2=\text{每个的平均值}\\&\文本{样本集的}\\&;var1\text{和}var2=\text{每个样本集的方差}\\&;n1\text{和}n2=\text{每个样本集中的记录数}\end{对齐}T值=n1+n2−2(n1)−1)×var12+(n2−1)×瓦尔22×11号+21号平均值1−平均值2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差
而且,
自由度=n1+n2−2where:n1 and n2=每个样本集中的记录数\begin{aligned}&\text{自由度}=n1+n2-2\\&\textbf{其中:}\\&;n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}自由度=n1+n2−2where:n1 and n2=每个样本集中的记录数
当每组样本数不同,且两组数据的方差也不同时,采用不等方差t检验。这个测试也被称为韦尔奇的t-测试。以下公式用于计算不等方差t检验的t值和自由度:
T值=平均值1−平均2VAR12N1+var22n2where:mean1 and mean2=每个样本集var1和var2的平均值=每个样本集的方差n1和n2=每个样本集中的记录数\begin{aligned}&\text{T-value}=\frac{mean1-mean2}{\frac{var1^2}{n1}+\frac{var2^2}{n2}}\\&\textbf{其中:}\\&;mean1\text{和}mean2=\text{每个的平均值}\\&\文本{样本集的}\\&;var1\text{和}var2=\text{每个样本集的方差}\\&;n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}T值=n1var12+n2var22型平均值1−平均值2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差n1和n2=每个样本集中的记录数
而且,
自由度=(var12n1+var22n2)2(var12n1)2n1−1+(var22n2)2n2−1where:var1 and var2=每个样本集的方差n1和n2=每个样本集中的记录数\begin{aligned}&\text{Degrees of Freedom}=\frac{\left(\frac{var1^2}{n1}+\frac{var2^2}{n2}\ right)^2}{\frac{\left(\frac{var1^2}{n1}\ right)^2}{n1-1}+\frac{\left(\frac{var2^2}{n2}\ right)^2}{n2-1}\&\textbf{其中:}\\&;var1\text{和}var2=\text{每个样本集的方差}\\&;n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}自由度=n1−1(N12))2+氮气−1(N22VAR22))2(n1var12型+n2var22型)2where:var1 and var2=每个样本集的方差n1和n2=每个样本集中的记录数
以下流程图可用于根据样本集的特征确定应使用哪个t检验。要考虑的关键项目包括样本记录是否相似、每个样本集中的数据记录数以及每个样本集的方差。
假设我们对美术馆中收到的画进行对角线测量。一组样品包括10幅画,另一组包括20幅画。数据集及其相应的均值和方差值如下:
...您希望使用统计软件。这些工具是用来做计算的,比如t检验、卡方检验、相关性等等。Excel不是用来进行数据分析的。但这并不意味着你做不到。 ...
什么是t检验(a t-test)? t检验是一种推断统计量,用于确定两组的均值是否存在显著差异,这可能与某些特征有关。它主要用于当数据集,如记录为100次抛硬币结果的数据集,将遵循正态分布,可能有未知的方差。t检验被用作假...
t检验与方差分析 收集和计算统计数据以获得平均值往往是一个漫长而乏味的过程。t检验和单因素方差分析(ANOVA)是两种最常用的检验方法。 t检验是一种统计假设检验,如果零假设得到支持,检验统计量遵循学生的t分布。...
方差分析与T检验 T检验,有时称为学生T检验,当你想比较两组的平均数,看他们是否彼此不同时进行。它主要用于当一个随机分配是给定的,只有两个,不超过两个,集比较。在进行T检验时,需要满足一些条件,这样才能得...
配对与非配对检验 1908年,爱尔兰化学家威廉·西利·戈塞特发明了t统计量。当他在吉尼斯啤酒厂工作时,他用它来监控一种名为stout的黑啤酒的质量。他用笔名“Student”在Biometrika上发表了这篇文章。有几种类型的t检验,最常...
T检验和z检验是两个样本均值比较中假设检验的常用术语。值得注意的是,这两个检验都是假设检验的参数过程,因为它们都是在区间尺度上测量的变量。假设,是指经过进一步观察、调查和科学实验,可以接受或拒绝的猜想。...
...的类别和性质。Parameter of ComparisonANOVAANOCVA意义方差分析检验给定统计数据的方差。ANOCVA检查数据的协方差进行分析。协方差的使用方差分析不使用协方差。ANOCVA使用协方差。可靠的与ANOCVA相比不太可靠。与方差分析相比,方差...
T检验和线性回归是与推断统计有关的术语,推断统计是一种统计方法,它通过对一个群体进行一个小的但说明性的样本来帮助我们对该群体进行概括和预测。三种方法通常用于推断统计-置信区间,假设检验和回归分析。测试(tte...
在统计的世界里,计算、假设和结论占上风。在所有的检验和结果中,t检验和p值是两种最令人困惑的假设方法。而这两者是在同一个统计子集中发现的,并提供了进一步的假设度量,同时又是相互关联的。这两个测试不一样!...