t检验

t检验是一种推断统计量，用于确定两组的均值是否存在显著差异，这可能与某些特征有关。它主要用于当数据集，如记录为100次抛硬币结果的数据集，将遵循正态分布，可能有未知的方差。t检验被用作假设检验工具，它允许检验适用于人群的假设。...

什么是t检验(a t-test)？

t检验是一种推断统计量，用于确定两组的均值是否存在显著差异，这可能与某些特征有关。它主要用于当数据集，如记录为100次抛硬币结果的数据集，将遵循正态分布，可能有未知的方差。t检验被用作假设检验工具，它允许检验适用于人群的假设。

t检验检查t统计量、t分布值和自由度以确定统计显著性。要用三种或三种以上的平均数进行检验，必须使用方差分析。

关键要点

t检验是一种推断统计量，用于确定两组的均值是否存在显著差异，这可能与某些特征有关。
t检验是许多用于研究目的的检验之一
计算t检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异（称为平均差）、每组的标准差以及每组数据值的数量。
根据所需的数据和分析类型，可以进行几种不同类型的t检验。

1:38

T检验

解释t检验

本质上，t检验允许我们比较两个数据集的平均值，并确定它们是否来自同一人群。在上面的例子中，如果我们从a班的学生和B班的学生中抽取一个样本，我们不会期望他们有完全相同的平均值和标准差。同样地，从安慰剂对照组和从药物处方组采集的样本应具有稍微不同的平均值和标准偏差。

在数学上，t检验从两组样本中抽取一个样本，并通过假设两个均值相等的零假设来建立问题陈述。根据适用的公式，计算某些值并与标准值进行比较，并相应地接受或拒绝假定的无效假设。

如果零假设符合被拒绝的条件，则表明数据读数很强，可能不是偶然的。t检验只是用于此目的的众多检验之一。统计学家还必须使用t检验以外的检验来检验更多的变量和更大样本量的检验。对于大样本，统计学家使用z检验。其他测试选项包括卡方检验和f检验。

t检验有三种类型，分为依赖性t检验和独立性t检验。

测试结果不明确

试想一下，一个药品**商想测试一种新发明的药品。它遵循的标准程序是在一组病人身上试验药物，然后给另一组病人（称为对照组）服用安慰剂。给予对照组的安慰剂是一种没有预期治疗价值的物质，并作为衡量给予实际药物的另一组如何反应的基准。

药物试验后，服用安慰剂的对照组成员报告平均预期寿命增加了3年，而服用新药的对照组成员报告平均预期寿命增加了4年。即时观察可能表明该药物确实有效，因为对使用该药物的人群效果更好。然而，观察结果也有可能是偶然发生的，特别是意外的运气。t检验有助于判断结果是否正确，是否适用于整个人群。

在一所学校，100名a班学生的平均得分为85%，标准差为3%。另外100名B班学生的平均得分为87%，标准差为4%。虽然B班的平均成绩好于A班，但如果得出B班学生的总体成绩好于A班的结论可能是不正确的。这是因为两个班的考试成绩都有自然的差异，所以这种差异可能仅仅是由于偶然性造成的。t检验有助于判断一个班级的表现是否比另一个好。

t检验假设

关于t检验的第一个假设涉及测量范围。t检验的假设是，应用于所收集数据的测量量表遵循连续或顺序量表，例如智商测试的分数。
第二个假设是简单的随机样本，即数据是从总人口中有代表性的随机选择部分收集的。
第三个假设是，当绘制数据时，结果是正态分布，钟形分布曲线。
最后的假设是方差的均匀性。当样本的标准差近似相等时，存在均匀或相等的方差。

计算t检验

计算t检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异（称为平均差）、每组的标准差以及每组数据值的数量。

t检验的结果产生t值。然后将计算出的t值与从临界值表（称为t分布表）获得的值进行比较。这种比较有助于确定机会单独对差异的影响，以及差异是否超出了机会范围。t检验的问题是，两组之间的差异是否代表了研究中的真实差异，或者是否可能是无意义的随机差异。

t分布表

T分布表有单尾和双尾两种格式。前者用于评估具有明确方向（正或负）的固定值或范围的案例。例如，当掷一对骰子时，输出值保持在-3以下或超过7的概率是多少？后者用于范围界限分析，例如询问坐标是否介于-2和+2之间。

可以使用支持必要统计功能的标准软件程序（如MS Excel中的程序）进行计算。

t值和自由度

t检验产生两个值作为其输出：t值和自由度。t值是两个样本集的平均值之差与样本集内存在的变化之比。虽然分子值（两个样本集的平均值之差）的计算很简单，但分母（样本集中存在的变化）可能会变得有点复杂，这取决于所涉及的数据值的类型。比率的分母是对离散度或可变性的度量。t值越高，也称为t得分，表明两个样本集之间存在很大差异。t值越小，两个样本集之间的相似度越高。

一个大的t分数表明，这两组是不同的。
一个小的t分数表示这些组是相似的。

自由度是指在一项研究中，可以自由改变的价值观，对于评估无效假设的重要性和有效性至关重要。这些值的计算通常取决于样本集中可用数据记录的数量。

等方差（或混合）t检验

当每组样本数相同，或两组数据的方差相似时，采用等方差t检验。以下公式用于计算等方差t检验的t值和自由度：

T值=平均值1−平均值2（n1−1)×var12+（n2−1)×var22n1+n2−2×1n1+1n2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{（n1-1）\times var1^2+（n2-1）\times var2^2}{n1+n2-2}\times\sqrt{\frac{1}{n1}+\frac{1}{n2}}}\\&amp\textbf{其中：}\\&amp；mean1\text{和}mean2=\text{每个的平均值}\\&amp\文本{样本集的}\\&amp；var1\text{和}var2=\text{每个样本集的方差}\\&amp；n1\text{和}n2=\text{每个样本集中的记录数}\end{对齐}T值=n1+n2−2（n1）−1)×var12+（n2−1)×瓦尔22×11号+21号平均值1−平均值2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差

而且，

自由度=n1+n2−2where:n1 and n2=每个样本集中的记录数\begin{aligned}&amp\text{自由度}=n1+n2-2\\&amp\textbf{其中：}\\&amp；n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}自由度=n1+n2−2where:n1 and n2=每个样本集中的记录数

不等方差t检验

当每组样本数不同，且两组数据的方差也不同时，采用不等方差t检验。这个测试也被称为韦尔奇的t-测试。以下公式用于计算不等方差t检验的t值和自由度：

T值=平均值1−平均2VAR12N1+var22n2where:mean1 and mean2=每个样本集var1和var2的平均值=每个样本集的方差n1和n2=每个样本集中的记录数\begin{aligned}&amp\text{T-value}=\frac{mean1-mean2}{\frac{var1^2}{n1}+\frac{var2^2}{n2}}\\&amp\textbf{其中：}\\&amp；mean1\text{和}mean2=\text{每个的平均值}\\&amp\文本{样本集的}\\&amp；var1\text{和}var2=\text{每个样本集的方差}\\&amp；n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}T值=n1var12+n2var22型平均值1−平均值2where:mean1 and mean2=每个样本集的平均值var1和var2=每个样本集的方差n1和n2=每个样本集中的记录数

而且，

自由度=（var12n1+var22n2）2（var12n1）2n1−1+（var22n2）2n2−1where:var1 and var2=每个样本集的方差n1和n2=每个样本集中的记录数\begin{aligned}&amp\text{Degrees of Freedom}=\frac{\left（\frac{var1^2}{n1}+\frac{var2^2}{n2}\ right）^2}{\frac{\left（\frac{var1^2}{n1}\ right）^2}{n1-1}+\frac{\left（\frac{var2^2}{n2}\ right）^2}{n2-1}\&amp\textbf{其中：}\\&amp；var1\text{和}var2=\text{每个样本集的方差}\\&amp；n1\text{和}n2=\text{每个样本集中的记录数}\\\结束{对齐}自由度=n1−1（N12）)2+氮气−1（N22VAR22）)2(n1var12型+n2var22型)2where:var1 and var2=每个样本集的方差n1和n2=每个样本集中的记录数