暂无介绍
当统计学家错误地拒绝无效假设或无效陈述时,当无效假设为真时,统计中出现I类错误;当统计学家未能拒绝无效假设和替代假设时,出现II类错误,或者正在进行测试以提供证据支持的陈述是真实的。...
在处理集合论时,有许多操作可以从旧集合中生成新集合。最常见的集合操作之一称为交集。简单地说,两个集合A和B的交集是A和B共有的所有元素的集合。...
给定一系列数据,我们可能想知道的一个问题是,这些序列是偶然现象还是数据不是随机的。随机性很难识别,因为很难简单地查看数据并确定它是否仅仅是偶然产生的。一种可以用来帮助确定序列是否真的是偶然发生的方法称为运行测试。...
数理统计使用各种数学分支的技术来明确证明有关统计的陈述是正确的。我们将看到如何使用微积分来确定卡方分布的最大值(对应于其模式)的上述值,以及找到分布的拐点。...
统计抽样可以通过多种不同的方式进行。除了我们使用的抽样方法外,还有一个问题与我们随机选择的个体具体发生了什么有关。取样时出现的问题是,“在我们选择一个个体并记录我们正在研究的属性的测量值之后,我们如何处理这个个体?”...
如果你让某人说出他或她最喜欢的数学常数,你可能会得到一些古怪的表情。过了一段时间,有人可能会自告奋勇地说,最好的常数是π。但这并不是唯一重要的数学常数。紧随其后的第二个,如果不是最普遍常数王冠的竞争者,就是e。这个数字出现在微积分、数论、概率论和统计学中。我们将研究这个显著数字的一些特征,看看它与统计和概率有什么联系。...
假设我们有一个来自感兴趣人群的随机样本。我们可能有一个关于人口分布方式的理论模型。但是,可能有几个总体参数的值我们不知道。最大似然估计是确定这些未知参数的一种方法。...
外推法和内插法均用于根据其他观测值估算变量的假设值。根据数据中观察到的总体趋势,有多种插值和外推方法。这两种方法的名称非常相似。我们将检查它们之间的差异。...
在开始理解统计学之前,您需要了解均值、中位数和模式。如果没有这三种计算方法,就不可能解释我们日常生活中使用的许多数据。每一个都用于在一组数字中找到统计中点,但它们的作用都不同。...
假设检验的统计实践不仅在统计学中广泛存在,而且在整个自然科学和社会科学中也广泛存在。当我们进行假设检验时,可能会出现一些问题。有两种错误是设计上无法避免的,我们必须意识到这些错误的存在。这些错误被称为I型和II型错误。什么是I型和II型错误,我们如何区分它们?简要地:...
数据的正态分布是指大多数数据点相对相似,这意味着它们出现在一个较小的值范围内,在数据范围的高端和低端具有较少的异常值。...
置信区间是定量社会学研究中常用的一种估计方法。这是一个估计值范围,可能包括正在计算的总体参数。例如,我们可以说平均年龄在23到28岁之间,而不是将某一人群的平均年龄估计为25.5岁这样的单一值。这个置信区间包含我们正在估计的单个值,但它为我们提供了一个更大的正确范围。...
一个关于概率分布的自然问题是,“它的中心是什么?”期望值就是这样一个概率分布中心的度量。因为它测量的是平均数,所以毫不奇怪这个公式是从平均数公式推导出来的。...
研究概率的一种流行方法是掷骰子。标准模具有六个面,上面印有编号为1、2、3、4、5和6的小点。如果死亡是公平的(我们假设所有的死亡都是公平的),那么每一个结果都是同样可能的。由于有六种可能的结果,因此获得模具任意一侧的概率为1/6。滚动A1的概率是1/6,滚动A2的概率是1/6,依此类推。但是如果我们再加一个骰子会怎么样?掷两个骰子的概率是多少?...
自举是一种统计技术,属于更广泛的重采样范畴。这项技术涉及一个相对简单的过程,但重复次数太多,严重依赖于计算机计算。Bootstrapping提供了一种非置信区间的方法来估计总体参数。自举似乎非常神奇。继续读下去,看看它是如何得到它有趣的名字的。...