假设我们有一个来自感兴趣人群的随机样本。我们可能有一个关于人口分布方式的理论模型。但是,可能有几个总体参数的值我们不知道。最大似然估计是确定这些未知参数的一种方法。
最大似然估计的基本思想是确定这些未知参数的值。我们这样做是为了最大化相关联的联合概率密度函数或概率质量函数。我们将在下文中更详细地了解这一点。然后我们将计算一些最大似然估计的例子。
上述讨论可通过以下步骤进行总结:
假设我们有一包种子,每个种子都有一个恒定的成功发芽概率p。我们种植其中的n株,并计算发芽的数量。假设每个种子独立于其他种子发芽。我们如何确定参数p的最大似然估计?
我们首先注意到,每个种子都是由伯努利分布建模的,p。设X为0或1,单个种子的概率质量函数为f(X;p)=px(1-p)1-X。
我们的样本由n个不同的席,每个都有伯努利分布。发芽的种子有席=1,不发芽的种子有席=0。
似然函数由下式给出:
L(p)=pXi(1—p)1—席席
我们看到,利用指数定律重写似然函数是可能的。
L(p)=p(1)p(n)-席席
接下来,我们区分这个函数与p的关系。我们假设所有的席的值都是已知的,因此是常数。为了区分似然函数,我们需要使用乘积规则和幂律:
席夫席(席)1+Xi(1- p)n-席-(n-(x))p席西(1—p)n-1—x
我们重写了一些负指数,并得出:
席夫席席(XP)=(1/p),XIP(X-P)Xi(1 -p)n-εX- 1/(1 -p)(n-席Xi)p席西(1 -P)n-西
=(1/p)席席1/(1—P)(n-Ⅱ席)] IP席西(1—P)n -西
现在,为了继续最大化过程,我们将此导数设为零,然后求解p:
0=[(1/p)席席1/(1-p)(n-x席)] ip席西(1—P)n -西
因为p和(1-p)是非零的,所以我们有
0=(1/p),席- 1/(1-p)(n-x席)。
将方程的两边乘以p(1-p)得到:
0=(1—p)席-P(n-x席)。
我们展开右侧,看到:
0=席席P席席-P n+p=Xi=Xi-P n。
因此,Xi=P n和(1/N)席席胡=P。这意味着p的最大似然估计是一个样本均值。更具体地说,这是发芽种子的样本比例。这完全符合直觉告诉我们的。为了确定种子发芽的比例,首先考虑来自感兴趣群体的样本。
以上步骤列表有一些修改。例如,如上所述,通常值得花一些时间使用一些代数来简化似然函数的表达式。这样做的原因是为了便于进行区分。
对上述步骤列表的另一个改变是考虑自然对数。函数L的最大值将出现在与L的自然对数相同的点上。因此,最大化ln L相当于最大化函数L。
很多时候,由于L中存在指数函数,取L的自然对数将大大简化我们的一些工作。
我们通过回顾上面的例子来了解如何使用自然对数。我们从似然函数开始:
L(p)=P(席)席(1—P)N-XI。
然后我们使用对数定律,看到:
R(p)=Ln L(p)=Xi-Ln P+(n-席席)Ln(1 -p)。
我们已经看到,导数更容易计算:
R′(p)=(1/p)席席1/(1—p)(n-εXi)。
现在,和以前一样,我们将这个导数设为零,然后将两边乘以p(1-p):
0=(1—p)席-P(n-x席)。
我们求解p,得到和以前相同的结果。
使用L(p)的自然对数在另一方面是有帮助的。计算R(p)的二阶导数更容易,以验证我们确实在点(1/n)席席=P上有最大值。
例如,假设我们有一个随机样本X1,X2。Xn来自我们用指数分布建模的种群。一个随机变量的概率密度函数的形式为f(x)=θ-1e-x/θ
似然函数由联合概率密度函数给出。这是几个密度函数的乘积:
L(θ)=∏θ-1e-xi/θ=θ-ne-∑xi/θ
再次,考虑似然函数的自然对数是有帮助的。区分这一点比区分似然函数需要更少的工作:
R(θ)=lnl(θ)=ln[θ-ne-∑xi/θ]
我们使用对数定律得出:
R(θ)=lnl(θ)=-n lnθ+∑xi/θ
我们根据θ进行区分,并得出:
R'(θ)=-n/θ+∑xi/θ2
将此导数设为零,我们可以看到:
0=-n/θ+∑xi/θ2。
将两边乘以θ2,结果为:
0=-n个th++席。
现在使用代数求解θ:
(= 1/n)席。
从中我们可以看出,样本均值是使似然函数最大化的。适合我们模型的参数θ应该是我们所有观测值的平均值。
连接
还有其他类型的估计量。另一种类型的估计称为无偏估计。对于这种类型,我们必须计算统计数据的期望值,并确定它是否与相应的参数匹配。
最大简约和最大似然之间的关键区别取决于建立系统发育树的方法。最大简约法侧重于在构建系统进化树的过程中最小化总体特征状态,而最大似然法是根据遗传数据之间的似然关系绘制系统发生树的一种统计方法。 系统发...
...vs概率 可能性和概率之间的区别似乎很难理解。这是因为似然和概率这两个词经常被混淆为具有相同含义的外延词。严格地说,它们是两个不同的词,具有两种不同的含义。“可能性”一词指的是可能性。另一方面,概率一词指...
...人士发现的一项新的专利申请。它描述了苹果公司一直在探索一种技术,这种技术可以让它的设备在用户说话的时候估计出用户离他们有多远,并有可能据此采取行动。 ...
大多数应对气候变化的努力都集中在减少碳排放或试图消除碳排放上,但许多气候科学家认为,我们可能已经过了不归路的地步。这就是诺亚·戴奇想从空气中提取碳的原因。 “我们不仅可以停止**混乱,我们还...
...这里最大的变化是TomTom增加了GPS跟踪和一些强大的“路线探索”模式。第一个是一个“backtostart”或breadcrumb特性,它允许您设置一个始终可以导航回的起点。如果你正在探索新的道路或者去一个你不熟悉的城市跑步,这类事情可...
...们可以用(m)代替(m-1)。这将“无偏估计”替换为“最大似然估计”。 这就简化了上述公式: 方差=σn2=1米∑i=1毫米−i2\begin{aligned}\text{variance}=\sigma^2\u n=\frac{1}{m}\sum^m{i=1}u^2{n-i}\end{aligned}方差=σ氮气=m1级i=1∑米联...
...于该样本的成员都没有机会被选中。 研究 结论性研究 探索性研究 方** 这类研究所采用的方法具有物理性质,因此以统计学为基础。 用于研究的方法具有主观性质,因此基于分析。 结果 所获得的结果大多是结论性的,因...
.../10.1086/674121。 海恩斯,艾米R.“《全面战争与美国内战:探索“全面战争”标签对1861-1865年冲突的适用性》,《加州大学学院本科生研究期刊》。第3.2卷(2010年):12-24页。
奥林巴斯火山:火星火山作用 太阳系中已知最大的火山实际上位于火星上。它的名字叫“奥林匹斯山”,高出地球表面约27公里。这座巨山是一座盾状火山。如果它存在于地球上,它将矗立在珠穆朗玛峰(我们星球上最...
...:保护资源办公室。蓝鲸 位于朗海洋实验室的西摩海洋探索中心。Blue女士的测量结果。 蓝鲸(B.肌肉)。海洋哺乳动物学会。