Jesse Yule's Blog

维特比算法

之前提到HMM有三类问题，这里主要针对第二类问题：根据观测序列分析隐藏状态序列，算法主要是维特比算法。

比如还是以hmm中的天气和活动作为例子，现在我们观察到一系列活动，需要分析每个活动对应的天气，这时候，每个活动都对应着三种可能的天气，假设观测序列长度为n，那么天气状态序列就有3^n种可能性，我们就需要从中找出答案。

这类问题可以认为是最优路径问题，最简单的方法就是穷举法，把所有可能都计算一遍，看看谁最优，可是这样就要计算3^n次，明显不现实，另一方面也可以采取贪心算法，每次只选择最优的路径，也就是每次都选择活动对应概率最大的天气，虽然效果更好但是往往还是和真实情况有所不同，所以就有了beam search，每次只选择最好的前n条路径。

beam search和贪心算法的区别，一个是前n个最优一个是当前最优，举个例子，现在我们通过贪心算法，分析出第一个状态是雨天，对应的概率是0.6，第二个概率是0.5，那么这段序列发生的概率就是0.3，如果我们采用维特比算法，同时分析两个状态，可能发现第一个状态选择晴天（0.5），第二个选择晴天（0.7），得到的结果比贪心算法更优，主要的原因就是贪心算法只考虑当前最优而舍弃了其他可能性，没办法从整体上进行考虑，当然贪心算法的计算效率是非常好的。而beam search随着beam width（前n条路径的n）变大，计算复杂度也会变大，而beam width小了分析得到的模型又可能出问题，所以这个算法也并不是完美的。

最后就是这次要重点介绍的维特比算法，它的思路是从开始状态后的每一步，都记录下到该状态的所有路径的概率最大值，以此作为基准继续向后推进，这样说还是比较抽象，还是结合例子说明，比如现在有三个盒子装了红球白球，观测的是球的颜色，状态集合是盒子的号码：

$$V = {red, white}$$

$$Q = {box_1, box_2, box_3}$$

初始状态分布：

$$\prod = (0.2, 0.4, 0.4)^T$$

状态转移概率：

$$ \begin{matrix} 0.5 & 0.2 & 0.3 \\ 0.3 & 0.5 & 0.2 \\ 0.2 & 0.3 & 0.5 \\ \end{matrix} $$

观测状态概率分布矩阵为：

$$ \begin{matrix} 0.5 & 0.5 \\ 0.4 & 0.6 \\ 0.7 & 0.3 \\ \end{matrix} $$

观测序列为：

$$O = {red, white, white}$$

首先我们需要计算第一个时刻三个隐藏状态各自的概率：

$$\delta_1(1) = \pi_1 b_1(o_1) = 0.2*0.5 = 0.1$$

$$\delta_1(2) = \pi_2 b_2(o_1) = 0.4*0.4 = 0.16$$

$$\delta_1(3) = \pi_3 b_3(o_1) = 0.4*0.7 = 0.28$$

这里的意思就是根据初始概率以及每个箱子抽到红球的概率计算的，然后就是计算第二时刻的概率：

$$\delta_2(1) = max_{1\leq j\leq 3}[\delta_1(j)a_{j1}] b_1(o_2) = max[0.1*0.5, 0.16*0.3, 0.28*0.2]*0.5 = 0.028 $$

$$\delta_2(2) = max_{1\leq j\leq 3}[\delta_1(j)a_{j2}] b_2(o_2) = max[0.1*0.2, 0.16*0.5, 0.28*0.3]*0.5 = 0.0504 $$

$$\delta_2(3) = max_{1\leq j\leq 3}[\delta_1(j)a_{j3}] b_3(o_2) = max[0.1*0.3, 0.16*0.2, 0.28*0.5]*0.5 = 0.042 $$

上面的计算就是主要的迭代过程了，仔细看一下，简单来说就是根究上一个时刻计算出来的各个状态的概率，再乘以转移概率，记得该时刻下各个状态的最大概率，这样一致计算下去，最终就可以得到结果。