Jesse Yule's Blog

隐马尔可夫模型

之前介绍了概率图模型，而隐马尔可夫模型就属于其中的有向图模型。

首先来回顾一下马尔可夫假设：无记忆性，也就是这一时刻的状态只受前一时刻的影响，而不受再往前时刻的状态影响。

现在来举一个例子说明一下什么是隐马尔可夫模型：

上面就是一个概率图模型，可以看出这是有向图，一共有三种状态：sunny、rainy、cloudy，同时上图也表明了状态之间的转移概率，这些状态是不可被观察的，也被称为隐变量。除此之外，还有一个可以被观察的观测变量，两者就共同构成一个隐马尔可夫模型：

观察变量可以是某个人的活动，比如散步购物在家打扫，这些活动和天气，也就是状态变量之间存在着关系：

所以总的来说，一个隐马尔可夫模型包括三个要素，第一是状态转移概率，是模型在各个状态之间转换的概率，在这个例子就是指今天是晴天明天雨天这类概率。第二点是输出观测概率，是模型根据当前状态获得各个观测值的概率，在这个例子指在某种天气下某个人做某个活动的概率。第三点是初始状态概率，是模型在初始时刻各状态出现的概率。

基于上面的三个基本要素，我们就可以构建出一个隐马尔可夫模型，在实际应用中，我们往往会基于这个模型解决三类问题：

第一个是给定模型的状态转移概率、输出观测概率、初始状态概率，如何有效地计算产生观测序列的概率，或者说，如何评估模型和观测序列之间的匹配程度。

第二个是给定模型的状态转移概率、输出观测概率、初始状态概率和观测序列，如何找到与观测序列最匹配的状态序列，也就是从观测序列推断出隐藏的模型状态。

第三个是给定观测序列，如何调整模型的状态转移概率、输出观测概率、初始状态概率，使得观测序列出现的概率最大，也就是如何训练模型使得其能最好地描述观测数据。

针对这三个问题都有各自的算法解决，这里暂不详细介绍。