隐马尔科夫模型原理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

隐马尔可夫模型主要内容马尔可夫模型隐马尔可夫模型隐马尔可夫模型的三个基本问题三个基本问题的求解算法1.前向算法2.Viterbi算法3.向前向后算法隐马尔可夫模型的应用隐马尔可夫模型的一些实际问题隐马尔可夫模型总结马尔可夫链一个系统有N个状态S1,S2,···,Sn,随着时间推移,系统从某一状态转移到另一状态,设qt为时间t的状态,系统在时间t处于状态Sj的概率取决于其在时间1,2,···,t-1的状态,该概率为:如果系统在t时间的状态只与其在时间t-1的状态相关,则该系统构成一个离散的一阶马尔可夫链(马尔可夫过程):马尔可夫模型如果只考虑独立于时间t的随机过程:其中状态转移概率aij必须满足aij=0,且,则该随机过程称为马尔可夫模型。jia,例假定一段时间的气象可由一个三状态的马尔可夫模型M描述,S1:雨,S2:多云,S3:晴,状态转移概率矩阵为:例(续)如果第一天为晴天,根据这一模型,在今后七天中天气为O=“晴晴雨雨晴云晴”的概率为:隐马尔可夫模型(HiddenMarkovModel,HMM)在MM中,每一个状态代表一个可观察的事件在HMM中观察到的事件是状态的随机函数,因此该模型是一双重随机过程,其中状态转移过程是不可观察(隐蔽)的(马尔可夫链),而可观察的事件的随机过程是隐蔽的状态转换过程的随机函数(一般随机过程)。HMM的三个假设对于一个随机事件,有一观察值序列:O=O1,O2,…OT该事件隐含着一个状态序列:Q=q1,q2,…qT。假设1:马尔可夫性假设(状态构成一阶马尔可夫链)P(qi|qi-1…q1)=P(qi|qi-1)假设2:不动性假设(状态与具体时间无关)P(qi+1|qi)=P(qj+1|qj),对任意i,j成立假设3:输出独立性假设(输出仅与当前状态有关)p(O1,...,OT|q1,...,qT)=Πp(Ot|qt)HMM定义一个隐马尔可夫模型(HMM)是由一个五元组描述的:λ=(N,M,A,B,π)其中:N={q1,...qN}:状态的有限集合M={v1,...,vM}:观察值的有限集合A={aij},aij=P(qt=Sj|qt-1=Si):状态转移概率矩阵B={bjk},bjk=P(Ot=vk|qt=Sj):观察值概率分布矩阵π={πi},πi=P(q1=Si):初始状态概率分布观察序列产生步骤给定HMM模型λ=(A,B,π),则观察序列O=O1,O2,…OT可由以下步骤产生:1.根据初始状态概率分布π=πi,选择一初始状态q1=Si;2.设t=1;3.根据状态Si的输出概率分布bjk,输出Ot=vk;4.根据状态转移概率分布aij,转移到新状态qt+1=Sj;5.设t=t+1,如果tT,重复步骤3、4,否则结束。HMM的三个基本问题令λ={π,A,B}为给定HMM的参数,令O=O1,...,OT为观察值序列,则有关于隐马尔可夫模型(HMM)的三个基本问题:1.评估问题:对于给定模型,求某个观察值序列的概率P(O|λ);2.解码问题:对于给定模型和观察值序列,求可能性最大的状态序列maxQ{P(Q|O,λ)};3.学习问题:对于给定的一个观察值序列O,调整参数λ,使得观察值出现的概率P(O|λ)最大。例:赌场的欺诈某赌场在掷骰子根据点数决定胜负时,暗中采取了如下作弊手段:在连续多次掷骰子的过程中,通常使用公平骰子AB0.90.1A,偶而混入一个灌铅骰子B.0.80.2公平骰子灌铅骰子骰子A骰子B1点1/602点1/61/83点1/61/84点1/63/165点1/63/166点1/63/8公平骰子A与灌铅骰子B的区别:时间1234567骰子AAABAAA掷出点数3345162一次连续掷骰子的过程模拟隐序列明序列查封赌场后,调查人员发现了一些连续掷骰子的记录,其中有一个骰子掷出的点数记录如下:124552646214614613613666166466163661636616361651561511514612356234…问题1–评估问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题会出现这个点数记录的概率有多大?求P(O|λ)问题2–解码问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题点数序列中的哪些点数是用骰子B掷出的?求maxQ{P(Q|O,λ)}问题3–学习问题给定一个骰子掷出的点数记录124552646214614613613666166466163661636616361651561511514612356234问题作弊骰子掷出各点数的概率是怎样的?公平骰子掷出各点数的概率又是怎样的?赌场是何时换用骰子的?骰子B本例中HMM的定义赌场的例子中:隐状态集:S={骰子A,骰子B}明字符集:V={1,2,3,4,5,6}b21=0,b22=b23=1/8,b24=b25=3/16,b26=3/81/61/61/61/61/61/601/81/83/163/163/8初始状态概率:π1=1,π2=0隐状态转移概率:a11=0.9,a12=0.1a21=0.8,a22=0.2初始状态明字符生成概率:b11=b12=…=b16=1/61.001:2:3:4:5:骰子A6:0.11:2:3:4:5:6:0.80.90.2HMM将两个序列相联系起来:1.由离散隐状态组成的状态序列(路径)Q=(q1,…,qT),每个qt∈S均是一个状态由初始状态概率及状态转移概率(π,A)所决定2.由明字符组成的观察序列O=(o1,…,oT),每个ot∈V均为一个离散明字符由状态序列及各状态的明字符生成概率(Q,B)所决定赌场的例子中:隐状态明观察AAAABAAAAABAAAAAAAAAAAAAAAAAAAAAAABAABAAAAAAAAA…33454141553663441134625445334223332124225631341…q1q2q3q4qT...o1o2o3o4oT...观察序列O状态序列QHMMλ本例中三个基本问题1.评估问题•给定观察序列O和HMM=(π,A,B),判断O是由产生出来的可能性有多大•计算骰子点数序列的确由“作弊”模型生成的可能性2.解码问题•给定观察序列O和HMMλ=(π,A,B),计算与序列O相对应的状态序列是什么•在骰子点数序列中,判断哪些点数是用骰子B掷出的3.学习问题•给定一系列观察序列样本,确定能够产生出这些序列的模型=(π,A,B)•如何从大量的点数序列样本中学习得出“作弊模型”的参数三个基本问题的求解算法评估问题:前向算法定义前向变量采用动态规划算法,复杂度O(N2T)解码问题:韦特比(Viterbi)算法采用动态规划算法,复杂度O(N2T)学习问题:向前向后算法EM算法的一个特例,带隐变量的最大似然估计解决问题一—前向算法定义前向变量为:“在时间步t,得到t之前的所有明符号序列,且时间步t的状态是Si”这一事件的概率,记为(t,i)=P(o1,…,ot,qt=Si|λ)则算法过程例子(前向算法应用)HMM模型如下,试根据前向算法计算产生观察符号序列O={ABAB}的概率。状态集Q={S1,S2,S3}观察序列集O={A,B}问题2—解码问题所求的Q应当在某个准则下是“最优”的,因此也称Q为最优路径,解码问题即是确定最优路径的问题。qt=Si产生出o1,…ot的最大概率,即:解决问题二—Viterbi算法Viterbi算法也是类似于前向算法的一种网格结构Viterbi算法(续)目标:给定一个观察序列和HMM模型,如何有效选择“最优”状态序列,以“最好地解释”观察序列“最优”→概率最大:Viterbi变量:递归关系:记忆变量:记录概率最大路径上当前状态的前一个状态Viterbi算法(续)初始化:递归:终结:路径回溯:例子(Viterbi算法应用)HMM模型如下,试根据Viterbi算法计算产生观察符号序列O={ABAB}的最优状态序列Q。状态集Q{S1,S2,S3}观察序列集O={A,B}例(续)初始概率矩阵π=(1,0,0),即开始时处于状态1。按照上面的公式,我们依次递推解出,以及。解法如下:1.当t=1时:例(续)2.当t=2时:3.当t=3时:例(续)4.当t=4时:例(续)其递推结果为:可以看出,最有可能的状态序列是:S1,S2,S2,S2.例(续)其计算结果示意图如下所示:绿色的箭头表示最有可能的状态序列HMM的应用语音识别音字转换词性标注(POSTagging)基因识别问题•状态:编码区域与非编码区域•字符:ATCG一般化:任何与线性序列相关的现象HMM总结HMM模型可以看作一种特定的BayesNetHMM模型等价于概率正规语法或概率有限状态自动机HMM模型可以用一种特定的神经网络模型来模拟优点:研究透彻,算法成熟,效率高,效果好,易于训练

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功