卷积码的维特比译码卷积编码器自身具有网格结构,基于此结构我们给出两种译码算法:Viterbi译码算法和BCJR译码算法。基于某种准则,这两种算法都是最优的。1967年,Viterbi提出了卷积码的Viterbi译码算法,后来Omura证明Viterbi译码算法等效于在加权图中寻找最优路径问题的一个动态规划(DynamicProgramming)解决方案,随后,Forney证明它实际上是最大似然(ML,MaximumLikelihood)译码算法,即译码器选择输出的码字通常使接收序列的条件概率最大化。BCJR算法是1974年提出的,它实际上是最大后验概率(MAP,MaximumAPosterioriprobability)译码算法。这两种算法的最优化目标略有不同:在MAP译码算法中,信息比特错误概率是最小的,而在ML译码算法中,码字错误概率是最小的,但两种译码算法的性能在本质上是相同的。由于Viterbi算法实现更简单,因此在实际应用比较广泛,但在迭代译码应用中,例如逼近Shannon限的Turbo码,常使用BCJR算法。另外,在迭代译码应用中,还有一种Viterbi算法的变种:软输出Viterbi算法(SOVA,Soft-OutputViterbiAlgorithm),它是Hagenauer和Hoeher在1989年提出的。为了理解Viterbi译码算法,我们需要将编码器状态图按时间展开(因为状态图不能反映出时间变化情况),即在每个时间单元用一个分隔开的状态图来表示。例如(3,1,2)非系统前馈编码器,其生成矩阵为:G(D)=[1+𝐷1+𝐷21+𝐷+𝐷2](1)图1(a)(3,1,2)编码器(b)网格图(h=5)假定信息序列长度为h=5,则网格图包含有h+m+1=8个时间单元,用0到h+m=7来标识,如图1(b)所示。假设编码器总是从全0态S0开始,又回到全0态,前m=2个时间单元对应于编码器开始从S0“启程”,最后m=2个时间单元对应于向S0“返航”。从图中我们也可以看到,在前m个时间单元或最后m个时间单元,并不是所有状态都会出现,但在网格图的中央部分,在每个时间单元都会包含所有状态,且在每个状态都有2k=2个分支离开和到达。离开每个状态的上面分支表示输入比特为1(即ui=1,i表示第i个时间单元),下面的分支表示输入比特为0。每个分支的输出vi由n个比特组成,共有2h=32个码字,每个码字都可用网格图中的唯一路径表示,码字长度N=n(h+m)=21。例如当信息序列为u=(11101)时,对应的码字如图1(b)中红线所示,v=(111,010,001,110,100,101,011)。在一般的(n,k,v)编码器情况下,信息序列长度K*=kh,离开和进入每个状态都有2k个分支,有2K*个不同路径通过网格图,对应着2K*个码字。假设长度K*=kh的信息序列u=(u0,u1uh-1)被编码成长度为N=n(h+m)的码字v=(v0,v1vh+m+1),在经过一个二进制输入、Q-ary输出的离散无记忆信道(DMC,DiscreteMemorylessChannel)后,接收序列为r=(r0,r1rh+m+1)。也可表示为:u=(u0,u1uK*-1),v=(v0,v1vN-1),r=(r0,r1rN-1),译码器对接收到的序列r进行处理,得到v的估计𝐯̂。在离散无记忆信道情况下,最大似然译码器是按照最大化对数似然函数logP(r|v)作为选择𝐯̂的准则。因为对于DMC,P(𝐫|𝐯)=∏P(𝐫𝒍|𝐯𝒍)ℎ+𝑚−1𝑙=0=∏P(𝑟𝑙|𝑣𝑙)𝑁−1𝑙=0(2)两边取对数后为:logP(𝐫|𝐯)=∑logP(𝐫𝒍|𝐯𝒍)ℎ+𝑚−1𝑙=0=∑logP(𝑟𝑙|𝑣𝑙)𝑁−1𝑙=0(3)其中P(rl|vl)是信道转移概率,当所有码字等概时,这是个最小错误概率译码准则。对数似然函数logP(r|v),用M(r|v)表示,称为路径度量(pathmetric);logP(rl|vl),称为分支度量(branchmetric),用M(rl|vl)表示;logP(rl|vl)称为比特度量(bitmetric),用M(rl|vl)表示,这样(3)式可写为:𝑀(𝐫|𝐯)=∑𝑀(𝐫𝒍|𝐯𝒍)ℎ+𝑚−1𝑙=0=∑𝑀(𝑟𝑙|𝑣𝑙)𝑁−1𝑙=0(4)如果我们只考虑前t个分支,则部分路径度量可表示为:𝑀(𝐫|𝐯)=∑𝑀(𝐫𝒍|𝐯𝒍)𝑡−1𝑙=0=∑𝑀(𝑟𝑙|𝑣𝑙)𝑛𝑡−1𝑙=0(5)对于接收序列r,Viterbi算法就是通过网格图找到具有最大度量的路径,即最大似然路径(码字)。在每个时间单元的每个状态,都增加2k个分支度量到以前存储的路径度量中(加);然后对进入每个状态的所有2k个路径度量进行比较(比),选择具有最大度量的路径(选),最后存储每个状态的幸存路径及其度量。Viterbi算法:Step1:在t=m时间单元开始,计算进入每个状态的单个路径的部分度量,存储每个状态的路径(幸存)及其度量;Step2:tt+1,对进入每个状态的所有2k个路径计算部分度量,并加上前一时间单元的度量。对于每个状态,比较进入该状态的所有2k个路径度量,选择具有最大度量的路径,存储其度量,并删掉其他路径。Step3:如果th+m,返回step2;否则,就停止。Viterbi算法的基本计算“加、比、选”体现在step2。注:实际工程中,在每个状态存储(在step1和step2)的是对应于幸存路径的信息序列,而不是幸存路径自身,这样当算法结束时,就无需再通过估计码字𝐯̂来恢复信息序列𝐮̂。从时间单元m到h,有2v个幸存路径,每个状态(共有2v个状态)一个。随后,幸存路径数就会变少,因为当编码器回到全0态时,状态数就会变少。最后,在时间单元h+m,就只有一个状态(即全0态),因此,也就只有一个幸存路径了,算法中止。定理1:在Viterbi算法中最后的幸存路径𝐯̂是最大似然路径,即𝑀(𝒓|𝒗̂)≥𝑀(𝒓|𝒗),𝑓𝑜𝑟𝒗≠𝒗̂(6)从实现的角度看,用正整数度量来表示要比用实际的比特度量表示更方便。比特度量M(rl|vl)=logP(rl|vl)可用c2[logP(rl|vl)+c1]来代替,其中c1是任意实数,c2是任意正实数。可证明,如果路径v最大化𝑀(𝐫|𝐯)=∑𝑀(𝐫𝒍|𝐯𝒍)𝑁−1𝑙=0=∑logP(𝑟𝑙|𝑣𝑙)𝑁−1𝑙=0,则它也最大化c2[logP(rl|vl)+c1],因此可以使用修正的度量,且不影响Viterbi算法的性能。如果选择c1使最小度量为0,则c2可选择为使所有度量近似为整数。这样,由于用整数来近似表示度量,Viterbi算法的性能变成了次最优算法,但通过选择c1和c2可使得这种性能降低非常小。例1:对于二输入、4-ary输出的DMC信道下的Viterbi算法二输入、4-ary输出的DMC如图2所示。该信道的比特度量如图3(a)所示(按照底为10的对数计算),选择c1=1,c2=17.3,得到整数度量表如图3(b)所示。图2二输入、4-ary输出DMC信道模型01021211010212110-0.4-0.52-0.7-1.001085011.0-0.7-0.52-0.4105810(a)(b)图3度量表假设图1中的一个码字在这样的信道中传输,接收到的序列为:r=(111201,111102,111101,111111,011201,120211,120111)(7)对该序列进行Viterbi译码如图4所示。每个状态上的数字表示幸存路径的度量,另一个路径就将被删除(绿线部分)。这样最后的码字(红线部分的输出)判决为:𝐯̂=(111,010,110,011,000,000,000)(5.8)它对应的输入序列为𝐮̂=(11000)。注意:网格图中最后的m=2个分支是清空寄存器的,不能算作为输入信息序列。0101021112lrlvlrlv图4DMC信道下的Viterbi算法在BSC信道情况下,转移概率为p1/2,接收序列r是2-ary输出的,此时对数似然函数为:logP(r|v)=d(r,v)logp/(1-p)+Nlog(1-p)(9)其中d(r,v)是r和v之间的Hamming距离。由于logp/(1-p)0,且Nlog(1-p)对所有v来说都是一个常数,因此最大似然译码(maxlogP(r|v))就是最小化Hamming距离(mind(r,v))。𝑑(𝐫|𝐯)=∑𝑑(𝐫𝒍|𝐯𝒍)ℎ+𝑚−1𝑙=0=∑𝑑(𝑟𝑙|𝑣𝑙)𝑁−1𝑙=0(10)因此,当我们将Viterbi算法应用到BSC信道时,d(rl,vl)成为分支度量,d(rl,vl)为比特度量,该算法就是寻找具有最小度量的路径,即与r汉明距离最近的路径。该算法运算仍然相同,只是用Hamming距离代替了似然函数作为度量,在每个状态的幸存路径是具有最小度量的路径。