线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

编码技术论文8篇

时间:2023-03-23 15:14:00

编码技术论文

编码技术论文篇1

论文关键词:视频编码,压缩技术

 

一、引言

所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频压缩发展到现在己有几十年的历史。1948年,Oliver提出了第一个编码理论脉冲编码调制(PulseCodingModulation,简称PCM);同年,Shannon的经典论文“通信的数学原理”首次提出了信息率失真函数的概念;1959年,Shannon进一步确立了码率失真理论;而Berger在1971年所著的《信息率失真理论》一书则对率失真理论做了系统地论述和扩展;以上各项工作奠定了信息编码的理论基础。

二、AVS基本介绍

AVS是基于我国创新技术和部分公开技术的自主标准,技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS通过简洁的一站式许可政策,是开放式制订的国家、国际标准,易于推广;此外,AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。综上所述,AVS可称第二代信源标准的上选。

图1AVS视频编码器框图

三、AVS主要技术

AVS采用的主要技术包括:8x8整数变换量化技术、帧内预测、半像素与1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等:

1.整数变换量化:AVS为了避开H.264的专利问题,选择了以往标准广泛采用的8×8变换,这样可以在16位处理器上无失配地实现。AVS采用的64级量化,可以完全适应不同的应用和业务对码率和质量的要求。目前AVS所采用的8x8变换与量化方案大大降低了芯片的实现难度。

2.帧内预测:AVS采用的帧内预测技术,是用相邻块的像素预测当前块,同时采用代表空间域纹理方向的多种预测模式。AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式,色度块采用4种预测模式,而这4种模式中有3种和亮度块的预测模式相同。在编码质量相当的前提下,AVS采用较少的预测模式,使方案更加简洁、实现的复杂度大为降低。

3.帧间预测运动补偿:帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16,16×8,8×16和8×84种用于运动补偿的宏块模式,去除了MPEG-4AVC/H.264标准中的8×4,4×8,4×4的块模式,这样可以更好地刻画物体运动,提高运动搜索的准确性。

4.半像素与1/4精度像素插值:AVS通过4抽头滤波器(-1,5,5,-1)得到半像素点,再通过4抽头滤波器(1,7,7,1)和均值滤波器得到1/4像素点,在不降低性能的情况下减少插值所需要的参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常有意义的。

5.预测模式:AVS的B帧双向预测使用了直接模式、对称模式和跳跃模式。使用对称模式时,码流只需要传送前向运动矢量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销;对于直接模式,前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量按比例分配导出,因此也可以节省运动矢量的编码开销;跳跃模式的运动矢量导出方法和直接模式的相同,跳跃模式编码块都不编码运动补偿的残差,也不传送运动矢量,即该模式下宏块只需要传输模式信号则可。

6.二维熵编码:AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中,定长码用来编码具有均匀分布的语法元素,指数哥伦布码用以编码可变概率分布的语法元素。采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活确定k阶指数哥伦布码编码,如果k选得恰当,编码效率可以逼近信息熵。预测残差的块变换系数后,经扫描形成(level、run)对串,level、run不是独立事件,而存在很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。

四、总结与展望

目前AVS技术可实现标准清晰度、相当清晰度、低清晰度等不同格式视频的压缩,但针对此类应用的压缩效率还有待不断提高,这应当是AVS视频技术进一步发展的重点所在:着力AVS编解码的实际应用研究,优化AVS运动搜索算法,提高AVS解码速度,从而推动我国数字音视频标准AVS的推广和应用。

参考文献

1 陈亮 AVS先进编码技术研究 华中科技大学 2006

2 申青平 AVS-M关键技术及多平台应用研究 湘潭大学 2007

编码技术论文篇2

论文关键词:视频编码,压缩技术

 

一、引言

所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频压缩发展到现在己有几十年的历史。1948年,Oliver提出了第一个编码理论脉冲编码调制(PulseCodingModulation,简称PCM);同年,Shannon的经典论文“通信的数学原理”首次提出了信息率失真函数的概念;1959年,Shannon进一步确立了码率失真理论;而Berger在1971年所著的《信息率失真理论》一书则对率失真理论做了系统地论述和扩展;以上各项工作奠定了信息编码的理论基础。

二、AVS基本介绍

AVS是基于我国创新技术和部分公开技术的自主标准,技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS通过简洁的一站式许可政策,是开放式制订的国家、国际标准,易于推广;此外,AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。综上所述,AVS可称第二代信源标准的上选。

图1AVS视频编码器框图

三、AVS主要技术

AVS采用的主要技术包括:8x8整数变换量化技术、帧内预测、半像素与1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等:

1.整数变换量化:AVS为了避开H.264的专利问题,选择了以往标准广泛采用的8×8变换,这样可以在16位处理器上无失配地实现。AVS采用的64级量化,可以完全适应不同的应用和业务对码率和质量的要求。目前AVS所采用的8x8变换与量化方案大大降低了芯片的实现难度。

2.帧内预测:AVS采用的帧内预测技术,是用相邻块的像素预测当前块,同时采用代表空间域纹理方向的多种预测模式。AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式,色度块采用4种预测模式,而这4种模式中有3种和亮度块的预测模式相同。在编码质量相当的前提下,AVS采用较少的预测模式,使方案更加简洁、实现的复杂度大为降低。

3.帧间预测运动补偿:帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16,16×8,8×16和8×84种用于运动补偿的宏块模式,去除了MPEG-4AVC/H.264标准中的8×4,4×8,4×4的块模式,这样可以更好地刻画物体运动,提高运动搜索的准确性。

4.半像素与1/4精度像素插值:AVS通过4抽头滤波器(-1,5,5,-1)得到半像素点,再通过4抽头滤波器(1,7,7,1)和均值滤波器得到1/4像素点,在不降低性能的情况下减少插值所需要的参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常有意义的。

5.预测模式:AVS的B帧双向预测使用了直接模式、对称模式和跳跃模式。使用对称模式时,码流只需要传送前向运动矢量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销;对于直接模式,前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量按比例分配导出,因此也可以节省运动矢量的编码开销;跳跃模式的运动矢量导出方法和直接模式的相同,跳跃模式编码块都不编码运动补偿的残差,也不传送运动矢量,即该模式下宏块只需要传输模式信号则可。

6.二维熵编码:AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中,定长码用来编码具有均匀分布的语法元素,指数哥伦布码用以编码可变概率分布的语法元素。采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活确定k阶指数哥伦布码编码,如果k选得恰当,编码效率可以逼近信息熵。预测残差的块变换系数后,经扫描形成(level、run)对串,level、run不是独立事件,而存在很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。

四、总结与展望

目前AVS技术可实现标准清晰度、相当清晰度、低清晰度等不同格式视频的压缩,但针对此类应用的压缩效率还有待不断提高,这应当是AVS视频技术进一步发展的重点所在:着力AVS编解码的实际应用研究,优化AVS运动搜索算法,提高AVS解码速度,从而推动我国数字音视频标准AVS的推广和应用。

参考文献

1 陈亮 AVS先进编码技术研究 华中科技大学 2006

2 申青平 AVS-M关键技术及多平台应用研究 湘潭大学 2007

编码技术论文篇3

关键词: 网络编码; 可行性; 线性多播性; 混合

中图分类号:TP393 文献标志码:A 文章编号:1006-8228(2012)12-01-02

Research on network coding based on linear network coding technology

Li Ni, Yang Wangdong, Chen Qiang

(Department of Information Science and Engineering, Hunan City College, Yiyang, Hunan 413000, China)

Abstract: The status of the network coding research and the existing problems are described. The feasibility of network coding is proven through the analysis of linear network coding technology coding and decoding principle. The most basic property of the linear network coding-linear multicast property is demonstrated based on theory of linear algebra. Finally, the network coding technology is put forward as a "hybrid" technology. The network coding technology development will be combined with the computer network technology, information theory, coding technology and cryptography theory.

Key words: network coding; feasibility; linear multicast property; hybrid

0 引言

今天的互联网信息就像高速路上的汽车或管道中的水流一样被传输着,日益增长的网络带宽需求和不可靠网络的QOS需求,已成为制约网络发展的瓶颈。为扩大网络覆盖范围和提高系统容量,采用网络编码技术实现网络的最大流传输,已被国际学术界认定为解决网络问题的重要手段,并成为网络理论研究的热点问题之一。

1 网络编码研究现状和存在的问题

上个世纪50年代香农就提出:通信网络端对端的最大信息流是由网络有向图的最小分割决定的,但传统路由器的存储转发模式难以达到最大流最小分割定理的上界。2000年,香港中文大学R.Ahlswdee等人在发表的论文Network Information Flow中首次提出了网络编码[9],并根据信息论严格证明了网络编码允许中间节点对接收到的信息进行编码并转发,接收节点通过相应的解码获得原始信息,这样可以达到通信网络的容量上界,从而最大限度利用网络资源。网络编码的提出从本质上打破了通信网络中传统的信息处理方式,是通信网络研究中一个重要的里程碑事件。近年来,网络编码理论的研究已取得重要发展,同时在应用基础和工程实践方面的研究也正在全方面展开。2003年,SYR.Li等人证明了使用线性网络编码已经能足够达到网络多播容量。Koetter R等人提出了网络编码的代数框架,并证明了存在满足多播流量的线性不变编码。这两位学者的工作为网络编码的发展准备了必要的理论条件。随机网络编码是由Ho T、Medard等人在2003年提出的,它的提出拓宽了网络编码的适用场景,使得网络编码不再局限于确定的网络拓扑和集中式算法。Cai Ning利用分布式网络编码来纠正网络中的差错,并论述了网络编码在安全方面的应用,为网络编码增加了新的应用领域。国外多所著名大学如麻省理工学院、多伦多大学、瑞士EPFL学院等,以及多家知名IT研究机构包括微软研究院、贝尔实验室等,都在积极开展网络编码理论和应用的研究,而国内针对编码的研究尚处于起步阶段。

目前,网络编码的理论研究尚处于初步阶段,实际应用也远未挖掘出其真正潜力,还有大量的难题有待解决。①即便网络编码可以提高通过率,能使问题得到有效解决,但是要确定存在合适的边函数却是件不容易的事情。还存在网络什么时候传输的边函数有用,有多少信息需要通过这种方式传送等问题。②在许多实际的网络中,并不一定是有向或无环的。对于有环网络构造的编码是时变的,这在实际中很少应用。并没有证明有环网中最佳时不变码的存在。③多源网络编码构造问题。④目前许多的有效编码算法都只限于应用到组播的情况,缺少一般性。⑤网络安全与网络管理的应用。

2 网络编码技术概述

网络编码的概念源于2000年Ahlswede R,Cai N,SYR.Li,R.W.Yeung发表的论文《Network Information Flow》,其最初的思想即允许网络的中间节点参与编译码。网络编码采用存储-编译码-转发的方式,可达到网络的多播容量[6]。网络编码的实质:①信息流被压缩或被编码;②网络编码是通过计算(编码)提升吞吐量。(网络吞吐量:是指在没有帧丢失的情况下,设备能够接受的最大速率。吞吐量的单位以比特/秒或字节/秒表示。)

网络编码理论也称为网络信息流理论,属于网络信息论的重要分支。经典信息论的编码通常是信源编码和信道编码,而网络编码与其有本质上的不同。网络编码除考虑信源和信宿节点的编码外,中间节点也参与编码,并且网络编码能从整体上提高网络吞吐量,提升通信系统的有效性。

网络编码理论指出网络信息流可以被压缩,从而进一步提升网络吞吐量。并且信息流仍然满足守恒定理,虽然信息内容被处理,但处理前后信息是不增也不减的。

其中,线性网络编码是研究较早,也是较为成熟的一类。有向无环网络中的网络编码称为线性网络编码。蒲保兴等详细分析了线性网络编码的计算时延与关键参量之间的关系[5]。

3 线性网络编码的编码译码原理及其可行性

线性网络编码中的核心是确定两个重要参数,即局部编码矩阵和全局编码向量。

定义1 线性网络编码的局部编码矩阵[8]

有向无环网络中,已知F为有限域(具有有限个元素的域),s(向量矩阵维数)为正数。对于任何节点T,其线性网络编码的局部编码矩阵为:

KT=[kd,e]d∈In(T),e∈Out(T)

式中,In(T)是节点T所有输入链路的集合,Out(T)为节点T所有输出链路的集合,|In(T)|表示节点T输入链路的个数,|Out(T)|表示节点T输出链路的个数。KT矩阵是维数等于|In(T)|×|Out(T)|的矩阵。kd,e表示节点T的每个相邻链路对(d,e)的局部编码标量,取值于有限域F。

对于信源节点由于没有输入链路,一般假设产生s维信号的信源节点存在s条输入链路,由于这s条链路实际并不存在,所以称为虚拟链路。

定义2 线性网络编码的全局编码向量

式中,fd为输入链路d的全局编码向量,fe称为输出链路e的全局编码向量。全局编码的是维数等于s*1的列向量,标记网络输入信号量为s。该迭代公式的初始条件是信源节点的s维虚拟链路的全局编码向量,它是从向量空间上选择的一个s维的标准基。

定义3 线性网络编码中全局编码向量与链路上传输信息的关系

me=x·fe

式中,x为信源节点产生的所有信息行向量,维数为1*s。fe为链路e上的全局编码向量,me为链路e上传输的信息。通过线性编码后每条链路上传输的是关于输入信号的线性表达量。

定义4 线性多播的译码矩阵D

[fe]e∈In(T)·D=Is

式中,maxflow(T)是针对任何满足maxflow(T)≥s的节点T,[fe]e∈In(T)为节点T所有输入链路的全局编码向量并列放置一起所组成的矩阵,Is为s×s维的单位矩阵。

将节点T收到的所有消息(可用消息矩阵x·[fe]e∈In(T)表示)乘以译码矩阵D,即可译码出信源节点S所发出的信息。

线性网络编码的编码和译码原理,其基本思想是,编码时,根据每个节点的每个相邻链路对的局部编码标量,得到每个节点的局部编码矩阵。将局部编码标量和局部编码矩阵的线性组合,得到关于每条链路的全局编码向量。于是得到通过编码后每条链路的实际传输信息。译码时,由定义4得到译码矩阵D,将信宿节点收到的所有消息乘以D,即可译码出信源节点所发出的所有信息。

可见,线性编码的基本思路简洁,当局部编码矩阵确定后,可以惟一确定全局编码向量,并可通过译码矩阵得到其信源信息,并易于在网络通信中实现,保证了在网络中信息的安全,提高了吞吐量,由此网络编码是可行的。

4 网络编码的线性多播性质

在向量空间的一组元素,如果其中没有向量可表示成有限个其他向量的线性组合,则称为线性无关,反之称为线性相关。

有向无环网络中,对于任何非信源节点T,输入链路为n,均存在由其所有输入链路d的全局编码向量fS*1集合组成的向量空间vs*n。若n≥s,则vs*n秩的最大值为s。已知全局编码向量均是从s个标准基的线性组合的,所以,向量空间vs*n的每个列向量均是s个标准基的线性组合,所以vs*n的秩为s。

在有向无环网络中,对于非信源节点T,当其最大数据流大于等于网络信息输入信息量时,其所有输入链路全局编码向量所生成的向量空间的秩为网络输入信息量,即向量空间中线性无关的全局编码向量的个数为网络信息输入量。所以,信源节点发出的信息量为w,则非信源节点最多收到信源发出的w个信息。对满足输入链路大于w的节点,则能同时接收到信源发出的所有信息。在路由的情况这是不可能的,这是网络编码性能优于路由的本质原因。

有向无环网络中,对于任何非信源节点T,存在其所有输入链路e的全局编码列向量fe的集合所生成的向量空间ve。对于满足输入最大流量大于等于网络输入信息量的非信源节点T,均有

dim(ve)=网络输入信息量

则此时的线性网络编码称为线性多播。在有向无环网络中,线性多播是其最基本的特点。

5 结束语

在有向无环网络中,由于不存在环,所以我们可以“由上至下”从信源节点至信宿节点顺序地线性编码传输信息,增强了信息传输安全性,提高了网络吞吐量。在此,我们详细描述了网络编码技术的现状和存在的问题,并通过线性网络编码技术论证了网络编码是一门可行的网络技术,而且,从线性代数理论基础上证明了网络编码存在线性多播性。

有向无环网络编码理论的研究是网络编码技术不可或缺的内容。未来网络编码技术的发展将结合计算机网络技术,信息论和编码技术,密码学理论等知识,并结合现代技术如透明计算,云计算等不断发展和深入。

参考文献:

[1] 谢坚戈,袁涛,王晓灵等.网络编码调度策略的研究[J].电视技术,

2012.36(3).

[2] Xia Yin, Zhang Tiyuan, Huang Jiaqing J .New algorithm for

variable-rate linear broadcast network coding. Cent. South Univ[J].Technol,2011.18:1193-1199

[3] 蒲保兴,杨路明,王伟平.线性网络编码的导出与扩展[J].软件学报,

2011.22(3):558-571

[4] 司菁菁.线性网络编码的类型保持转换矩阵[J].计算机工程与应用,

2011.47(7).

[5] 蒲保兴,王伟平.线性网络编码运算代价的估算与分析[J].通信学报,

2011.32(5).

[6] Yeung R, Li S,Cai work coding theory. foundation and

trends in communications and information theory[M]. Now Publishers,2006:11-55

[7] Tan M,Yeung R,Ho S.A unified framework for linear network

codes.Proceedings of the 4th Workshop on Network Coding Theory and Applications[C].Hong Kong,China,2008:132-136

[8] R.W.Yeung.Information Theory and Network Coding[M].Springer.

编码技术论文篇4

近些年来对无线通信技术领域的研究越来越多,这些技术在地空通信中逐渐成为热点。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。本论文简要介绍了LDPC码的编码算法和译码算法,以及在地空通信中的应用。

【关键词】 LDPC码 地空通信 编码

1 LDPC码简介

1.1 提出LDPC码的背景

卫星通信技术发展越来越成熟,最近研发的卫星通信技术能够通过空间卫星进行地空通信。LDPC码是其中非常重要的一环,这是因为LDPC码具有强大的纠错能力,具有很低的复杂度等。

LDPC码具有很强的纠错能力,同时还具有低复杂度的快速译码算法和比较好的特性结构,所以在最新的带宽无线多媒体的通信系统中,LDPC码成为了能够传播高质量的通信以及视频信号的关键性技术。同时LDPC码已经广泛被欧洲等国家的卫星使用。

1.2 LDPC码的基本概念

LDPC码的全称为低密度奇偶校验,1960年后Gallager第一次提出这个概念。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。LDPC码的编码是一种随机码。由于当时的技术和条件都十分落后,LDPC码并没有广泛应用于实际当中。后来人们发现了Turbo码,但是Turbo码在本质上就是LDPC码。LDPC码的纠错性能十分优异,近些年来越来越受到人们的重视。

LDPC码的译码采用软判决的置信传播迭代译码算法。正是由于这个原因,LDPC码在给定误码率的情况下,信息的传输速率和Shannon限很接近。在某种程度上,LDPC码的纠错性比Turbo码强出了很多很多。我们都知道,译码的复杂度与码长有关,而且是线性的关系。要想实现长编码分组的应用,就必须克服分组码在长码的时候译码的计算量问题。

2 DVB-S2标准的前向纠错系统

LDPC码的编译方法有许多,本论文简要介绍一下介绍LDPC码的DVB-S2标准编译码方法。

第一代DVB标准是1994年提出来的,它采用RS码,QPSK调制和级联卷积码的方式。但是伴随VLSI技术的发展,就出现了更高效率的编码方式。DVB-S2项目组的目标旨在带宽和功率不增加的情况下,增加百分之30的传输量。

DVB-S2标准主要由三个部分组成:BCH(前向纠错系统由外编码)、LDPC(内编码)和比特交织。同时输入流包括BBFRAMES(基本比特帧)和FECFRAMES(外流前向纠错帧)。FEC系统处理完每个BBFRAME(kbch位)之后,都会产生一个FEC-FRAME(nldpc)。系统BCH外码的奇偶校验比特(BCHFEC)被加到BBFRAME,LDPC内码的奇偶校验比特被加到BCHFEC后面。

3 LDPC码的算法

3.1 LDPC码编码算法

传统的规则LDPC码的编码主要可以分为四步,分别如下。其框图如图1所示,编码步骤如下:

(1)明确规则LDPC码的H矩阵的列重和行重。

(2)构造LDPC码的H矩阵。

(3)将校验矩阵H转换成系统形式。

(4)根据线性分组码系统形式的校验矩阵与生成矩阵之间的关系得到相应的生成矩阵G,编码生成的码字为C=uG。

3.2 LDPC码的译码算法

LDPC码有很多种译码方式,常见的译码方式主要有:加权比特翻转译码、比特翻转译码、大数逻辑译码、后验概率译码以及和积算法译码等。本论文简要介绍和积算法。

所谓和积算法,就是一种迭代译码算法,它的传播是基于置信度的。下一次迭代的输入,是上一次译码结束时可靠度量度的计算结果。直到达到了某个特定的条件后,译码的迭代过程才会停止,进而系统会作出硬判决。

4 我国的LDPC码在将来地空通信中的应用

地空通信具有许多特点,比如信号的能量衰减比较严重,信息的传输延时比较大等等。因此必须采取特殊的方法,才能够保证信息传输时的可靠性。地空通信信道对于信道编码是一种理想的信道。

(1)地空通信信道和无记忆的高斯信道很相似,都是Shannon编码理论的信道模型。

(2)地空通信信道可以使用很低的频带利用率的编码和二进制调制方案,因为地空通信信道具有很丰富的带宽。

(3)由于地空通信中传输距离非常远,信号的能量衰减比较多,所以采用的都是低码速率通信。

以前地空通信使用的都是Turbo码。Turbo码具有很多优点,比如误码性能很好,但是仍然存在着误码平台。相对于Turbo码,LDPC码更适合作为地空通信的信道编码,这是因为LDPC码具有很低的译码复杂度、更低的误码平台以及更大的吞吐量。要想设计出更加适合于地空通信的LDPC码,还需要考虑到功耗效率、编码器和译码器的结构以及复杂度等等。作为一种重要的信道编码,LDPC码必将会在地空通信中发挥重要的作用。

5 总结

近些年来对无线通信技术领域的研究越来越多,这些技术在地空通信中逐渐成为热点。LDPC码是一种线性的分组码,它是基于稀疏校验矩阵的。本论文简要介绍了LDPC码的编码算法和译码算法,以及在地空通信中的应用。

参考文献

[1]曾蓉,梁钊.低密度校验LDPC码的构造及编码[J].重庆邮电学院学报(自然科学版),2005,17(3):316-319.

[2]张长帅,宋黎定,刘泳.LDPC码在深空通信中的应用技术研究[J].航天器工程,2007,16(3):90-92.

[3]翟政安,罗伦,时信华.深空通信信道编码技术研究[J].飞行器测控学报,2006,25(2):59-61.

编码技术论文篇5

关键词:分布式视频编码编码理论视频压缩

中图分类号:TN941.2文献标识码: A

一、引言

在视频压缩领域,长久以来都是使用传统的视频压缩方案,即由国际标准化组织(ISO/IEC)和国际电信联盟(ITU-T)这两个组织分别领导和制定的视频压缩编码,分别为MPEG系列和H. 26x系列。这些传统的视频编码技术是基于混合编码的框架,通过帧间预测来利用相邻帧之间的相关性,在编码端主要运用运动估计和运动补偿算法来充分的挖掘视频信号的冗余信息,在通常情况下,编码复杂度一般是解码复杂度的5—10倍,因此这种压缩方案非常适合于视频信号一次编码、多次解码的应用场合,例如视频广播、视频点播、视频光盘存储等。

但是随着科技发展新技术的出现,特别是移动多媒体通信及无线视频传感器网络等的应用,对编解码器的配置方案提出了不同的要求,即要在编码度上力求简单,而解码器可以具有较高复杂度的解码器。尤其在无线视频终端,如无线视频监控、移动视频电话、无线PC相机等,计算能力、内存容量都比较受限,视频的传感节点就要求编码器复杂度度、功耗小,并具有较高的压缩效率。在这种情况之下,传统的视频编码技术已经不能满足应用,因此就产生了更适用的新型视频编码压缩技术——分布式视频压缩。

分布式视频编码在编码端只需实现帧内编码,解码端却能实现帧间解码和运动补偿预测的复杂算法,能够实现较为高效的压缩,另外还具有耗电量低、抗误码特性好的特点,因此能够广泛适用于无线视频终端、密集型传感器网络等移动多媒体及数据通信业务。

二、分布式视频编码理论基础

分布式视频编码(Distributed Video Coding)建立在70年代Slepian-Wolf的无损分布式编码信息论原理和Wyner-Ziv有损分布式编码理论的基础之上。

设X和Y为两个统计中相关的随机独立同分布序列样本,对X和Y分别进行编码和解码时,在无失真信息时则传输率分别满足Rx≥H(X)及Ry≥H(Y),其中Rx,H(X),Ry,H(Y)分别为X和y的信息传输率和熵。若对X和Y进行联合编码,则可利用X和Y之间的统计相关性获得更好的效果,即Rx+Ry≥(X,Y)。

1、无损分布式编码的Slepian-Wolf理论

是指对相关的两个或者多个同分布的信源进行编码,每一个编码器发送一个单独的比特流到解码器,解码器利用信号间的统计相关特性,对所有编码的信源进行联合解码。

Slepian-Wolf理论指出,当对长序列进行编码时,若允许存在任意一个小的解码错误概率,则对X和Y分别进行编码,然后进行联合解码即可获得与联合编码相同的信息传输率。这种方式就是分布式信源编码,它相当于只在解码端利用X和Y的相关性。

Slepian-Wolf理论确定了在无损分布式编码中信息传输率的下限,即Rx+Ry≥R(X,Y),Rx≥H(X\Y),Ry≥H(Y\X)。可见,若没有联合编码,只是联合解码的话,其总的信息传输率Rx+Ry与联合编码时的情况是相同的。

2、有损分布式编码的Wyner-Ziv理论

Wyner-Ziv在Slepian-Wolf理论提出后,在其原有基础上扩展到了有损情况,建立了解码端使用边信息的有损分布式编码率失真的理论。

设X和Y为两个统计中相关的随机独立同分布的序列样本,取自样本空间X,Y,两个序列可能有无限的符号集α和β,分别代表信源数据和辅助信息信源。X在编码时不能使用边信息Y,但解码时可使用Y;解码后得到X,在样本空间X上的重建值X’,失真度为D=E【d(X,X’)】。 Wyner-Ziv率失真函数表示了在失真度D的约束条件下,分布式编码的码率下限。

三、分布式视频编码在视频压缩中的应用

1、分布式编码理论的应用

Slepian-Wolf理论提出的很早,但是其实际的应用是在近些年才出现,但很快的促进了其应用技术的发展。Slepian-Wolf编码类似于通道编码,而目前大多数的分布式编码技术都源自于通道编码的思想。最早的研究是使用标量和trellis集构造的方法,对与统计相关的二值高斯信源进行研究,来分析解码端辅助信息的信源编码的非对称情况;随后又研究了对相同码率信源X和Y的对称编码方式。其后又对高斯信源的非对称编码使用嵌入式trellis集编码结构来进行研究,并获得了更好的实验结果。之后有更复杂的通道编码技术应用于分布式信源编码,如使用贝叶斯网络、维特比解码器、turbo码、LDPC(Low-DensityParity-Check)码等。

Wyner-Ziv编码理论与Slepian-Wolf编码一样,也是在近些年才被投入到实际应用。Slepian-Wolf编码理论和Wyner-Ziv编码理论分别提出了无损压缩情况下和给定失真度压缩情况下的信息传输率下限,但并未设计出实用的编解码器设计方案。近些年提出了一些实用的分布式编码技术,其中大部分应用于视频压缩与容错视频传输,被称作分布式视频编码技术。而这种分布式视频编码技术的主要是以Wyner-Ziv编码理论为基础,因此也称为Wyner-Ziv视频编码技术。

2、分布式视频编码的实现方法

目前的视频压缩标准不再实行传统的编码需求,因为编码端内存和计算量太少导致编码端的计算量远大于解码端;而是转向编码端简单、解码端复杂的编码形式。运用Wyner-Ziv编码理论,在这些视频编码系统中,各帧独立的进行编码,而在解码时进行有条件解码。这样在编码时只需采用帧内编码,使编码器的复杂度大大降低,而在解码端进行运动估计和运动补偿。

2.1基于变换的编码方法

Wyner-Ziv编码器开始研究如何实现变换编码,一种方法是对Wyner-Ziv帧进行DCT变换,再将变换系数进行量化;另一种是对Wyner-Ziv帧及辅助信息信源都进行DCT变换。这些方法不像之前在非分布视频编码方法中广泛采用的正交变换编码,而是意在改变传统方法中先对信源矢量进行分解得到谱系数,再分别进行标量量化和熵编码的方式。

2.2基于像素的编码方法

这种编码方法是对基于像素的帧内编码器与帧间解码器进行结合,然后进行视频压缩。是在源图像的序列中分间隔地提取一组帧作为关键帧,这些关键帧的编解码均采用传统的帧内离散余弦变换的编码方法;在这些关键帧之间的其它帧叫做“Wyner-Ziv帧”,它们在编码器端采用帧内编码的方法,在解码器端采用帧间的编码方式。这种基于像素的Wyner-Ziv编码器与传统的运动补偿预测编码方法相比虽然性能略有下降,但复杂度大大降低了。

2.3联合解码和运动估计

在传统的视频编码技术中,运用的是将编码帧与一个或多个参考帧直接进行比较,得到最优运动矢量的方法,运动补偿是用在编码端。而在分布式视频编码中,是通过Wyner-Ziv帧进行DCT变换后的量化系数计算校验码,并将其传输到接收端;将运动补偿用在解码端,并且进行联合解码,从而极大的提高了Wyner-Ziv编码器的压缩效率。

四、结语

在用于视频压缩时,分布式视频编码的率失真性能要好于传统的帧内编码,还可以克服帧间编码固有的一些帧间错误传播问题,并且可以将大部分的运算转移到解码端,使编码器复杂度降低,非常适合新的视频压缩应用。

本文介绍了分布式视频编码理论及其应用的一些初步研究,作为一种视频编码的全新技术,具有很多传统编码技术所没有的优势。但要使这项技术能够实现广泛的应用,还必须对各种应用领域的特点进行深入细致的分析,并结合应用的具体环境采用合适的编码方法,这样才能实现分布式视频编码在移动多媒体和数据通信领域应用的广阔前景。

参考文献:

[1] 王安红.分布式视频编码研究[D].北京交通大学 2009

编码技术论文篇6

本文结合作者《信息论与编码》课程多年的教学经历就教学中如何让学生真正领会"信息论与编码"所涉及的主要问题,包括该课程所涉及的主要内容及各部分内容如何讲授给出了自己的见解。

1概述

"信息论与编码"是电子信息工程专业或相近专业开设的课程,之所以开设该课程,是因为该课程设计的编码技术已普遍应用于无线移动通信和计算机网络通信中。专业技术人员在研发工作中经常用到该技术。本文从该课程的教学中同学们经常提出而且相关的专业书籍并没有完整分析的几个基本问题出发,用最基本的理论(有些甚至是初高中的)基本理论进行分析和推理,期望通过该课程(及其它课程的教学),让同学们能够用已了解和掌握的基本理论、知识来分析问题和解决问题,待知识积累到一定程度和了解该领域在全世界的发展情况以后,可以从更长远的角度提出更加高深的问题,促进信息科学的发展。

2"信息论与编码"教学中需关注的问题

2.1"信息论与编码"到底解决什么问题。

"信息论与编码"是电信工程及相关专业中难度最高的几门课程之一,授课时首先需要让同学们明确"信息论与编码"能够解决什么问题。这是所有同学此前并不知晓且真正关心的问题,甚至现在国内有些排名靠前的高校,有的开设了该课程,后来又取消;或者有的在教学大纲中对学生的要求仅仅是掌握熵等基本概念。教学中经常出现的问题是,同学们都说学过熵的概念,但迄今为止,在我的教学中,讲授该课程之前,没有一个本科学生能够真正解释熵的含义。

对于本科生、硕士研究生甚至博士研究生的培养中,"信息论与编码"的重点应放在编码上。信息论实际上是存在性定理的证明,对本科生、硕士研究生来说,难度很大。而编码技术(实际上是寻求解决问题的具体途径和方法)的入门或者钻研深一点其实并不难。

上面谈到的编码问题真正要解决的是通信中的两个关键问题:有效性问题和可靠性问题。通信中有效性问题的解决方法是信息压缩,即信源编码;可靠性问题的解决措施是提供冗余信息,即信道编码。即,通信中的有效性问题和可靠性问题分别通过信源编码和信道编码来实现。从上面的介绍可以看出,有效性和可靠性的解决其实是一对矛盾。信息论与编码的核心就是解决这两个问题。传统的固话通信强调的是有效性的解决,而目前广为流行的无线移动通信中的语音业务和数据业务需要同时解决这两个问题:语音业务需要信道编码的原因是恶劣的通信环境;数据业务需要信道编码则源自数据可靠传输的基本技术指标。

2.2通信中的有效性问题

从概念上讲,同学们都会逐渐接受通信有效性问题的重要性。需要让同学们明确的是:

如今的有效性问题与传统通信的有效性问题完全不一样。传统通信中实现有效性的措施基本上指的是PCM,即模拟语音信号的数字化技术。而如今数字化技术的迅速发展导致无线移动通信的业务、宽带数据业务都远远超过固话业务,由此派生出的通信有效性的如下几种解决措施:一是无线移动通信中的语音编码问题;一是视频通信中的图像编码;另一个是数字信号的压缩编码。

授课时需要明确的是:移动通行中的语言数字化技术完全不同于PCM,PCM的性能虽然很好,但不能应用在无线移动通信中,理由是无线移动通信的宽带有限。因而将参量编码与PCM的波形编码结合起来用于无线移动通信,既克服了参量编码速率低但质量差的特点,又折衷了PCM质量好但速率高的特点。头像编码的过程类同PCM,只是遵循基色编码字理。

数字信号压缩编码最显著的例子是Huffman编码。显然有众多的参考文献分析介绍Huffman编码,并且给出看似很容易接受的实例,但这些文献大都基本上采用的是每次将两个概率压缩一次,没有介绍编码的根本法则,即,到底将多少概率压缩为一个概率,而实际上由于同学们不清楚到底有多少个概率压缩后仍编码为同等长度,因而在Huffman编码的教学中,应强调多少个概率压缩为一个概率的原则。

2.3通信中的可靠性问题

上面已经谈到过通信中的可靠性与有效性是一对矛盾,具体体现在:有效性的解决措施是去除冗余信息,而可靠性则是通过在信息中附加冗余信息,对信息传输过程中产生的差错予以纠正。对可靠性问题的解决由于难度很大,本科生基本上只限于入门和了解。

首先要搞清楚的是信道码的分类问题,即,分为分组码和卷积码。二者间最根本的差别取决于冗余信息的产生是否只与本时段的信息有关。分组码技术较多,同时也较卷积码容易实现,最常见的是汉明码,信道码的几乎所有文献中都要谈到汉明码。传统的分组码译码方式是最大似然译码。实用的分组码技术是BCH和RS码,因为其纠错能力优于汉明码。至于卷积码较分组码性能更优,但码率明显偏低,如用于2G、3G的卷积码的码率均为1∕2、1∕3,明显低于分组码。卷积码的应用源于Viterbi提出了较易工程实现的算法Viterbi算法。

1993年来,Turbo码和LDPC码迅速发展起来。从本质上说,Turbo是卷积码的延伸和发展;LDPC本质上是分组码。但Turbo码和LDPC码采用了提高精确度的迭代译码。迭代译码影响了卷积码,使得卷积码实现时也采用了迭代算法。本科生完全掌握上述概念难度很大。针对信道编码应用广的特点,可由浅入深地向同学们介绍分组码的编码、译码和卷积码的编译码对有志于从事信道编码研究工作的学生是必要的。

编码技术论文篇7

关键词:多视点视频 差错控制技术 视频编码

中图分类号:TN919.81 文献标识码:A 文章编号:1007-9416(2013)02-0027-02

随着高科技的发展,电子数码技术得到高速发展,多视点视频为人们提供了更加真实和自然的视觉感觉,虽然成本价格高,但还是受到人们的青睐。多视点视频的目的是为了得到更好的时评效果,就需要在不同的视点,从不同的角度对同一场景,利用多个摄像机拍摄,这样得到的影像,就可以得到一组视频信号,这样的视频信号与传统的视频信号不同,它可以更加如实地再现场景,为观者了一个具有立体感和交互功能的视频影像,我们把这种视频称作3D 视频。在三维视频拍摄时,为了避免信息冗余差值。大都采用的是利用时间预测,空间预测和视点间的预测方法来进行防治。但这样并不能解决三维视频编码的差错问题,因为目前异构性网络还具有时变和易错等不利因素,这些因素会影响增加冗余。这些不利因素可以导致编码三维视频流对信道差错的出现。因此,只有利用对三维视频传输进行差错的控制技术,这样才能够保证三维视频编码的准确,对三维视频得效果评价就显得尤为重要。

1 多视点视频编码的现状

MPEG早于2001年专门成立了关于三维视频方面的技术研究部门,他们把研究对准3DAV的典型应用场景和标准化内容。2003年7月就提出了3DAV的需求和应用前景。在2004年受到影视业的使用,开始对多视点视频编码进行标准化的工作。到2005年开始利用MVC的编码方案,验证了MVC标准化的必要性和可行性。MVC的研究最初为了视频标准化,MVC模式是英文缩写符号,表示:模式-视图-控制器”由这三个部分组成。对MVC研究已经成为视频编码的重点。近年来,国内外相关的研究者对MVC技术的理论研究和具体应用举办过多次专题研讨,学者们发表了许多关于MVC的研究论文,在这些论文中包括对MVC的预测结构研究,对MVC的多视点视频的运动和视差补偿技术的发展和应用,对多视点视频编码的视点图像插值和颜色的校正等。我国的许多学者也对三维视频研究领域发表了许多论文,积极地开始了对MVC的研究工作,这些研究工作主要针对三维视频编码方案的设计、对视频效果颜色的校正和对画面感官视差的估计控制等方面。

2 多视点视频编码的结构

三维视频编码与单视点视频相比,其差别是很大的,从多视点视频的数据量来比较,由于三维视频编码需要多台摄像机拍摄,由于三维视频编码的数目呈线性增长。因此巨大的数据量就成为制约三维视频广泛应用的瓶颈,有研究者提出了多视点视频编码的概念。其目的主要对多视点视频进行高效压缩编码,这是提高视频通信领域质量的技术,利用视频编码应用于任意视点视频的同步拍摄,得到清晰的图像。图1就是利用多视点视频拍摄的场景和Exit序列示例。

多视点视频编码体系结构如图2所示,在这个图示中,其核心模块包括多视点视频的编码、存储/传输和解码。由摄像机阵列拍摄的N个视点的视频并行输入到MVC编码器,经编码后生成单个码进行存储或传输,解码端对输入码流进行解码后就可以恢复出多视点视频。

3 多视点视频的差错控制技术

多视点视频的差错控制技术,是为了接收数据完整性和准确的数据,这样才能够保证视频的设计结果。因为实际视屏效果总会存在这样或那样的不足。这里面的原因很多,但其实质还是由于大量的视频数据,在传输过程中可能变得紊乱或丢失。为了不使这些错误的信息丢失,就利用发送端的调制解调器对即将发送的数据执行数学运算,并将运算结果连同数据一起发送出去,接收数据的调制解调器对它接收到的数据执行同样的运算,并将两个结果进行比较。如果数据在传输过程中被破坏,则两个结果就不一致,接收数据的调制解调器就可以使对方重新发送数据。

3.1 基于分层 B 帧结构的差错控制技术

三维视频编码是根据分层B预测结构的特点,2008年Ulrich Fecker提出将三维度视频频率的处理方法是利用选择性外插算法,这种方法是将这种技术应用到多视点视频之中,它的提出适合对多视频的误码处理,利用它可以掩盖四维度频率选择性外插算法出现的问题,因为这种算法,是利用丢失宏块周围正确接收的宏块数据的一种方式,可以迅速把同一视点时域上的前后帧视频序列信息进行恢复,也可以将邻近视点的信息进行恢复,但这种方法操作程序复杂,因为要利用这种算法进行操作,需要构造一个四维正交函数,同时当使用这个算法时,由于它的复杂度较高,在实际应用时不适合实时的解码的应用。也有学者针对多视点视频中的整帧丢失问题,提出帧相似度的概念,利用这个概念,当帧相似度在不同状况时可采取相应措施对其修复,当帧相似度高于某个阀值时,也可以采用空域中参考帧,重新对视频影像丢失帧进行整帧拷贝;当帧的相似度低于某个阀值时,也可采用时域中的整帧拷贝。上述技术可以解决分层B 帧结构的差错。

3.2 基于双目预测结构的误码掩盖技术

三维视频编码的另一种结构,称为双目预测结构,这种机构是立体视频,立体视频编码可以采用传统的块基编码方法,虽然在实际应用时,块基编码来讲算法简单、稳健性高,易于硬件实现,但由于这种方法会出现块效应,如果在低比特率下重建,得到的图像主观视觉效果会很不理想。随着计算机技术的发展,基于对象的编码方法近年来引起研究者的关注,块基编码已成为替代编码方法。该编码方法能减少编码错误,有较好的视觉效果,能对场景进行结构性描述,使视觉效果更好。

在三维视频编码的立体视频中,有左、右两个试点构成,其中左视点使用运动补偿预测消除时间域上的数据冗余,右视点采用运动信息补偿来消除时域和视点间的冗余。有的研究者提出,基于互查误码恢复准则,在时域误码掩盖以及视点间的误码掩盖算法中选择一种最佳的误码掩盖算法对丢失宏块进行恢复,其中视点间的误码掩盖算法是利用了可见评判绘制工具,从左右视点中得到的正确解码的图像数据与深度数据来绘制整个丢失的彩色信息帧。

4 多视点视频联合编码方案(JMVC )

多视点视频联合编码方案,它是由MPEG和VCEG的JVT团队推出的参考编码方案,对MPEG来讲,它是运动图像压缩算法的国际标准,这一方法受到广泛的应用,现在这一方法已被许多的计算机平台支持。它的应用广泛,几乎包括MPEG-1,MPEG-2和MPEG-4的广泛应用。例如,MPEG-1已经被广泛地应用在VCD的制作,绝大多数的VCD的制作,大都采用MPEG-1格式压缩。而MPEG-2大都应用在DVD、HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面。MPEG-4是一种新的压缩算法,使用这种算法的ASF格式可以把一部120min长的电影压缩到300M左右的视频流,可供在网上观看。

利用CVS软件获取最新版本JMVC软件。输入配置后,点击获得模块列表,从中选择“JMVC”模块。对于JMVC的运行平台,可在 Windows和linux两种平台上运行。在Windows平台的相应工程文件在目录JMVC\H264Extension\build下包含一个 H264AVCVideoEncDec.sln工程,即JMVC的工程文件,用Microsoft Visual 的编译器打开。该目录下包含一个VC6的工程文件H264AVCVideoEncDec.dsw,但该版本未经更新,不建议使用。

5 结语

多视点视频使人们喜欢的真实和自然的视觉感觉,因此提高多视点视频的质量,利用高科技手段发现和解决多视点视频编码的错误,对多视点视频的提高具有重要的历史意义。因此,在多视点视频编码中,利用高效率的压缩编码技术,不仅可以去除大量的信息冗余,而且可以修复由于网络拥塞等丢包后果的修复变得简单易得,显然,差错控制技术的提高发展和应用显得愈发重要。当然,至今,多视点视频编码技术还在发展中,对其易发错误的研究还较少,相信未来对视点视频的发展一定会得到丰厚的回报。

参考文献

[1]杨文成,郁梅,傅松寅,李福翠 等.多视点视频编码中的码率控制技术研究[J].二届亚太地区信息论学术会议论文集.国际会议,211-11-04.

[2]羊飞帆.视点视频编码方案及其差错控制技术的研究[J].科技传播.2012-11-23.

[3]邓智玭,贾克斌,陈锐霖 等.多视点视频编码中的运动和视差估计快速算法[J].北京工业大学学报.2011-05-15.

编码技术论文篇8

关键词: H.264标准;视频压缩;视频编码

0 引言

以数字视频的采集、压缩、处理为核心的现代视频监控技术,采用先进图像处理芯片对视频进行压缩处理,把智能图像处理技术用于图像显示、监控成为嵌入式视频监控系统的重点研究方向[1]。无论是MPEG1、MPEG2或者是MPEG4、H.263都已经无法满足运动图像压缩的要求,这时新一代的H.264标准便被制定,H.264作为新一代的编码方式,有效提升了视频压缩率,仅需原先的一半带宽即可播放相同质量的视频,而且视频编码的码率更加灵活,架构主要包括,帧内预测、帧间预测、转换、量化、去区块滤波器、熵编码等模块,下面将研究H.264视频编码的关键技术及其应用前景。[2]

1 H.264压缩标准

H.264是两个组织专家ITU-T和ISO为多媒体传输设计的数字视频编码标准[3],全称是MPEG-4AVC,翻译成中文意思是“活动图像专家组-4的高等视频编码”,或称为MPEG-4Part10。各种分辨率的视频图像格式都可以被H.264视频编码标准支持,包括sub-QCIF、QCIF、CIF、4CIF、16CIF等[4]。H.264是一种视频压缩标准,同时也是一种被广泛使用的高精度视频的录制、压缩和格式。H.264比其他编码标准有着更高的视频质量和更低的码率,被广泛用于网络流媒体数据、各种高清晰度电视陆地广播以及卫星电视广播等领域。H.264的特点是能低码率、高清晰持续提供较高的视频质量,能大大加强图像的编码效率和改善图像数据在网络中的传输效率。[1],使网络更加灵活、适应性更强,最大的好处就是节约了成本,弥补了技术差距,让存储与视频管理变得更高效。

2 H.264编码器的结构和特点

H.264只是规定了输入码流的格式及编码之后输出比特流的句法结构,其标准的编码思路是混合编码模式,以帧间和帧内预测来清除空间和时间的冗余分量,用变换和量化编码来清除频域冗余分量。H.264视频编码在一定情况下提高了视频压缩编码性,其视频解码与编码实现的过程相反,依据帧内编码进行逆量化,反变换,重构帧,最后经块滤波器平滑滤波后得到重建图像,[1]H.264编码器的功能组成框图如1。

3 H.264编码器关键环节分析

3.1 帧内预测 比起H.263,H.264提供了更多不同的工具来降低码率,以编码单位来说,h.264中每个宏块(macroblock/mb)大小都是固定的16×16像素,能够实现高分辨率视频的压缩,对于帧间编码来说,它允许变换块的大小根据运动补偿块的大小进行自适应的调整;对于帧内编码来说,它允许变换块的大小根据帧内预测残差的特性进行自适应的调整。

3.2 帧间预测 H.264标准与早期标准不同之处在于,它所使用的是块结构运动补偿,运算精度精确到1/4像素点上。[8]不仅如此,H.264标准还使用了多帧预测的方法,能够明显改善预测增益。[5]

3.3 整数变换与量化 H.264中整型变换与之前的MPEG系列标准所采用的DCT变换都有区别:

①它是整形变换(所有的操作都为整数运算,不存在解码精度损失)。②用整数算术变换可以确保编解码之间实现零失配。③变换的核心运算部分只用到加法和移位运算,不需要乘除运算。④到量化器的缩放乘积因子为整数,减少了乘积因子的数据位数。[4]量化的目的是减小信号的值域,以更少的比特来表示信号,从而达到减少数据量的目的。H.264中量化的步长总共有52种,其按照12.5%递增,并且变换系数的读取有双扫描和之字形两种方式。

3.4 熵编码 熵编码是对数据的冗余信息进行压缩的方法,变长编码和Huffman编码相结合进行,以较短的字长表示出现概率较大的数据,较长的字长表示出现概率较小的数据来达到降低数据量的目的。

CAVLC是一种变长编码。先对变换系数进行zig-zag扫描。用行程码(L,V)表示扫描以后的数据,V代表数值,L代表该数出现的次数。因为视频块在整形变换和量化后,大部分变换系数成为0,只有很少的数据在低频部分,用行程数L代表连续出现的0的个数,V代表0串后挨着的非零值,接着对L和V分别采用Huffman编码进一步压缩,有不同的码表可以查询亮度块和色度块。行程编码大大降低了编码的码字字长。CABAC是一种二进制算术编码,其通过构建模型来预测当前的视频信号。相对于CAVLC编码,CABAC的编码效率更高,更节省码率。[4]

3.5 码率控制 H.264视频编码标准虽然对于编码器的结构实现模式没有具体的规定,但编码器实现的核心问题要解决编码器的结构、相应的视频编码如何控制。H.264编码器采用基于拉各朗日Lagrangian优化算法的率失真优化模型实现视频编码的控制,其实现方法简单而且效率高。[5]

H.264编码标准由于以上关键技术的支持,获得了较高性能编码,但编码器复杂度增加,约为MPEG2的4倍,MPEG4的2倍。其高复杂度原因有两个方面,一是编码选项复杂,二是计算量高。具体内容有宏块的划分及搜索模式的组合的选取、高精度亚像素运动补偿和多参考顿预测,H.264更细化,更精确的数据压缩导致了计算量高。[6]

4 应用前景

H.264作为一种具有高效压缩性能的视频压缩编码技术,其在制定的过程中就充分参考和吸收了H系列和MPEG系列的优秀研究成果,修改或重新制定了其中不合理的部分,使其有很好的压缩性能。H.264能够比H.263和MPEG-4大约省去50%的码率。[7]H.264的高效的视频压缩能力和优异的网络适应性,为视频数据传输的可靠性提供了保障,其可广泛应用于数字摄像、英特网、数字视频录像、DVD及电视广播等领域的图像压缩。

5 结束语

网络视频监控系统要达到良好的监控效果,仅提高摄像头的分辨率是不行的,只有通过改善数字视频的压缩技术,降低视频传输的误码率,提高视频的质量,才能推动网络视频走向智能化。[1]H.264标准的推出是视频编码标准的一次重要的进步,尽管其算法复杂,但是能够大幅度提高编码效率,使得应用范围更加的广泛。

参考文献:

[1]李红京.基于H.264视频压缩技术的网络视频传输系统设计[J].河北工业科技,2011,28(4):236-239.

[2]齐淋淋,向健勇,唐巍.H.264视频压缩关键技术及其应用前景[J].电子科技,2005(10)13-16.

[3]党晓军,尹俊文.基于H264的嵌入式视频监控系统研究[J].计算机技术与应用进展,2008:407-412.

[4]刘继红,孙海龙,屈鹏.TD-MBMS中H.264视频压缩的实现过程[J].信息通信,2008,4:14-16.

[5]牛建民.H.264视频压缩算法应用研究[M].同济大学工程硕士学位论文,2007,5.

[6]蒋文倩.基于H.264视频采集与无线传输系统的设计与实现[M].武汉理工大学硕士学位论文,2013,3.

推荐范文
推荐期刊