用户名: 密码: 验证码:           网站地图  高级搜索  RSS订阅  收藏本站
您的位置:主页>视频应用>MPEG/MPEG4区>

[mpeg技术]视频通信中MPEG-4的误码弹性

[ 来源: | 更新日期:2006-1-3 16:02:00 | 评论 0 条 | 我要投稿 ]
  随着多媒体系统和无线移动通信先进技术的发展,对各种多媒体业务的支持需求日益增长,如利用移动多媒体技术实现移动电话会议、远程医疗、移动TV,远程教学等。由于MPEG-4提供的高压缩效率及其差错恢复性能,广泛的应用与无线网络通信,而MPEG-4编码的视频数据,由于采用了VLC和时域预测,对误码是非常敏感的。当遇到差错时,VLC使得解码器很容易丢失与编码器的同步,时域预测使得重组视频中的差错会在后续视频帧中扩散,因此需要采用各种差错恢复技术,来减少比特流中的误码,当然这需要付出增加的比特开销。

  一、MPEG-4关键技术

  在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在以下缺陷。

  (1)将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应; 字串4

  (2)不能对图像内容进行访问、编辑和回放等操作;

  (3)未充分利用人类视觉系统(HVS,Human Visual System)的特性。

  MPEG-4除采用第一代视频编码的核心技术,如变换编码、运动估计与运动补偿、量化、熵编码外,还提出了一些新的有创见性的关键技术,充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。

  1、视频对象提取技术

  MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。尽管MPEG-4 框架已经制定,但至今仍没有通用的有效方法去根本解决视频对象分割问题,视频对象分割被认为是一个具有挑战性的难题。

  目前进行视频对象分割的一般步骤是:先对原始视频/图像数据进行简化以利于分割,这可通过低通滤波、中值滤波、形态滤波来完成;然后对视频/图像数据进行特征提取,可以是颜色、纹理、运动、帧差、位移帧差乃至语义等特征;再基于某种均匀性标准来确定分割决策,根据所提取特征将视频数据归类;最后是进行相关后处理,以实现滤除噪声及准确提取边界。 字串7

  2、VOP视频编码技术

  视频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样,VOP是MPEG-4视频编码的核心概念。MPEG-4在编码过程中针对不同VO采用不同的编码策略,即对前景VO的压缩编码尽可能保留细节和平滑;对背景VO则采用高压缩率的编码策略,甚至不予传输而在解码端由其他背景拼接而成。这种基于对象的视频编码不仅克服了第一代视频编码中高压缩率编码所产生的方块效应,而且使用户可与场景交互,从而既提高了压缩比,又实现了基于内容的交互,为视频编码提供了广阔的发展空间。

  3、视频编码可伸缩性技术

  视频编码的可伸缩性(scalability)是指码率的可调整性,即视频数据只压缩一次,却能以多个帧率、空间分辨率或视频质量进行解码,从而可支持多种类型用户的各种不同应用要求。

  MPEG-4通过视频对象层(VOL,Video Object Layer)数据结构来实现分级编码。MPEG-4提供了两种基本分级工具,即时域分级(Temporal Scalability)和空域分级(Spatial Scalability),此外还支持时域和空域的混合分级。每一种分级编码都至少有两层VOL,低层称为基本层,高层称为增强层。基本层提供了视频序列的基本信息,增强层提供了视频序列更高的分辨率和细节。 字串3

  在随后增补的视频流应用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精细可伸缩性)视频编码算法,FGS编码实现简单,可在编码速率、显示分辨率、内容、解码复杂度等方面提供灵活的自适应和可扩展性,且具有很强的带宽自适应能力和抗误码性能。但还存在编码效率低于非可扩展编码及接收端视频质量非最优两个不足。

  二、MPEG-4误码弹性(error resilience)工具

  MPEG4视频标准也包含几个差错恢复工具,来提高信道差错下的性能。

  1、数据分割

  由于视频数据参数的差错敏感度不同,可将视频数据分成两部分来提高MPEG-4的差错健壮性。每个视频分组(VOP)的轮廓和运动数据放在第一部分,相对敏感度较低的纹理数据(AC TCOEFF)放在第二部分。分割两个部分的再生同步码,在INTER VOP中称为运动标志,在INTRA VOP中称为DC标志。当差错不敏感的第二部分纹理数据发生一些比特差错时,视频解码器可存储视频分组中无差错的运动和轮廓数据。也就是说,可成功隐藏第二部分的差错,仅会有轻微的视觉失真。由于纹理数据组成了VOP的主要部分,数据分割允许分组的主要部分出错,仅对视频质量有轻微影响。 字串5

运动矢量比纹理数据对差错更敏感,轮廓数据对面向对象视频编码差错健壮性的影响还需确定。当纹理差错隐蔽较好时,运动和轮廓数据的隐蔽会使得图像失真较大。当序列运动量大,帧间的视频内容会变化较大,也使得在解码端很难实现隐藏。若比特流误码率不高,纹理数据的损伤对可视失真影响很小。

  2、FEC中的RCPC(速率兼容的收缩卷积码)

  速率兼容的收缩卷积码(RCPC码)用于多速率信道的差控。此技术必须伴随高速反馈信道指示机制,根据网络状态动态更新编码器。卷积编码器以仅发送母码开始而不加保护位。如果FEC解码器由于出错不能解释母码,那么就通过反向信道通知编码器,从而相应提高保护率。四个寄存器的卷积编码器可提供四种不同速率,编码器先设定的速率为1作为起始,再按需要来降低速率。对降级的信道条件,信道编码器必须为输出信号分配较大数目的保护比特,以增强信道解码器的纠错能力,然后速率保持逐渐降级,直到解码器能维持无检测差错重构母码比特为止。当已达最后速率而解码器仍未能纠正差错信号时,解码器就剔除当前像块而转向下一个像块。因此,卷积编码器的速率依据纠正损坏比特的能力而变化,所需速率越高,为获得较好的差错保护而对输出信号添加的冗余比特就越多。这种多速率的差错保护编码被称作截断码。RCPC技术主要用于延迟敏感的视频应用,由于反馈信息和对损伤信号的重传可能会引入过多的时延,对实时应用不是很适合。RCPC和反向信道指示经常组合使用,来实现MPEG-4标准的差错弹性恢复。 字串9

  3、AIR(自适应INTRA帧更新技术)

  AIR是MPEG-4标准中Annex E所规定的技术,与对VOP中所有MB进行统一的INTRA编码的循环INTRA更新(CIR)截然不同,它包括在每个VOP中发送限定数目的INTRA宏块。AIR进行INTRA编码的宏块数远远少于每VOP或每帧的总宏块数。根据通过标记运动宏块位置得到的更新映射图,AIR对每帧中固定和预定的宏块数目,有选择地进行INTRA编码。通过对MB的绝对误差和(SAD)与其门限值(SADth)进行比较,来得到运动估值,SAD是通过MB和在先前VOP中空间相应的MB间计算得到,SADth是先前VOP中全部宏块的平均SAD值,如果某一宏块的SAD超过了SADth,编码器就判定该MB属于高运动区域,也就是对传输差错敏感的区域,从而标志该MB要进行INTRA编码。如果标志INTRA编码的宏块数超过了设定的数目,那么视频编码器就以垂直扫描方向下移帧来编码INTRA MB,直到预定数目的MB被INTRA编码。对于下一帧,编码器从相同的地方开始,并对INTRA宏块开始编码,包括在先前帧中标志要进行INTRA编码的宏块。编码宏块的数目要基于视频应用需求的比特率和帧率来确定。然而,为了提高差错健壮性,宏块的数目可以根据每个视频帧运动特征来动态调整。由于图像运动区域通常以INTRA模式编码,就可能快速更新损坏的运动区域。
字串7


[color=red'][1][/color] [2] 下一页



Tags:
责任编辑:
您的评论
用户名:新注册) 密码: 匿名评论 [所有评论]