H.261视听通信编码、解码标准
出处:按学科分类—工业技术 企业管理出版社《工程师手册》第962页(1786字)
国际电报电话咨询委员会于1988年针对可视通信的需要,提出电视电话/会议电视H.261建议,即P×64Kbps视频编码/解码标准,并于1990获得批准。标准中P是一个可变参数,取值为1~30。P=1或2时,仅能支持桌面上的面对面直观通信(即64Kbps或128Kbps);当P≥6时,支持通用中间格式每秒帧数较高活动图像的电视会议。由于位率的提高,复杂的画面能传送出去,画面质量也得到改善。
P×64Kbps视频编码压缩算法,是采用混合编码方案,即基于DCT的离散余弦变换编码方法和带有运动预测的差分脉冲编码调制(DPCM)编码方法的混合。P×64Kbps标准的压缩算法与上节所述的MPEG压缩算法有许多共同之处,只是传输速率P×64Kbps覆盖较度的信息道频带(当P取值不同时即速率不同),而MPEG是基于较窄的频带上传输。
1.P×64视频压缩编码算法
P×64Kbps视频压缩编码方案,包括信源编码和统计编码(熵编码)两部分。信源编码采用有失真编码方法,又分为帧内编码和帧间编码两种情况。
帧内编码算法,一般采用单一性的基于DCT的8×8块变换编码方法。8×8块的DCT系数经线性量化,经视频多路编码器进入缓冲器,通过掌握缓冲器的空、满度,改变量化器的步长来调节视频信息比特流,与信道传输速率匹配。帧内编码的结果,送到视频多路编码器,经解码后重建图像存入缓冲区以备帧间编码时使用。
帧间编码采用混合编码方法可减少时域的冗余信息。DPCM编码方法是对当前宏块与该宏块的预测值的误差进行编码。当误差大于某个确定的阈值时,对这些误差进行DCT变换、量化处理,然后和运动矢里信息一起传送到视频多路编码器,必要时可使用循环滤波器,滤掉高频噪音,以改善图像质量。熵编码是利用信号的统计特性来减少比特率。熵编码的具体编码过程在JPEG、MPEG算法中已提到过,这里不再赘述。
2.视频数据结构
P×64Kbps视频编码标准中一个重要的任务是定义一个视频数据结构,以保证解码器对接受到的比特流(位流)进行无二义性的正确解码。在P×64算法中,CCITT视频编码格式(Quarter Common Intermediate Format即QCIF)的一帧图像,以四个层次数据结构来表示如下:
(1)图像层——包含图像头和三个数据块;
(2)块组层——每个块组包含块组头和3×11个宏块;
(3)宏块层——包含宏块头和4个8×8亮度块和两个8×8色度块;
(4)块层——含有块的DCT系数,其后是一个定长码EOB,以标志块结束,DCT系数利用二维VLC编码。
3.图像质量的比较
H.261标准视频编码算法包括的位率(比特率)范围相当大,适合各种各样实时视觉应用。如果使用的位率不同(P不同),则运动效果和图像质量也不同。通过比较可以看出,当位率提高时,画面质量就改善。
为了提供普遍适用的P×64Kbps视听设备,需要有如下四种因素做保证;
(1)全球范围的ISDN;
(2)先进的视频压缩技术;
(3)低成本VLSI技术;
(4)国际化视频编码标准。
随着上述四个条件逐步可行,在ISDN上的可视电话将会很快成为现实。