蓓蓓主持人老公是谁:MPEG-I解码器是用来干嘛的?

来源:百度文库 编辑:中科新闻网 时间:2024/05/04 22:10:59
什么时后才用它?

MPEG在决定数字视频产品的开放标准方面一直处于领先地位。创建于1988年的国际标准化组织(ISO)工作组先后在1992年和1994年提出了MPEG-1和MPEG-2作为数字视频的国际标准。其中MPEG-1规定了活动图像及其伴音的数字数据的编码、存储和检索以及数据流压缩率等标准。MPEG-2则力求取得更好的分辨率,它主要用于数字视频广播、DVD和HDTV等应用场合。MPEG-4延续了上述两者积累的经验,并联合了几十个国家的科技精英,集许多专利技术在一起,完全弥补了上述两种标准的不足之处,它以完整的对象为图像处理目标,更多地强调多媒体通信的交互性、灵活性和编码的高效性,广泛应用于因特网、无线传输与广播、卫星传输与直播、数字电视、移动多媒体通信、交互式多媒体和低码率/高效率的高质量AV服务等领域。它于1993年就开始进行标准制定的准备工作,1998年正式通过了版本1,一年多以后又通过了版本2。之所以花那么长的时间,是由于MPEG-4是一种庞大、复杂的标准,其各方面的特色需要用一本厚厚的书来综述。但由于其利益牵涉到方方面面,尤其是使用MPEG-4专利技术的授权问题曾经历了多次反复,不少从事MPEG-4的软件开发商无法进行其实际产品的开发。直到2002年1月31日,MPEG一站式服务的授权管理机构MPEG LA(Licensing Authority)终于向媒体发布了统一的授权办法和概括了MPEG-4标准中的两个主要档次的授权项目新闻稿,结束了长期以来光说不练的局面,完成了MPEG-4从构思理念到标准制定,又从制定的标准转而推出实际MPEG-4产品的两次飞跃。

本文综述和比较了最近推出和正在开发中的几款MPEG-4编解码器的性能,并用几种MPEG-4播放器测试验证了这些编解码器的实际性能。由于测试均通过使用此前发布的软件进行的,因此无法公布这些编码器的具体得分。但通过对这些编解码器的测试性能综述,用户可全面了解当前MPEG-4的总体情况和开发中的潜在问题。

一、档次和等级

上面已经说过,MPEG-4标准本身非常庞大复杂,其各种特色涉及到几百种具体规范,但对某一种具体应用来说,其涉及的范围相当小,它只是其庞大功能整集中的一个子集,因此可以用档次(Profiles)和等级(Level)来具体规定其功能范围和数值大小。档次是指对特色和功能在性质上的制定,而等级则是指在同一档次内其功能在数量上的复杂程度。有了这种档次与等级的分类方法,MPEG-4标准就可以规定具体编解码器哪些该处理、哪些则不该处理的内容。只要遵循这些规则,任何符合规定的器件,不管是计算机软件、手机还是机顶盒,都可以正常工作。

因特网串流媒体联盟ISMA(Internet Streaming Media Alliance)是由Apple、IBM、Cisco、Kasenna、Philips和Sun等公司组成的联合团体,其宗旨是提出一个为MPEG-4使用的标准,这一标准有可能成为重要的开放式通用标准。ISMA提出的初步标准为档次0和档次1,前者主要用于窄带网,后者则用于宽带网。但目前非ISMA成员的Microsoft和RealNetworks尚未表态支持ISMA档次,RealNetworks只是从ISMA成员Envivio获得MPEG-4回放工具的授权,而Microsoft的Windows Media播放器还不能提供任何支持MPEG-4文件格式和数据流的任何MPEG-4回放能力,而且也没有公开表示准备添加这一能力。Apple则宣称准备在QuickTime的下一版本中支持ISMA档次中的0和1,但由于MPEG-4的授权问题,目前尚未有任何进展。
表1列出了按档次与等级分类的各种档次及每一档次中的各种等级,用来传送MPEG-4的各种视频信息。

表中CIF代表普通图像格式(Common Image Format),其中QCIF为176×144,CIF为352×288,2CIF为352×576,4CIF为720×576像素。

1. 简单档次。是迄今为止最普通的档次,它对开发商来说即使在移动设备上也是最容易实现和解码的,它可用于低功率器件的视频录制。简单档次中的等级1相当于ISMA标准中的档次0,而等级0的极限帧率为15fps,其他档次的极限帧率均为30fps。简单档次对低功率的移动通信器件来说可能是最重要的档次,因为主流产品制造厂家由于要考虑较高的图像质量,可能不会选择简单档次而选择高级简单档次。

2. 高级简单档次。是简单档次的超集,因此它可处理全部简单档次的内容。高级简单档次加进了许多增强措施来支持更好的视频质量,这些措施有B帧、全局移动补偿(GMC)和1/4像素移动估值。高级简单档次的等级3相当于ISMA标准中的档次1。希望高级简单档次能成为台式计算机、机顶盒和其他高功率器件的第一个主流MPEG-4视频档次。

3. 简单可定标档次。它只是在简单档次的基础上加一增强层,使服务器能通过降低图像质量、帧率或分辨率等手段来动态地降低码率。PacketVideo是目前推出简单可定标档次创作工具和播放器的唯一公司。

4. 精密可定标档次(FGS)。采用现有的简单档次和高级简单档次的全部内容并添加多级带宽以便取得比简单可定标档次有更高的质量。但本文综述的七种编码器目前还无一能支持FGS。

5. 核心档次。它是在简单档次的基础上加上B帧和1比特形状编码而形成的,它支持实时掩蔽功能,透明度掩蔽本身在整个图像范围内都是相同的。同一档次中的两种等级都给予CPU留有足够的附加能力用来同时处理屏幕上的多重重叠目标和视频图像。

6. 核心可定标档次。它增加了可变帧率和分辨率,这种多码率(MBR)带宽的减缩可便于服务器将视频信号的数据率与所连接线路的速率统一起来。

7. 主档次。它的目标在于交互式广播,因而支持隔行扫描的视频信号。广播电视台所谈到的交互式MPEG-4的未来时,指的就是主档次。主档次中的最高等级可用来取代现有的DTV系统用于HDTV传输。主档次中没有等级1,因为主档次并非设计用来作低码率传输的。目前,Envivio和iVast两公司都已拥有编码工具和播放器,可支持主档次的先进特色。

二、MPEG-4编解码器的测试方法

测试的7种编解码器每种都对4种不同的图像源片段(如图1)进行压缩处理。图1a为一段电影图像,图1b为一段谈话人的人头图像,图1c为一段移动图形,图1d为一段高速移动图像。每一图像源片断的长度均为60秒,且不包括音频信号,然后对各个编解码器的性能进行评估。

电影图像测试片段由各种24fps的逐行扫描组成,它提供有黄金时间的戏剧、故事片和其他拍摄得很好的电影连续镜头,它们具有典型的帧率和图像的复杂程度 ;谈话人头图像测试片段是一段未经剪辑的连续图像,很便于压缩,因此是判定编解码器将基本帧和增量帧之间质量匹配能力的一种优良测试材料 ;移动图形测试片段包括一系列越来越复杂的移动图形动画片,用来测试编解码器的彩色保真度和处理复杂移动动作的能力,因为对编解码器来说,要处理好滚动的文字特别困难 ;高速移动图像测试片段是用快速移动、快速剪辑和复杂构图来考验编解码器的响应能力,看它是否能对这种特别困难的图像源仍然能保持正确的数据率。

每种编解码器的压缩工具均能支持不同的输入文件类型,绝大多数能接受AVI,但普遍不能接受YCrCb 4 : 2 : 0的格式,因此全部图像源片段都应事先准备成未压缩的RGB AVI文件,以便于读取数据信息。

测试中选择了三种目标数据率和分辨率组合作为统一的测试标准 :

1. 30kbps和176×144像素。电影图像测试片段的帧率为8fps,其他三种像源均为10fps ;
2. 200kbps和320×240像素。电影图像测试片段的帧率为24fps,其他三种像源均为29.97fps ;
3. 800kbps和640×480像素。电影图像测试片段的帧率为24fps,其他三种像源均为29.97fps。

上面选定的三种目标数据率和分辨率组合主要是模拟典型的压缩视频传输的几种常用选项,其中30kbps的数据率归属于ISMA的档次0,用于移动通信器件 ;200kbps的数据率是典型的保险数据率,其目标主要用于如DSL(数字用户线)和电缆调制解调器等领域的宽带连接 ;800kbps和640×480的数据率已超出ISMA的档次1的参数范围之外,并不是所有的MPEG-4播放器和编解码器都能支持它,但它是对编解码器和播放器高质量传输能力的最佳测试组合。
虽然各种编解码器自身的缺省压缩设置值是不同的,但在测试中还是设法尽量使它们统一标准化起来。在所有情况下,将这些编解码器均设置在其最高质量的模式下,即使这样做可能会导致较长的压缩时间。如果这是一种可选用的方案,则采用二次通过法的编码方案来进行压缩。这里要强调的一点是为了保证图像质量,在必要时可用一些帧率保留量。如果要对移动搜索值进行规定的话,则可将32像素用于30kbps 176×144和 200kbps 320×240的样值,将64像素用于800kbps 640×480样值。在绝大多数情况下,每隔10秒插入一帧基本帧。如果该种工具不支持10秒,则插入基本帧的时间分隔可取该种工具所能支持的最长时间值 ;对于以简单档次和高级简单档次文件两者为目标的编解码器,则对两者分开编码。编解码器提供高级简单档次文件的特色也不相同,有的只加B帧,有的包含有1/4像素移动估值,有的则不能确定其精确算法。

如果一种编解码器能够对下载和串流提供优化的模式——典型地称作VBR(可变码率)和CBR(恒定码率),则就对这两种模式均进行编码。只有在VBR的实施办法中不能提供数据率的两个划定限值时才不进行VBR编码。

三、七种编解码器的测试综述

先对参加评估的几种编解码器作一些说明。这次评估的MPEG-4编解码器有些目前仍处在继续开发阶段,撰写本文和用户拿到实际产品时,其实际情况可能与本文介绍的有相当大的出入。另外,有些编解码器正在争取全方位的授权事宜,但可以肯定的是 :本文的介绍都是以截止到撰写本文时的MPEG-4编解码器的现状为依据的,并提出了需要开发商加以解决的问题,或由潜在用户检验并确定需要予以解决的问题清单。此外,Apple的QuickTime b可能已包含了其自己的编解码器,只等授权问题的解决,因此不在这次综述范围之内。

1. Avipix的MP4Creator。它是Avipix公司生产的几种MPEG-4工具之一,这是一种简单地用鼠标进行拖拉拾放操作的MPEG-4编解码器。目前这种编解码器及其接口仍处于开发过程中,从其已发行的版本来看,还看不到其版本号,它仅能支持简单档次文件。但该公司打算在近期推出支持核心档次的产品。MP4Creator提供的几种压缩模式均可用于顺序下载和串流信号,并具有全套典型的MPEG-4编码特色。

MP4Creator在移动目标的后面留有明显的拖尾,特别是在移动图形测试文件中更为明显。其输出帧率是固定的,数据率很正确。

2. Dicas公司的Mpegable编解码器是能最完整地支持简单档次和高级简单档次的工具。在其编解码器版本1.2.b的全部模式中,提供有一种快速、素描质量的绘图处理器,但它未用于最终测试中 ;还提供有在场景发生改变时能自动插入基本帧的功能,此功能在最终测试中很有用 ;还有B帧,用于高级简单档次模式。

Mpegable还拥有几种差错恢复工具以及能提供压缩文件的信/噪比报告,这是一种很有用的近似数,用来表明压缩瑕疵的严重程度(如图2)。Mpegable允许在两个I帧之间插入的最大帧数为200。

测试中使用的版本,其高级简单档次设置值不支持该档次的关键特色之一 ——全局移动补偿功能,但该公司披露在下一版本的产品中将会具备。从测试结果来看,用Dicas高级简单档次进行压缩的文件并没有显示出比用Dicas简单档次进行压缩的文件有重大的质量改善之处。

3. ivastEncode是iVast公司许多MPEG-4的产品之一,它是通过若干配置文件和若干命令行来控制的,因此使用起来非常不方便。但编解码器软件中具有GUI(图形用户接口)前端是一项非常有用的特色。到撰写本文为止,iVast编解码器的1.5.0.8版支持简单档次和高级简单档次中的B帧特色,而iVast公司的其他MPEG-4产品则将重点放在提供交互性和丰富的主档次媒体特色。

在压缩测试中,iVast的工具大大超越了某些30kbps片断的目标数据率,但该公司并不想将其重点放在移动通信器件的市场方面,目前iVast正集中精力于高带宽的传输方面。

4. Ligos的GoMotion。Ligos是一家长期从事于MPEG开发的公司,GoMotion是一种可获得授权的软件开发套件(Software Development Kit, SDK),如图3,用于能制作许多MPEG格式,包括MPEG-1、MPEG-2和MPEG-4的多种应用场合。Ligos公司根据其最近的开发版GoMotion SDK用来提供一种示范性的变换编码应用。

GoMotion 6.0目前只支持简单档次,但Ligos表示即将增加对高级简单档次的支持。

GoMotion 6.0可用来规定等级并校验设置情况以确保这些设置情况与选定的等级相一致,这是一项非常受欢迎的特色。它还可以用来规定移动搜索的范围。

“不受限制的移动估测”和“高级预测”是GoMotion拥有的两种改善质量的模式,但代价是要放弃一些速度,在这次压缩测试中就使用了这两种模式。

GoMotion不能编制高于352×240像素的文件,测试中使用的文件结构设置成至少每64帧插入一个基本帧,但这样做对最终的质量并没有很明显的效果。

总的来看,Ligos公司的GoMotion对于简单档次的编解码器来说有非常好的质量,并能生成在测试的七种编解码器中最具兼容性的MPEG-4文件。在很多情况下,它大大地超过了目标数据率,这对其较高的质量起了很大的作用,但在使用规定的数据率时其质量较低。

5. PacketVideo的PVAuthor 3.0。PacketVideo是历史最悠久的MPEG-4公司之一,它的PVAuthor 3.0是非常成熟的编码工具,其目标是将串流技术应用于移动通信器件。因此PVAuthor及其相伴的PVPlayer是这次测试中支持MPEG-4的简单可定标档次的唯一工具(如图4)。简单可定标档次能使服务器进行自动带宽的协调,这是实时Web上串流技术的一种很重要的特色,希望将来的ISMA档次能增加对简单可定标档次的支持。另外,PVAuthor还能建立简单档次文件,CBR文件用于串流,VBR文件用于顺序下载。

PVAuthor无法建立比简单可定标档次中最高分辨率384×288像素更高的编码文件,因此无法生成640×480分辨率的测试文件。

PVAuthor可提供比其他编解码器更佳的图像质量,但有时在维持图像质量和数据率的编码过程中会发生丢帧现象,因此希望能提供可使图像质量滑动的模式以保持一定的帧率。

6. Philips的WebCine是第一个投放市场的商用MPEG-4压缩产品,其WebCine 1.1版是一台基于Windows的完整配置好的双处理器编码工作站,它可用来作以文件为基础的编码,也可以进行现场编码,并可以通过包括Matrox DigiSuite LE在内的硬件进行广播。

WebCine是使用的测试工具中最为陈旧的,而且其生成的文件存在最大的互操作性问题。据Philips公司说,这些问题将在更新后的编解码器中予以解决。WebCine的质量介于中间状态,其编码的图像细度优于某些其他编解码器,但在高速移动的图像测试中留有明显的拖尾。

7. Sorenson公司的Media MP4是一种超前的MPEG-4编解码器,其作为出口商品的模块可以在QuickTime下运行,它是由该公司的视频编解码器(SV Codec)的原型机和其Squeeze压缩工具发展而来的。MP4于2002年夏季投放市场,并与它的Squeeze工具一起使用,它是该公司除Apple在Mac操作系统下运行的MPEG-4方案之外的唯一的另一种MPEG-4编解码器。Sorenson公司声称即将推出能在Windows下运行的新版本。

Media MP4这款MPEG-4编解码器可提供许多特色,包括自动插入基本帧的灵敏度是可以选择的。还有快压缩模式并能支持H.263(国际电联制定的一种会议电视标准)中MPEG-4的基准子集。虽然MPEG-4的所有档次对这一点并未作出什么要求,但这种子集压缩比全部MPEG-4档次更加快速,并有利于与原有的会议电视格式的互操作。

从总体上看,Media MP4的图像质量很好,但它在试图运行其目标数据率时会发生大量丢帧现象,这种现象除了图1b的头像测试片段外,其他所有文件在测试时均发生过,即使将编解码器的最低质量门限设置为零也是如此。Sorenson公司声称这些问题将会在其最终发行时获得解决。其实这种说法还不如提供另一种选项 :允许较低的图像质量以保留合适的帧率,这在其他编解码器中也是这样做的。

表2是七种编解码器的MPEG-4编码特色的比较。

注 :第二栏编码速度是指对预处理后图像源的320×240个样值进行编码的平均秒数。编码是在专业的双处理器1GHz奔Ⅲ工作站运行Windows XP时进行的,只有Philips的编解码器是个例外,它在WebCine双733MHz奔Ⅲ工作站上进行。

四、播放器(软件)

目前MPEG-4播放器用于台式计算机上的比用在编解码器中的为少,但前者的使用会越来越多,在2002年能见到支持ISMA档次1的全部主要媒体播放器。

当前的播放器软件,除了PacketVideo公司的PVPlayer播放器外,都没有提供文件说明哪家的播放器能支持的档次与等级分类法,因此还不清楚有哪些缺陷或播放那些规范之外的文件是否会引起互操作问题。现在的主要播放器只有下列4家公司提供 :

1. Dicas的Mpegable播放器2.0版。它的表演工具成分多于实际使用于最终用户的成分,它可以让你选择程序分块和减抖后滤波模式,以便预看文件用不同特色时的播放效果。程序分块模式可大大改善外在质量。

2. Envivio有播放器插件。它在Mac机上可用QuickTime工作,在Windows下可用RealOne工作。测试组曾对下一版本RealOne插件提前发行的产品进行了测试,结果发现这一插件的兼容性最好。它虽然没有提供任何配置特色,但当它以较低分辨率运行时具有自动后期处理功能。

3. PacketVideo的PVPlayer。它的目标市场是在移动通信器件上的回放功能,但它也有基于Windows播放器的3.0版,以便开发人员可看到他们创作的内容与效果。这种播放器只能使用PacketVideo文件以及与普通适用的Ligos和WebCine简单档次图像源一起工作。

4. Philips的WebCine播放器。是第一个顺利可用的MPEG-4播放器,它现在的版本1.1e推出已有一段时间了,但它存在互操作问题(见表3),Philips公司声称即将推出的更新版将会解决这些问题。

表3是4家公司播放器的兼容性矩阵表。这表的根据是最新推出的MPEG-4编解码器版本和在2002年冬季前推出的播放器综合得出的。表3表明,虽然MPEG-4是一种标准,但对标准不同的解释意味着今天并不是所有的MPEG编解码器可以与所有的MPEG-4播放器协同工作。

五、MPEG-4编解码器小结

经过9年的开发研究,现在已从令人感趣的理念最终转向实际产品。至2002年底,范围广阔的MPEG-4媒体分布实际解决方案拿出来了,虽然在这次测试比较过程中只看到了许多大致的眉目,但目前的一些研究工具和播放器成果已预示着这一产业的光明前景。

但目前的MPEG-4编解码器中,性能最好的也比不上今天最佳的QuickTime、Real和Windows Media三种专利Web编解码器的性能。也许在MPEG-4编解码器能支持全套高级简单档次的功能特色时这种情况才会有所改变,MPEG-4编解码器会在互操作性、可扩展性和开放性三方面的优越性超越上述三种专利格式的编解码器取得成就而获得更广泛的应用。

表1 MPEG-4的档次与等级

档次 等级 最大 最大 最高码
分辨率 目标数 率(Kbps)
0 QCIF 1 64
简单档次 1 QCIF 4 64
2 CIF 4 128
3 CIF 4 384
0 QCIF 1 128
1 QCIF 4 128
高级简 2 CIF 4 384
单档次 3 CIF 4 768
4 2CIF 4 3000
5 4CIF 4 8000
简单可定 1 CIF 4 128
标档次 2 CIF 4 256
0 QCIF 1 128
1 QCIF 4 128
精密可定 2 CIF 4 384
标档次 3 CIF 4 768
4 2CIF 4 3000
5 4CIF 4 8000
核心档次 1 QCIF 4 384
2 CIF 16 2000
核心可 1 QCIF 4 768
定标档次 2 CIF 8 1500
3 4CIF 16 4000
1 CIF 16 768
主档次 2 2CIF 32 1500
3 1920×1088 32 4000

表2 MPEG-4编码特色

编解码器 编码速 多处理器 高级简单 对超过352×288
制造厂家 度(秒) 处理能力 档次特色 分辨率输
出的支持
Avipix 87 无 无 能
Dicas 44 无 全部 能
iVast 88 有 B帧 能
Ligos 140 无 无 不能
PacketVideo 62 无 无(有简单 不能
可定标)
Philips 40 有 B帧 不能
Sorenson 69 无 能

表3 MPEG-4兼容性矩阵

Mpegable播 RealOne PVPlayer 3.0 WebCine
放器2.0版 插件 播放器
仅表示头35秒高于 失效时用“Errors :
MP4Creator 兼容 兼容 320×240时有显示错误 file open failed”
信息表示
Mpegable编解码器(高级) 兼容 回放图像干扰少 仅播放第1秒的图像片断 不能播放
Mpegable编解码器(简单) 兼容 兼容 仅播放第1秒的图像片断 不能播放
iVastEncode(高级) 仅表示最后一帧 兼容 不能播放 不能播放
iVastEncode(简单) 仅表示最后一帧 兼容 不能播放 不能播放
GoMotion 兼容 兼容 兼容 兼容
PVAuthor 3.0 兼容 兼容 兼容 不良显示故障,帧序故障
WebCine(高级) 兼容 兼容 仅能每隔二帧播放 兼容
WebCine(简单) 兼容 兼容 兼容 兼容
Media MP4 仅表示最后一帧 兼容 仅表示头35秒,高于 不良显示故障,
320×240有显示错误 帧序故障

转换格式的时候就用它啊

废话看MPEG—1格式时要用到的