MPEG(活动图象专家组)和多媒体通信.译文.
【摘 要】 “数字电视”(DigitalTelevision)今日已是一个现实;但“多媒体通信”经过几年的宣传(hype)仍然是标语口号(catchword),缺乏适合多重(multi-)工业标准的支持是它未能实现承诺的一个理由。创建MPEG-1和MPEG-2标准,使“数字电视”成为现实的MPEG委员会,当前正在开发MPEG-4,并有工业界的广泛参加。本文描述MPEG-4(具有其不依赖于网络的特性以及应用层的很多特征)将如何稳步前进而成为多媒体通信的可实现技术,从而对解决那些阻碍“多媒体通信”发展的问题作出贡献。
【关键词】 数字电视 活动图象专家组 多媒体
1
引 言
在“多媒体”进入技术词汇10年之后,关于“会聚”(convergence)的宣传5年之后,数字视频问世两年半之后,大家仍然在为多媒体通信的实现而奋斗。这种僵持局面的原因是多方面的,下面是其中的几方面原因。
. “会聚”方面的术语并没有适当摆正位置。它并不是指电信业、娱乐业和计算机业务的“各种事业”(businesses)正在逐渐会聚,而是指出节目内容的制作和转换为数据包、信息的传送和处理、以及各种用户设备领域中,由这三个事业领域继承的各种传统障碍(barriers)正在逐渐消失。如果是指节目内容、传送和设备等的工业进行会聚,这是有技术和事业的意义的;如果是指上述三个部门的会聚,那末其意义是不大的。那些传统障碍越早挪开,则多媒体通信将越早实现。
. “数字电视”是一种技术,在应用于传输电视信号时可以更好地利用频带宽度。MPEG-1和MPEG-2当前的应用限于数字电视。嵌入(embedded)在该标准中有助于多媒体通信的少数空地(openings),已经被某个特定工业采用了技术上的全力抢占(all-out hijacking)所阉割(emasculated)。
. 已经出现由下述两方面建立的一个对立物:电信业务经营者们特有的、传统的、低速的、按钮式的、通用的、宽带的、网络的、“业务”(service)驱动模型;以及互联网络(In-ternet)特有的、快速的、有实效的、专用的、窄带的、“应用”(application)驱动的处置方法。信息比特传送的工业已对前者进行投资,但后者看来可以提供前者曾试图支持的很多应用。
通信意味着标准,但对多媒体通信制定标准,受到下述问题的困扰,在其中具有利害关系的很多工业,对待标准化持有根本不同的态度。
对该问题的一个解答是由MPEG提供的,因为它成功地制定了多重工业的MPEG-1和MPEG-2标准,即使已经认识到这个新任务要比前两个标准显著地复杂得多。所讨论的这些MPEG建立之标准化原则,例如,“不是系统而是工具”,“一种功能……一种工具”,“各种工具的可重新定位性(relocatability)”,“规定最低的技术要求”,“演绎的(apriori)标准化过程”,“坚持截止日期(dead-line)”等等(如果在实际中尚未被其他标准化团体采纳的话,至少也成为非常著名的),其正面的含义正在被标准化同行们逐步欣赏。补充了上述各种原则的档次/等级(profile/level)的处置方法,将通用(generic)技术各种规范的需求,与不同工业的特殊应用(application-specific)的需求两者组合起来。
MPEG当前标准化的项目MPEG-4,是将其他MPEG标准的某些典型特征,与来自多媒体的现存之或预期之表现方式的新特征两者组合起来。
. 来自低层(lower-layer)细节的各种应用的独立性,如同在互联网络中;
. 技术上注意到低层的各种特性〔可分级性(scalability),对差错的坚韧性(error robustness),等等〕;
. 应用软件的“可下载性”(download-ability),如同在Java语言和网络计算机中;
. 各种信源编码工具和数据的“可重复使用性”(reusability);. 不仅与一个综合的音频/视频的(audio-visual)数码流具有交互性(interactivity),而且与其中的个别信息片断(pieces)具有交互性,如同国际网络(Web)中的称为“各种音频/视频的(AV)对象(objects)”;
. 与多重信息源同时进行“超链接”(hyperlink)和交互的可能性,如同在国际网络中,但在AV对象的等级(level);
. 能够以综合的(integrated)型式来处置自然的/合成的(synthetic)和实时的(realtime)/非实时的信息;
. 能够根据用户的各种需求组织和表达信息,如同VRML或通常的计算机图形学。
与MPEG-1和MPEG-2的向后兼容性,是由该标准的工具箱(toolkit)特性所保证。
MPEG-4将在1998年11月成为“国际标准”。可以预期:MPEG-4将成为多媒体通信的可实用技术,正如MPEG-2已经成为数字电视的可实用技术完全一样。
下面第2节将试图澄清来自会聚的宣传之基本问题,并且将鉴别来自工业界的哪些部分,在公共的多重工业通信标准之存在条件下,可以是会聚的候选者。第3节则在考虑到不同工业对待标准化的不同态度情况下,对于制定这种公共标准的任务的艰难性进行评价。第4节和第5节将说明:MPEG在制定了多重工业的MPEG-1和MPEG-2标准以后,是唯一有资格进行此项任务的,并将简要概述上述两个标准的技术内容。第6节和第7节将阐明MPEG-1和MPEG-2的应用范围,即数字电视;并将认定一种新标准MPEG-4的需求,以满足来自新的信息交互/消费(interaction/consumption)之各种范例(paradigms)。第8节进入MPEG-4标准的某些技术细节,而第9节则列出一些附加的特征,以便MPEG-4必须避免由某些特定工业对MPEG-2的特殊定制(customisation)而遇到的某些问题。
2
关于多媒体
经过几年的多媒体宣传,目前还没有任何迹象表明:多媒体通信将要如同各种媒体领袖们曾期望的那种方式出现,也即:电信业、娱乐业和计算机业全部都集中采用数字技术而会聚。这种情况并没有出现,这正如几千年来理发师、屠夫和皮匠虽然全都共同使用普通的“小刀”技术,而未曾向某个会聚点挪动仅仅一英寸,是完全一样的。正在出现的是:电影制片厂购买广播公司,电信公司购买有线电视公司,消费电子公司购买电影制片厂,等等。进行这种数字技术的会聚是多余的,因为需要自鸣得意的董事会以及有耐心的股份持有者,都具有肥厚的皮夹子(钱包)。
数字技术有很多优点,但其真正的优越性是能够以一种较为经济而紧凑的方式,复制不同系统的各种分量,正如某个特定领域的技术目前能够做到的。下面是几个例子:
. 乙烯基的盘,包括它的前辈:硬盘和留声机圆筒,已有100多年的历史;但激光唱盘目前已被几亿人民使用。
. 模拟制的语音已有100多年的历史,但A律/μ律的PCM目前已被几十亿人民在网络中使用。
. 模拟制的卫星电视已经运行了20多年,但数字制卫星电视目前已有几百万人民观看。
现在,试图向一个门外汉提问,由他来回答你:模拟制方式与数字制方式之间有何区别!问者并不是“会聚”的一个不信任者,因为“会聚”与“发散”(divergence)一样,都是生活的一部分,但“会聚”肯定不是上面提及的那些“事业”。如果希望有点机会来理解、预报和塑造(shape)(若可能的话)正要发生的是什么,那末首先必须做的是,要承认娱乐业、电信业和计算机业等三个工业并没有提供研究这种现象的正确尺度(dimensions)。
“娱乐业”通常表示一种纵向的事业(例如地面广播),制作信息内容(content)并照管将它们发送直至消费者家庭;“电信业”是另一个纵向事业,横跨所有通信层次;“计算机”是硬件和软件的一种相互纠缠之混合物,是一种在通信系统以及各种用户设备到处使用的基础技术。
更好的坐标轴可由“信息内容”(Content),“传送”(Transport)和“设备”(Equipment)来提供。“信息内容”(消息)关系到支付全部帐单的用户之目的是什么,因而从财力上保证了整个系统的生存;“传送”是发送“信息内容”到需要它们的人们那里;而“设备”(用户设备)是能够使人类用户与系统交互(interact),并将“信息内容”转换为人类可消费的形式。“信息内容”有不同的类型:电影、电视节目、新闻、电话通话以及很多方式,可将信息内容包装为使用户方便消费的形式;“传送”有不同类型:在物理层如无线电信道、电缆、双绞线等,以及正在出台的一些如“中间件”(middleware);而“设备”则有几乎是无穷的种类。
使系统工作中发挥一份作用的这些事业(“工业”),在这三个领域中的一个或几个出现。例如:广播工业综合了信息内容和传送;有线电视(CATV)工业综合了传送和设备;而视频游戏工业则综合了信息内容和设备。
下述以表1给出某些例子(其运行环境可能互不相同)来说明:不同工业(第一列)在其内部综合了信息内容、传送和设备三个分量。
会聚的情况可能形成,即使个人并不认为这些事业将会聚,而且也没有对它的一种迫切需要。但是,各种工业将决定放弃属于他们的事业特有的各种技术,并转换到数字技术的这种情况不会出现;而这种事情他们已进行了很长时间(见上述例子),并同时寻找他们发展事业的合理化途径;而且因为他们决定以下述方式进行转换:一种工业的各种通信标准将与其它工业的各种通信标准兼容。

而审阅了在下节描述的不同工业对待标准化的态度后,该项工作是一项有纪念意义的工作。
3
多媒体和标准化
各种通信需要各种标准,以便定义信息在到达信宿(destination)时,它在信源(source)处给出的意义。从Morse电码以来,各种通信标准变得愈来愈复杂,而在这过程中创建的不同工业具有非常不同的态度。
. “电信工业”建立其各种标准所依据的原始考虑是:从一个电话公司的线路通往另一个电话公司的线路发生阻抗不匹配,不是促进通信(即电话公司的事业)的正确途径,即使是著名的A律/μ律(数字语音)之二叉分支(dichotomy)也能够证明(如果不赞扬其远见性);考虑到在当时(60年代),数字语音仅仅是使网络中的传输能够优化的一种手段,而不是向用户提供的终端至终端的业务的某种东西。
. 电影工业曾设置少数电影格式(for-mats),其中某个由不同的音频/视频(audio/vi-sual)的性能等级所表征。硬件和软件的电影工业都同意:能够在世界任何地方放映电影,对于每个人的事业都是极好的。
.“无线电工业”采用值得赞扬的方法来定义可以到达世界各地的各种标准,但其女儿“电视工业”用下述方式来定义其各种标准,用户们只能收看来自某个固定信源的各种节目。尽管30年代后期在英国曾采用一个405行/50Hz的优良电视系统;在40年代初美国建立其525/60系统,对英国的系统改进了约20%;而几年后欧洲建立其自己的625/50电视系统,并未对NTSC制扩展其带宽(625×25≌525×30)。将彩色信号加入黑白信号,并采用NTSC、PAL、SECAM以及其几乎无法计数的各种变种,使得对电视的“各种国家通道”之数目急剧增长。
. 坐在电视和电信之间的“有线电视工业”,由定义来看,是一种局域性的事业,因而他们对待标准具有精神分裂症似的态度(取决于其运行的国家)。. “消费类电子工业”(主要是记录)已经使用各种标准的定义之最直接应用:一个制造商和一个用户之间的某种自由加入的协议,而去出售/购买某件特定设备;用户们采用该设备可以从所购买的设备类型专用的(“格式”)媒体,重放音频或视频;而该媒体来自同意以那种格式制作信息内容的第三集团(third party)。
. “计算机工业”采取与消费类电子非常相似的态度,但更容易表达清楚。购买一台计算机是一个制造商和一个用户之间自由加入的协议,以提供硬件以及寄于该硬件之上的某种层次之软件,以便能够开发更高层次的应用,或从制造商或一个第三集团购买它们。
. 在“电子游戏工业”中,购买电子游戏是一个制造商和一个用户之间的一种自由加入的协议,用以出售/购买硬件和软件(后者很可能来自第三集团),而该软件只能在该专用的硬件上运行。
由于不同工业已经在发散过程中,而“多媒体通信”必须要求某种会聚地带,并且后者可以通过在各个关键领域内的标准化过程来完成。把每个利益持有者集合在一起,并制定所有人都能接受的通信标准,是一项艰巨的任务,尽管这样,MPEG已经用其第一代的两个标准MPEG-1和MPEG-2(特别是后者,后面将用于表示两者)成功地完成了此项工作。
4
MPEG对标准化的处置方法
有了MPEG-2,MPEG已制定了公共的音频/视频编码之各种标准,它们可以被第3节提到的所有工业界所采用。这就使得费用的分担(sharing)、数字音频/视频技术发展的加速进行、以及对于用户们更为基本的是,不受已构成的各种技术障碍的信息内容之流动,才成为可能。如果会聚出现的话,它将是由于所有工业界都愿意接受这类单一的信息表达方法,可以由所有工业所共享的。
现在值得回顾一下MPEG在其8年的运行中所采用的方法,并试图合理地说明为什么MPEG已成为标准化的一个成功处置方法,以服务于多重工业对于通用的多媒体通信情况的各种需求。
4.1
坚持最后期限(deadline)
一个事业如果其工作是每日更新的,那末它是无法生存的。不幸的是,这正是某些标准化委员会的实际情况。他们负责制定某些东西(这些东西本身就是松散定义的),而没有规定一个日期来发布一个输出(标准),或仅有一个作为参考的日期。这正如某个公司向其用户们许诺在某时要交付什么东西。
各种标准都是商品(goods)一样,由各个委员会向其用户们出售的。对于一个公司而言,商品当然必须是高质量的,必须是符合用户们提出的技术要求的,而且首要的是,它们必须在约定的日期交付的。
标准不是小说,标准是技术,使各个公司能够制造产品(卖给最终用户们的那些)。如果某个公司制定一个计划,将某种确定产品(需要某种确定技术)在某个确定日期推向市场,并且对此事进行必要的投资,那末如果标准化委员会(面对公司的供货者)在约定的日期报告:他们已“落后于日程表”,该公司(面对标准化委员会的买方)是不会高兴的。
MPEG有一个严格的工作计划,对一个标准的所有部分规定何时达到“工作草案”(Working Draft)、“委员会草案”(Committee Draft)、“国际标准草案”(Draft International Standards)以及“国际标准”(International Standards)等的不同层次,迄今为止曾偶然在“中间”阶段出现过次要的挪动,但与计划的日期相比,在到达“国际标准”的状态没有延迟。
4.2
演绎的(a-priori)标准化过程
每个人都会同意,各种标准应该由标准化团体来颁布,而后者存在的目的就是制定标准,然而,很多标准化委员会无能力按时交付标准,以迫使很多公司采取走捷径的办法,所谓“各种工业标准”。这些专用的技术规定(很可能由一些其他公司一起签署)通常提交到一个标准化委员会,以获得批准认可。
这种处置方法的主要问题是,各个标准化委员会逐渐变成不再是讨论技术问题(也即某种技术的定义)的场所,而变成讨论商业问题的场所。所讨论的问题不再是瞄准那些拟定一个优秀的标准,而是一些有利于私利的术语之定义,各个公司当前计划的技术适应性等。当然,在各个公司之间讨论技术问题是没有任何错误的,但是如果在一个标准化委员会中也是这样做,那就是错误的。MPEG与此不同而采取非常明确的态度:
. 在各个工业界拟定商业约定之前,先论证某种技术已成熟到可以制定标准;
. 通常要拟定一个“征求建议”,而感兴趣的各个公司都可以自由地响应;
. 在所有情况下,各种技术都由MPEG专家们进行标准化。
MPEG迄今为止已成功地应用了这些原则。由于不断地令人满意地论证了一些标准化项目,因而可以宣布:MPEG标准没有签署为某个“工业标准”。但头脑里必须有一个概念:MPEG标准并没有对完整的系统做技术规定。因此,在制造完整的各种产品时,伴随着MPEG标准,很可能还需要“各种工业标准”。
4.3
不是系统而是各种工具(tools)
上面介绍的可以应用于一般的标准化过程的各种原则,当他们应用于拟定各种服务于多重工业之标准时,还需要有进一步的独创性。
工业界根据定义需要拟定一些纵向综合的技术规定,以便制造出能够满足某种需求的各种产品。音频/视频的解码过程可以是一小部分能够与其他团体分享的技术,但是当工业界需要出售一台卫星接收机或一台数字激光视盘(VideoCD)放象机时,这些设备需要一个综合的标准。然而,如果不同的工业界需要同一的标准时,它们在头脑中很可能会有不同的终端系统。因此,只有某个标准的各个分量,如在MPEG中称之为“工具”时,才能以共同的努力而作技术规定。
这个原则的实施要求把各种标准的特性由“系统”的各种标准改变为“分量”的各种标准。工业界可以从标准化团体收集各种工具的技术规定,并构造它们自己的产品技术规定。
既然“各种工具”是标准化过程的对象,就必须设计一个新的步骤来拟定有意义的标准。已经找到下述顺序的步