MPEGは新しいメディア・テクノロジーに対処できるか?
Leonardo Chiariglione, CEDEO.net
(MPEG) ISO/IEC JTC1/SC29/WG11議長
摘要
本書は、ほぼ20年にわたるMPEGの経緯を調べ、作成された規格によって示された業界の動向を明らかにして、現状を分析したものである。
1. 序
Moving Pictures Experts Group(MPEG)は、正式には、国際標準化機構(ISO)および国際電気標準会議(IEC)の第1合同技術委員会(JTC1)「情報技術」、専門部会29(SC29)「音声、映像、マルチメディアおよびハイパーメディア情報のコーディング」の作業部会(WG11)11「動画像と音声の符号化」を指している。
一般に作業部会は、具体的な技術的問題に対処するために専門部会が設立する。そして当該の問題が解決されると、通常その作業部会は解散される。
しかしMPEGの場合は違った。当時、専門部会2の作業部会8の専門家グループとして発足したMPEGは、次のような要旨のビジョンによって推進された:
競争的環境における規格は、形式的に承認されたもの、もしくは予期的なもののいずれかである。MPEGは、従来の家電産業の伝統に反して後者を選択した。成功するのは、テクノロジーと市場の展開を慎重に計画したうえで生まれた規格である。
大衆現象のイネイブラーとしての規格。多くの人々は、規格とはビジネスを可能にするための些少な事項だと考えている。人々――何百万人もの人々――が、以前はできなかったことが今ならできるということを認識するための大衆現象のイネイブラーとして、規格をとらえる方が生産的である。
デジタル技術の収束力。アナログ技術は、物理的な要素――それがテープであれ、ネットワークであれ――の制約の範囲内で、あるいはこうした物理的要素と共存しながら、音声/画像システムを構築するための努力の結果生まれたものである。だがデジタル技術は、物理的なシステムとのインターフェース――デジタル技術の「集束性」の中核ともいえるもの――がなくても、それ自体で音声/画像コンテンツを処理することができる。
規格の価値は、その規格によって可能となるものだけに存在するわけではない。多くの技術がデジタル規格を作成するよう要求されているため、関連するすべてのビジネスのイネイブラーとしての旧来の規格モデルは、規格のIPに価値を見出している人々についても考慮しておく必要がある。
規格では、研究開発への投資に報いるための手段を定めなければならない。規格をベースにした活気あふれるマルチメディア産業は、規格の一部となるテクノロジーに投資した人々に報いるための手段を提供する必要がある。
規格の開発にともなう予期せぬ結果。大衆現象に関しては、最終的に規格がどのように利用されるのか、正確に予想することは困難である。つまり、特定の用途のために規格を考案することに危険をともなうことが多い。その用途が必ずしも市場の要求に適合していない可能性があるからである。
汎用アプローチの結果としてのプロファイル。デジタル技術では、ビデオ・フレームのサイズがパラメータになることが多い。だが実際に有効な規格を作成するには、具体的な価値、すなわちプロファイルが必要となる。
デジタル規格をソフトウェアで表すこと。すべてがビットで表現されている場合には、ビット単位で履行される業務はコンピュータ・コードで表す方が効果的である。
水平的市場のイネイブラーとしての適合性試験。これはMPEGが継承し、改良を加えてきた従来のアプローチである。
規格が提供するものの価値を評価する。規格は、とくに数多く存在する場合には、その性能(業績)によって最も的確に実証される(MPEGでは「立証試験」とされているもの)。
2. 基本的な要素
2.1 MPEG-1
この規格は、デジタル技術がもたらす影響がまだ不明瞭な初期段階で考案されたものである。実際MPEG-1によって、「双方向性(interactivity)」という魔法の言葉とともにオーディオ/ビデオ(音声/画像)データに対処するための技術が初めて可能となった。
当時は、デジタル・オーディオ/ビデオを含んだデータは、必ずハードウェア――集積回路(IC)――実装の問題に直面にした。このためすべての決定は、ICの設計に及ぶと考えられる影響を考慮して検討された。
MPEG-1オーディオでは、プロファイルが定められていた――MPEG-1オーディオの3つのレイヤは、3つの階層的なプロファイルの例であった。
MPEG-1ビデオでは、レベルが定められていた――MPEG-1ビデオのConstrained Parameter Setは、実際の用途のすべてについてレベルを定めていた。
参照ソフトウェアはすでに利用可能であった。おそらく、ISO/IEC規格に添付されたソフトウェアとして最初の例であった。
コンフォーマンスもすでに確保されており、参照ソフトウェアを利用してビデオ/オーディオ・ビットストリームが作成されていた。
オーディオに関しては立証試験が実施されており、384kbits/s(レイヤ1)、256kbits/s(レイヤ2)および192kbits/s(レイヤ3)で符号化されたステレオ音響の透明性については予想通りの結果が得られていた。
MPEG-1にとっての最も深刻な問題は、規格にもとづいたデジタル技術の実際の用途であった。MPEG-1オーディオ・レイヤ1を利用するために設計されたデジタル・コンパクト・カセット(DCC)は失敗作、MPEG-1オーディオ・レイヤ2を利用するために設計されたデジタル・オーディオ・ブロードキャスティング(DAB)はいまだに成功を見ず、MPEG-1技術一式を活用しようと開発されたコンパクト・ディスク・インタラクティブ(対話型コンパクト・ディスク=CD-i)も市場から撤退して久しい。
それでもMPEG-1そのものは健在である:ビデオCDではMPEG-1技術一式が、またMP3ではMPEG-1オーディオ・レイヤ3が利用されている。どちらも、今さら紹介するまでもない。
2.2. MPEG-2
ハードウェアが作動することが実証され、テレビをデジタル化するという長年の夢を実現することも可能となった。MPEG技術により、真の意味で普遍的なデジタル・ビデオ・フォーマットが定義された(よく知られているように、オーディオは、真の意味で普遍的なデジタル・テレビジョン・フォーマットには含まれていない)。
MPEG-2ビデオの開発には、つねにハードウェア実装という問題がつきまとった。1990年代初め、MPEG-1ビデオ・チップの設計は可能となったが、MPEG-2のチップは別問題だった。ハードウェア上の問題は、信号処理に関してだけでなく、解読された画像を保存するために必要なランダム・アクセス・メモリー(RAM)についても存在した。RAMの使用量を抑えるための特別なプロファイル(Simple)も開発されたが、ある程度の画質の低下は避けられなかった。
パテント(特許権)の重要性が高まると、これに関連した問題も浮上した。家庭用電化製品(CE)産業は、各々の規格において、独自の方法でパテントの問題に対処していた。ヒット製品の知的所有権は、最初にその製品を考案した企業に帰属するが、MPEGに関しては、MPEG-2ビデオの知的所有権を有する企業はごくわずかだった。長い年月が経過した後、パテント・プール管理者がMPEG-2規格の実施に関連していると判断した100件以上のパテントを処理するための最初のパテント・プールが形成された。ロイヤルティ・モデルは、既存のCE産業の慣行にしたがって定められた。MPEG-2ビデオで符号化されたコンテンツを含む装置およびデジタル多用途ディスク(DVD)一点ごとに、一定の金額が定められたのである。
2.3. MPEG-4
MPEG-4は、マルチメディア統一符号化規格として考案された。実際MPEG-4ビデオは、ビットレートおよびビデオ・フォーマットのすべてをカバーするように設計されており、MPEG-4オーディオは音楽と音声の両方を処理することが可能である。
またMPEG-4は、2D/3Dグラフィック、人間の顔や身体、電子音楽など合成コンテンツも処理することができる。さらに、未加工の情報と合成情報を組み合わせたデータを処理するための強力な技術も備えている。
MPEG-4は、とくにビジュアル部分で幅広く拡張され、プロファイルも豊富である。アドバンスト・オーディオ・コーディング(AAC)の基本技術は、MPEG-4で継承・拡張され、数々の拡張子が存在する。
MPEG-4のトランスポートに関しては、MPEGコンテンツのトランスポート・メカニズムは開発されておらず、汎用インターフェースのみが存在する。ただし、汎用コンテンツのためのリアルタイム・プロトコル(RTP)のペイロードは開発し――無数の変遷を経た後にインターネット・エンジニアリング・タスク・フォース(IETF)から採択されている。
MPEG-4は、いくつかの点で革新的である。第一に、MPEG-4は、知的所有権の管理と保護(IPMP)システムを通じて知的所有権を完全に管理するための最初の例を提示した。
MPEG-4が実現した第二の革新は、ハードウェアをベースにした従来のオーディオ・ビジュアル産業と、ソフトウェアをベースにした新たなオーディオ・ビジュアル産業の集束であった。これにより、参照ソフトウェアは、なくても構わない単なる付加物から、テキスト形式にも劣らない正式なステータスの規格へと変貌した。またこの参照ソフトウェアの発展は、オープン・ソースの伝統にしたがって――独立したかたちで――符号化された。
MPEG-4による第三の革新は、パテントのライセンス供与であった。MPEG-2ビデオのライセンス供与は、セット・トップ・ボックス(STB)やDVDディスクなど、物理的な実体をベースにしているが、MPEG-4ビジュアルのライセンス供与形態では、単位時間当たりのコンテンツ利用料が請求される。
3. 新天地
3.1. MPEG-7
MPEG-1/-2/-4規格は、現在のようなデジタル・オーディオ/ビデオ産業を形作る過程でそれぞれの役割を果たしてきた。MPEG-7は、この産業を更に実質的なかたちに作り変えるための潜在力を秘めている。
コンテンツも重要だが、そのコンテンツが発見され、組織化されるためには、そのコンテンツの記述が更に重要である、というのが当然の注目点――私たちが検索エンジンを使ってweb上の情報を探すときの類語反復――である。
MPEG-7を考案するきっかけとなったのは、オーディオ/ビデオ符号化の標準形式がコンテンツの水平的市場を生み出したのであれば、オーディオ/ビデオによる記述の標準形式は記述の水平的市場を生み出すはずである、という認識であった。
必要な規格技術は、すべて開発されている。ビジュアルによる記述も、オーディオ、マルチメディアによる記述も存在する。MPEG-7記述定義言語(DDL)を利用してマルチメディア・コンテンツ記述スキーム(MDS)を定義することも可能である。
MPEG-7というビジョンには、まだ改善の余地がある。デジタル技術は、「無料の」コンテンツからは価値を排除してきたためである。今なお高い評価を得ている有料コンテンツは、デジタル権利管理(DRM)技術を用いた専有パッケージとして提供されている。
水平的市場は、まだ正確には実現されたとは言えない。相互運用可能なDRM(iDRM)ソリューションが本業界で幅広く採択されないかぎり、こうした状況は続くであろう。相互運用可能なDRMは、コンテンツがその価値を保持し、企業が各自の提供サービスにより多くの機能を付加するよう促す奨励材料となるための唯一の手段なのである。
3.2. MPEG-21
MPRG-7がオーディオ/ビデオ符号化規格ではないのと同様、MPEG-21も「信号処理」のための規格ではない。MPEG-21に対するニーズは、圧縮と記述は「マルチメディア」にとって重要な二要素ではあるが、コンテンツを自律的に取引できるような完全なマルチメディア市場を可能にするには更に多くの異種技術を統合する必要がある、という認識によって誘発されている。こうした目標を実現するには、次のような数々の新技術が必要である:
取引の対象となる1つ、もしくは2つ以上のリソースに関するすべてのデータを系統的にまとめるための技術。このようにまとめられたデータは、MPEGではデジタル・アイテムと呼ばれている。
デジタル・アイテムが作成されたら、それを識別するための手段が必要となる。
デジタル環境では、通常デジタル・アイテムは、取引に対する「無償サービス」ではなく、ユーザーに対して特定のアクションを実行するための許可が付与される。この許可を記述するためのテクノロジーが求められている。
アクションの意味は、人間には理解され、承認されるだろうが、機械は別物である。許可で使用される動詞の意味を定義する必要がある。
デジタル・アイテムのリソースを利用するには、必要なDRMツールを記述しなくてはならない。
デジタル・アイテムのリソースに対して特定のアクションを実行するには(二段抽出、拡張可能なビデオ・ストリームの層からの抽出など)、デジタル・アイテムのリソースに働きかけるのに必要なツールの特徴を記述しなくてはならない。
デジタル・アイテムは、ファイルもしくはストリームを通じて移動しなくてはならないことがある。
その他
4. 新たな展望
4.1. MPEG-A
MPEGが開発されてから19年が経過した現在、MPEGおよび他の起源に由来するマルチメディア技術は数多く存在するが、有益なマルチメディア・アプリケーションの難しさは変わらない――選択肢が多すぎるためである。
一方MPEGには、豊富なマルチメディア・ツールがあり、アプリケーションを可能にする技術の組み合わせを適宜定義するためのノウハウも備わっている。
これがMPEG-A(AはアプリケーションのA)規格の論理的根拠である。この規格に関しては、以下が開発されている、もしくは進行中である。
ミュージック・プレイヤー:MP3形式の音楽およびMPEG-7にもとづくID3メタデータのためのファイル・フォーマット。非保護バージョンは完成しており、音楽を対象とした保護バージョンは開発中である。・フォト・プレイヤー:JPEG画像およびMPEG-7ビジュアル・メタデータのためのファイル・フォーマット。フォト・アルバムの自動編成に使用。・音楽スライド・ショー・プレイヤー:スライドを同期時表示するためのファイル・フォーマット。ミュージック・プレイヤーとフォト・プレイヤーのスーパーセット(上位機能)である。
メディア・ストリーミング・プレイヤー:ストリーミング・コンテンツを制御するためのフォーマット(大半はMPEG-21からの転用)とプロトコルのセット。
オーディオ・アーカイバル:高分解能オーディオ・データを保存するためのフォーマット。
4.2. MPEG-E
MPEGマルチメディア・ミドルウェア(M3W)は、符号化や信号処理を目的とせず、マルチメディア志向の強いもう一つの規格である。
この規格は、最終的には以下の部分から構成される予定である。
アーキテクチャ
マルチメディアAPI
コンポーネント・モデル
リソースおよび品質管理
コンポーネント・ダウンロード
故障管理
システム保全管理
M3W APIは、プラットフォームで必要な機能を大幅に重複しながらも、互いに差異のある多様な能力を備えた複数の製品で使用するのに適した、汎用APIを目指して設計されている。
5. 現況
MPEGは、開発されてから20年近くが経過しており、その作業分野に関して次の評価が可能である。
より効率的なオーディオ/ビデオ圧縮に対するニーズが継続的に存在している。アドバンスト・ビデオ・コーディング(AVC)は、2倍の圧縮を可能にしており、複雑さが増したにもかかわらずいくつかのアプリケーション分野でこの新規格が採用されている。AACが高性能アドバンスト・オーディオ・コーディング(HE-AAC)によって繰り返し拡張されているオーディオ分野でも、状況は同じである。
ビデオ/オーディオ圧縮技術のアプリケーションが次々に出現している。モノラル/ステレオ符号化信号に対し、ごく低予算でマルチチャンネル情報を付加するためのMPEGサラウンド技術は、数々のデジタル・オーディオ・アプリケーション分野を刷新すると予想されている。スケーラブル符号化(SVC)方式も、スケーラビリティ機能の充実により、ようやく実現している。多視点映像符号化(MVC)は、映像情報から3D空間を作成し、ナビゲートするための第一歩である。
ビデオ/オーディオ・コーデックの定義における新たな柔軟性。これまでは、オーディオ/ビデオの新たなコーデックでは、いずれもビデオ/オーディオ符号化ツールが厳密に組み合わされていた。この形態は今後も続くだろうが、いずれは現在開発中のReconfigurable Video Coding(RVC)規格を通じて、既存のビデオ符号化ツールを利用した新たなビデオ・コーデックを採用し、既存のツールに対して明確な進歩をもたらすような新ツールを付加することも可能になるだろう。
マルチメディア技術の統合の場としてMPEGは存続してゆく。MPEG-4規格は、現在も成長を続けている。また最新のオーディオ/ビデオ符号化ツールだけでなく、最近のオープン・フォント・フォーマットなど、完全なマルチメディア体験を実現するのに必要な他の多種技術も収集している。
システム/ビデオ/オーディオの規格統合の時代は終わった。MPEG-1/-2/-4は、システム、ビデオおよびオーディオの符号化技術をまとめたパッケージであるが、業界の成熟度と複雑さによってこうした統合的アプローチを正当化できなくなってきている。MPEG-B、-C、-Dが、必要に応じて、MPEGがたとえば次のような技術を追加する場合に対処するために導入されている:
MPEGが利用するXML構造のためのバイナリ・フォーマット
Fragment Request Unit
DCT/IDCTの固定小数点実施(fixed point implementation)
補助映像データ表現
MPEGサラウンド
デジタル信号処理(DSP)に関する更なる情報技術。MPEGはDSP規格グループの一つとしてスタートしたが、ITとの共同請願は早い時期から、すなわちスードCコードを利用して規格の作業を表現していた時期から始まっていた。MPEGの起源がDSPにあることに疑いはないが、ITの役割は増大している。
MPEG技術をライセンス供与する際の柔軟性の拡大。IPをライセンス供与する際の形態は大幅に進化してきたが、20年が経過した現在、一部の技術はもはやライセンス供与が不可能である。規格の中でIPRの価値を維持するための方法を考案し、成熟した産業の競争は内部から発生するという点を認識する必要がある。
6. 結論
開発当初から今日までの20年近くにわたり、MPEGは、当時(20年前)のオーディオ/ビデオ産業をデジタル化し、現在のように収束された新しいデジタル・オーディオ/ビデオ産業を作り上げるための過程に貢献してきた。
この間、数々の変化が見られたが、この業界はいまだに安定からはほど遠い状態にある。技術が進歩するとともに、規格に対するニーズも存続してゆく。
MPEGは、当初ビジョンを固持し、開発された多大な技術資産を頼りに、制約の少ない環境で新たな規格を考案することで、今後も業界の標準化に対するニーズを先取りしてゆくであろう。